序
過去百科全書對於統計學的界定是一門收集、分析、解釋、呈現與組織資料的學問。而現在更強調她是一門從資料中學習模式的科學,包含著資料測量、模型界定與不確定性溝通等。如果在未來十年內,生活中什麼是最需要具備或擁有的技術或知識?無疑地,統計學是當中之一,而且是扮演著重要角色,過去是如此,未來更是如此。
我們先來解讀一個數字。報載「今年童玩節熱度減退,入園人數近34萬人次,再兩天就要閉幕,想突破去年38萬人次似乎不容易,預期創下近年的新低」。報載統計數字固然令人沮喪,但進一步查閱主辦單位資料顯示,今年天數減為44天,比去年少8天,顯然地,數字背後可有不同的解釋。這傳達著統計思考可以是一個解開數字的密碼。
許多人有在網站購物或買書的經驗,當瀏覽某件有興趣的商品時,網頁常會列出「買了此商品的人,也買了……」的建議購買品項,這就是所謂購物籃分析。這是透過大量的瀏覽資料收集,以簡單的機率概念(不確定性)建立品項的關聯性,試圖提供更有效率的購物訊息,促進或影響消費行為。在其他地方我們也可以看到類似應用,如在超商行銷的分析中,或可能發現購買尿布的男人也常會購買啤酒;如在社群網站中,後臺透過網路資料的收集與資料分析,可以建立使用者的習慣行為模型,協助網站提供更貼近使用者的介面與內容或關鍵趨勢分析。
再者,金融機構放款部門統計分析往來的申貸客戶相關資料,除了製作相關統計報表彰顯經營現況外,更可以依過去的申貸資料,如性別、職業、婚姻及存款餘額等,建立預測模式來對客戶是否違約做預先判定,推測客戶在其申貸條件下貸款違約的機會。這些例子都說明著統計學如何應用在日常生活中,而資料、數字是統計學的基礎,而背後真相的揭露是統計方法的應用。
近年來,學科的整合走向跨領域的發展。大數據、巨量資料、資料科學幾乎成為潮流的關鍵字眼,無論在哪一個名詞下,統計學的基礎知識到延伸的應用方法都扮演著重要的基石。沒有統計圖表的視覺表現,便無法將資料化繁為簡;沒有統計量的推估知識,無法將資料分析科學化;而沒有資料模型的概念,將無法進一步對巨量的資料做預測模式或演算。
很高興本書做第二次的改版,如同基礎統計學名字一般,我們以拓展基礎統計知識為出發點,儘量朝精簡的方向做修正。雖然精簡,但我們鼓勵並希望初學者,能體驗出數字或資料背後所隱藏的密碼,解開真相。無論未來是否走向資料科學領域,逐步踏實學習,相信已踏在堅固盤石之上。最後,我們萬分感謝三民書局所有協助完成此次改版的工作夥伴們,沒有你們是無法順利完成的,謝謝你們。
呂岡玶 楊佑傑
2016年8月