讀書日
內容連載 頁數 2/8

做二五、五五○次實驗,是很明顯的障礙。即使如紐曼建議的,傑可伯願意接受「不確定為必然」的結果,容許抽石子推論的結果,只有一半機會落在實際值三比二的二%誤差範圍內,也仍然需要抽籤八千四百次。照今天的標準來看,傑可伯選擇的1000/1001機率,它本身就很奇怪,大多數現代統計學家都認為,二十分之一的成功機率就足以證明一種結果有意義(即「幾乎可確定為必然」的現代說法)。
 
棣美弗解決這些難題的貢獻,可列入數學史上最重要的成就。他應用微積分和「巴斯卡三角形」潛在的結構,即通稱的「二項展開式」(binomial theorem)證明任一組隨機抽樣,例如傑可伯的黑白石子罐實驗,能自動在一定誤差的範圍內,分布在平均值周圍。舉個例子,假設你從傑可伯的罐子裡抽出一百顆小石頭,每次抽完都記錄黑白的比例,並把石頭都放回去。然後假設你又每次抽一百顆石頭,一連抽了若干次。棣美弗就都能事先告訴你,抽出的各次比例之中,大約有多少次會與前一梯次抽籤算出的平均值非常接近,還有各次得出的比例相對於總平均值的線形分布情形。
 
如今我們把棣美弗發現的分布曲線稱為「常態曲線」,也因為它形狀像個鐘而稱作「鐘形曲線」(bell curve)。將各次分布點畫成曲線就可以看出,大部分的觀察值集中於中央,接近總平均值。然後曲線對稱的向兩旁下傾,總平均值兩側有相等的觀察次數,先是急遽下降,然後依平緩的坡度下斜而結束。換言之,跟平均值差距大的觀察次數,遠比接近平均值的觀察次數少。
 
棣美弗曲線的形狀,使他能夠計算它在平均值周圍的統計學離差(dispersion)。算出的數值現在稱為「標準差」(standard deviation),是判斷任一組觀察值可否視為足以代表其所屬範域(universe)之樣本的決定性因素。在常態分配下,約有六八%的觀察值會落在全部觀察之平均值的一個標準差之內,九五%會落在平均值的兩個標準差之內。
 
標準差可以告訴我們,目前處理的個案是否有頭在烤箱,而腳在冰箱的傾向──這個可憐人的平均體溫不能告訴我們他真正的感覺。大部分的數據都跟他身體中段的平均感覺相去甚遠。標準差可以告訴我們,傑可伯抽取鵝卵石二五、五五○次,可得到對於罐內黑石與白石之比、極為接近正確數字的估計。因為相對而言,只有極少數的觀察結果會大幅偏離平均值。
8上一頁 1 2 3 4 5 6 7 8 下一頁 跳到