博客來-風險之書：看人類如何探索、衡量，進而戰勝風險>內容連載

風險之書：看人類如何探索、衡量，進而戰勝風險

Against the Gods: The Remarkable Story of Risk

作者：彼得．伯恩斯坦
出版日期：2019/04/18

內容連載 頁數 2/8

做二五、五五○次實驗，是很明顯的障礙。即使如紐曼建議的，傑可伯願意接受「不確定為必然」的結果，容許抽石子推論的結果，只有一半機會落在實際值三比二的二％誤差範圍內，也仍然需要抽籤八千四百次。照今天的標準來看，傑可伯選擇的1000/1001機率，它本身就很奇怪，大多數現代統計學家都認為，二十分之一的成功機率就足以證明一種結果有意義（即「幾乎可確定為必然」的現代說法）。

棣美弗解決這些難題的貢獻，可列入數學史上最重要的成就。他應用微積分和「巴斯卡三角形」潛在的結構，即通稱的「二項展開式」（binomial theorem）證明任一組隨機抽樣，例如傑可伯的黑白石子罐實驗，能自動在一定誤差的範圍內，分布在平均值周圍。舉個例子，假設你從傑可伯的罐子裡抽出一百顆小石頭，每次抽完都記錄黑白的比例，並把石頭都放回去。然後假設你又每次抽一百顆石頭，一連抽了若干次。棣美弗就都能事先告訴你，抽出的各次比例之中，大約有多少次會與前一梯次抽籤算出的平均值非常接近，還有各次得出的比例相對於總平均值的線形分布情形。

如今我們把棣美弗發現的分布曲線稱為「常態曲線」，也因為它形狀像個鐘而稱作「鐘形曲線」（bell curve）。將各次分布點畫成曲線就可以看出，大部分的觀察值集中於中央，接近總平均值。然後曲線對稱的向兩旁下傾，總平均值兩側有相等的觀察次數，先是急遽下降，然後依平緩的坡度下斜而結束。換言之，跟平均值差距大的觀察次數，遠比接近平均值的觀察次數少。

棣美弗曲線的形狀，使他能夠計算它在平均值周圍的統計學離差（dispersion）。算出的數值現在稱為「標準差」（standard deviation），是判斷任一組觀察值可否視為足以代表其所屬範域（universe）之樣本的決定性因素。在常態分配下，約有六八％的觀察值會落在全部觀察之平均值的一個標準差之內，九五％會落在平均值的兩個標準差之內。

標準差可以告訴我們，目前處理的個案是否有頭在烤箱，而腳在冰箱的傾向──這個可憐人的平均體溫不能告訴我們他真正的感覺。大部分的數據都跟他身體中段的平均感覺相去甚遠。標準差可以告訴我們，傑可伯抽取鵝卵石二五、五五○次，可得到對於罐內黑石與白石之比、極為接近正確數字的估計。因為相對而言，只有極少數的觀察結果會大幅偏離平均值。