總計3 頁,第2 頁 回上頁內容連載0102 03數量太大,就預測平均值吧 〔朋子〕我們家在鄉下有一小塊田哩。 〔莉子〕哇∼那朋子家有種什麼東西嗎? 〔朋子〕有哇,不過因為只有100坪,所以是全部用人工耕種。前陣子稻米收成,我把每10株稻子(約有25根稻穗)綁在一起曬乾時,突然好奇一根稻穗會結幾粒米,所以就數了一下。 〔莉子〕那很多耶!妳不累嗎? 〔朋子〕我只數了兩根,就快累死了。 〔莉子〕那結果有幾粒米呢? 〔朋子〕分別是76粒米和85粒米。我又好奇如果把收成的稻子全數過一遍,不知平均每根稻穗會結幾粒米? 〔老師〕就算只數了兩根稻穗,也很辛苦。本來我們應該算出田裡所有收成的稻穗,再來求取平均值,但這實在太花時間跟人力了。因此,統計學上有一種方法,是先調查部分數值,再依此推測全部的概略值,稱為母體平均數的估計。調查目標的整體稱為母體,而實際調查的部分母體則稱為樣本。 〔莉子〕預測也是常出錯呢。 〔老師〕是啊。正因為是預測,所以準確度不可能達到百分之百,通常都是用95%的準確度進行預測。再嚴謹一點,會以99%進行預測。換句話說,準確度95%,表示有5%的出錯機率,準確度99%,表示有1%的出錯機率。 我們先假設朋子非常努力、數了100根稻穗後,得知平均每根稻穗所結的米粒是80粒。但這充其量只能當作樣本數值,不能作為母體數值,說每根稻穗平均有80顆米粒。雖然母體的米粒數可由樣本推測出來,卻很難用一個確定的數字來表示,只能以「(○-△)∼(○+△)之間」的範圍來表示。這個△叫做樣本誤差,推測的範圍就稱為信賴區間。樣本誤差△可以計算出來,但在這裡,我們先假設樣本的平均值是80粒米,樣本誤差△是15粒米,那麼就可以說:母體(每根稻穗上頭米粒)的平均值將在(80-15)粒∼(80+15)粒米之間,也就是說,信賴區間在65粒∼95粒米之間。 可是這種估計方法,至少需要100根稻穗的數據才算精確推估,而朋子只數了2根,所以無法依此推估母體的平均值。我將以下面的例子說明母體平均數的估計方法,也請莉子幫忙算一下30根稻穗的米粒數。 |
||||