內容連載
頁數 1/1
1-1-1 單變量vs. 多變量統計
1. 單變量分布(Univariate):若我們指關心母體的某項特性﹐如產品之抗拉強度、個人滿意度⋯⋯﹐則此母體分布稱為單變量分布。
2. 雙變量分布(Bivariate):若我們關心母體的兩項特性﹐如產品的抗拉強度與重量的關係、個人滿意度與離職意願的因果關係⋯⋯﹐則此母體分布稱為雙變量分布。
3. 多變量分布(MultiVariate):若我們關心母體兩項以上的特性﹐如「產品的抗拉強度、重量與抗壓強度」、「個人滿意度、組識承諾與離職意願的因果關係」,則此母體分布稱為多變量分布。
一、醫學統計經常混淆的名詞
在應用統計分析作學術研究的各個領域中,醫學領域可說是其中的非常大宗,據統計目前全世界約有3 萬種的醫學期刊,約占了科技期刊的四分之一之多。而在這塊這麼大的市場中,我觀察到在醫學領域所使用的統計名詞,經常與統計教科書有相當多的出入,本篇文章擬將這些常見的混淆之處作個釐清。
1. 單變量或多變數迴歸分析
假使我們現在要進行依變數(dependent variable) 的預測,如果我們的自變數(independent variable) 只有一個,那麼這種迴歸模式稱之為簡單迴歸(Simpleregression) ,不過在醫學期刊常見以單變量迴歸(Univariate regression) 來表達;倘若我們的自變數是2 個以上,那麼我們稱之為多元迴歸(Multiple regression),但在醫學期刊則部分稱之為多變數迴歸(Multivariable regression) 或多變量迴歸(Multivariate regression)。特別值得說明的是,「多變量」(Multivariate) 在一般統計教科書是專門指同時有2個以上的依變數的統計方法,例如主成分分析、因素分析、集群分析、結構方程模式、典型相關等;但在醫學領域中,不管依變數有多少個,只要自變數2個以上,就會稱之為多變量分析( 比較正確來說應該是多變數分析) ,這是蠻特別的一點。
2. 自變數、依變數或控制變數
統計教科書皆把依變數定義為dependent variable ,不過實際醫學期刊比較常見以結果變數(outcome) 來稱呼之;如果我們的模式有許多個(2 個以上) 自變數,而所關注的是其中一個變數,那麼此時其他變數便稱作控制變數(Control variable) ,但在醫學期刊的習慣來說,並非主要研究變數的控制變數都叫做共變量(Covariate)。