經典翻譯文學展
內容連載 頁數 1/1
二、有限混合模型(finite mixture model,fmm)簡介

有限混合模型(finite mixture model,fmm)為一種混合分布的機率模型,其假定原始實測資料(field observation)係自眾多但有限的未知分布而來,而FMM模型的EM演算法可自行分類(class/component),以減少模型因存在不同異質體(heterogeneity subpopulations)而導致偏誤的估計結果。FMM模型假設在未知的K個體下,彼此間關係式為:

其中, 為混合機率密度(mixture density)的機率函數,經由k個加權比例 ,與其組內機率 所得的機率加權總合。此種機率函數因存在「有限個」加權機率,所以又稱有限混合機率分布(finite mixture)函數。其中, 為各組的加權比例(weight),它被限制(約束)為正值且總和為1( )。公式中 通常包括:常態分布、Logit分布、Poisson分布…等。假設你指定樣本符合Gumbel分布,則其模型可化身為選擇模型(作者另一本書),包括:多項logit回歸(mlogit指令、及asmprobit、fmlogit、bayes: mlogit、mprobit、clogit、asclogit、ologit、logit、xtologit、zip等指令)。其中,多項logit模型隱含可觀測的選擇行為,在不同群有不同的分布比例,若依據比例大小來分類,同群內視為同質(homegeneous),而不同群之間為異質(heterogeneous)。由於選擇機率的發生係受回歸係數β所影響,此使得任一影響屬性會因屬於不同群,而在不同群產生不同的邊際影響係數。

在應用方面,行銷、運輸、社會科學等領域,迄今已有眾多研究以FMM模型或潛在類別模型「latent class model, LCM;類別資料+因素分析的合體)」來進行市場區隔(各子群體)的討論。在傳統LCM方法中,係同時模化群內與群間機率,而兩者事先之機率分布你可就資料特性檢自行指定:

(1)群內機率旨在說明同群內對產生或某服務服具有相同特質。例如價格與品牌,由於各族群對變數的感受不一、或某特定族群的比例過低,而導致回歸係數的不顯著或不穩定,乃至不具參考價值,此時修正法可考慮固定(constant)、捨棄、或跨群一併校估的處理方式。

(2)各群間機率旨在分析影響各次群組的因素,例如改採用FMM的潛在分類(當依變數)、社會經濟、群組層次人口統計等當解釋變數。至於分群數目的多寡可由模型適配指標「AIC、BIC」來決定(值愈小模型愈佳)。倘若BIC仍難以解釋此困境,則你可依據先驗知識/文獻探討來決定分群數目。
 
11 跳到