博客來-有限混合模型(FMM)：STaTa分析(以EM algorithm做潛在分類再迴歸分析)>內容連載

有限混合模型(FMM)：STaTa分析(以EM algorithm做潛在分類再迴歸分析)

作者：張紹勳
出版日期：2018/06/25

內容連載 頁數 1/1

二、有限混合模型(finite mixture model,fmm)簡介

有限混合模型(finite mixture model,fmm)為一種混合分布的機率模型，其假定原始實測資料(field observation)係自眾多但有限的未知分布而來，而FMM模型的EM演算法可自行分類(class/component)，以減少模型因存在不同異質體(heterogeneity subpopulations)而導致偏誤的估計結果。FMM模型假設在未知的K個體下，彼此間關係式為：

其中，為混合機率密度(mixture density)的機率函數，經由k個加權比例，與其組內機率所得的機率加權總合。此種機率函數因存在「有限個」加權機率，所以又稱有限混合機率分布(finite mixture)函數。其中，為各組的加權比例(weight)，它被限制(約束)為正值且總和為1( )。公式中通常包括：常態分布、Logit分布、Poisson分布…等。假設你指定樣本符合Gumbel分布，則其模型可化身為選擇模型(作者另一本書)，包括：多項logit回歸(mlogit指令、及asmprobit、fmlogit、bayes: mlogit、mprobit、clogit、asclogit、ologit、logit、xtologit、zip等指令)。其中，多項logit模型隱含可觀測的選擇行為，在不同群有不同的分布比例，若依據比例大小來分類，同群內視為同質(homegeneous)，而不同群之間為異質(heterogeneous)。由於選擇機率的發生係受回歸係數β所影響，此使得任一影響屬性會因屬於不同群，而在不同群產生不同的邊際影響係數。

在應用方面，行銷、運輸、社會科學等領域，迄今已有眾多研究以FMM模型或潛在類別模型「latent class model, LCM；類別資料+因素分析的合體)」來進行市場區隔(各子群體)的討論。在傳統LCM方法中，係同時模化群內與群間機率，而兩者事先之機率分布你可就資料特性檢自行指定：

(1)群內機率旨在說明同群內對產生或某服務服具有相同特質。例如價格與品牌，由於各族群對變數的感受不一、或某特定族群的比例過低，而導致回歸係數的不顯著或不穩定，乃至不具參考價值，此時修正法可考慮固定(constant)、捨棄、或跨群一併校估的處理方式。

(2)各群間機率旨在分析影響各次群組的因素，例如改採用FMM的潛在分類(當依變數)、社會經濟、群組層次人口統計等當解釋變數。至於分群數目的多寡可由模型適配指標「AIC、BIC」來決定(值愈小模型愈佳)。倘若BIC仍難以解釋此困境，則你可依據先驗知識/文獻探討來決定分群數目。

共1頁 1 跳到頁