廣義線性模式 GLM 的統計假設

模型是正確的:無法驗證

沒有模型選擇:違反時用 post selection inference

沒有離群、極端值:違反時用穩健回歸

沒有遺失資料:違反時用多重插補法估計遺失的資料

資料/殘差是獨立的:違反時用 gee, 混合模型

資料/殘差是同分布的:違反時用 mixture model

Xs 沒有交互作用:測試事先預訂的少數交互作用

Xs 沒有測量誤差:違反時用測量誤差模型

Xs 沒有共線性:違反時用 shrinkage/penalization, ridge reg, PCA

一般線性模式 glm(線性回歸、變異數分析 ANOVA、共變數分析 ANCOVA、非配對 t 試驗):

殘差是常態分布:若右偏態且變異數隨著 X 增加,則用 log(y), glm of y with gamma dist and log link

殘差的變異數相等(亦即跟 Xs 無關):違反時用穩健 SE、bootstrap


## 核心假設處理

**1. 殘差獨立性**  

違反時可採用:

- 廣義估計方程(GEE)處理相關數據[1][2]

- 混合效應模型納入隨機效應[2][6]

- 貝葉斯分層模型處理複雜數據結構[2]


**2. 同質變異數**  

解決方案包括:

- 穩健標準誤(Robust SE)[6][10]

- Bootstrap重抽樣法[10]

- 轉換反應變數(如log轉換)[4][6]


**3. 連結函數正確性**  

可透過:

- 殘差診斷圖判讀[1][3]

- 比較不同連結函數的AIC值[1]

- 隨機化檢驗驗證模型穩健性[1]


## 擴展問題處理

**共線性問題**  

- 使用嶺回歸(Ridge)或Lasso懲罰[8][9]

- 主成分回歸(PCR)降維[8]

- 增加樣本量或刪除高度相關變數[9]


**測量誤差**  

- 結構方程模型(SEM)處理潛在變量[5]

- 測量誤差模型校正偏差[5]

- 提升測量工具信度[5]


**非常態分佈**  

- 選擇適當誤差分佈(如Gamma分佈)[1][3]

- 分位數回歸替代[6]

- 轉換反應變數(Box-Cox轉換)[4][6]


實務應用時,需優先檢查殘差圖與影響點[1][3],若主要假設嚴重違反,建議採用模型修正而非單純依賴p值解讀[7]。混合模型與貝葉斯方法能同時處理多種假設違反問題,但需注意模型複雜度與解釋性間的平衡[2][8]。

留言

這個網誌中的熱門文章

可轉移性、普遍性、代表性和外部有效性

頻率學派 vs 貝氏學派

貝氏分析計算器