廣義線性模式 GLM 的統計假設

1月 28, 2025

模型是正確的：無法驗證

沒有模型選擇：違反時用 post selection inference

沒有離群、極端值：違反時用穩健回歸

沒有遺失資料：違反時用多重插補法估計遺失的資料

資料/殘差是獨立的：違反時用 gee, 混合模型

資料/殘差是同分布的：違反時用 mixture model

Xs 沒有交互作用：測試事先預訂的少數交互作用

Xs 沒有測量誤差：違反時用測量誤差模型

Xs 沒有共線性：違反時用 shrinkage/penalization, ridge reg, PCA

一般線性模式 glm（線性回歸、變異數分析 ANOVA、共變數分析 ANCOVA、非配對 t 試驗）：

殘差是常態分布：若右偏態且變異數隨著 X 增加，則用 log(y), glm of y with gamma dist and log link

殘差的變異數相等（亦即跟 Xs 無關）：違反時用穩健 SE、bootstrap

## 核心假設處理

**1. 殘差獨立性**

違反時可採用：

- 廣義估計方程(GEE)處理相關數據[1][2]

- 混合效應模型納入隨機效應[2][6]

- 貝葉斯分層模型處理複雜數據結構[2]

**2. 同質變異數**

解決方案包括：

- 穩健標準誤(Robust SE)[6][10]

- Bootstrap重抽樣法[10]

- 轉換反應變數(如log轉換)[4][6]

**3. 連結函數正確性**

可透過：

- 殘差診斷圖判讀[1][3]

- 比較不同連結函數的AIC值[1]

- 隨機化檢驗驗證模型穩健性[1]

## 擴展問題處理

**共線性問題**

- 使用嶺回歸(Ridge)或Lasso懲罰[8][9]

- 主成分回歸(PCR)降維[8]

- 增加樣本量或刪除高度相關變數[9]

**測量誤差**

- 結構方程模型(SEM)處理潛在變量[5]

- 測量誤差模型校正偏差[5]

- 提升測量工具信度[5]

**非常態分佈**

- 選擇適當誤差分佈(如Gamma分佈)[1][3]

- 分位數回歸替代[6]

- 轉換反應變數(Box-Cox轉換)[4][6]

實務應用時，需優先檢查殘差圖與影響點[1][3]，若主要假設嚴重違反，建議採用模型修正而非單純依賴p值解讀[7]。混合模型與貝葉斯方法能同時處理多種假設違反問題，但需注意模型複雜度與解釋性間的平衡[2][8]。

搜尋此網誌

統計學

廣義線性模式 GLM 的統計假設

留言

張貼留言

這個網誌中的熱門文章

可轉移性、普遍性、代表性和外部有效性

頻率學派 vs 貝氏學派

貝氏分析計算器