廣義線性模式 GLM 的統計假設
模型是正確的:無法驗證
沒有模型選擇:違反時用 post selection inference
沒有離群、極端值:違反時用穩健回歸
沒有遺失資料:違反時用多重插補法估計遺失的資料
資料/殘差是獨立的:違反時用 gee, 混合模型
資料/殘差是同分布的:違反時用 mixture model
Xs 沒有交互作用:測試事先預訂的少數交互作用
Xs 沒有測量誤差:違反時用測量誤差模型
Xs 沒有共線性:違反時用 shrinkage/penalization, ridge reg, PCA
一般線性模式 glm(線性回歸、變異數分析 ANOVA、共變數分析 ANCOVA、非配對 t 試驗):
殘差是常態分布:若右偏態且變異數隨著 X 增加,則用 log(y), glm of y with gamma dist and log link
殘差的變異數相等(亦即跟 Xs 無關):違反時用穩健 SE、bootstrap
## 核心假設處理
**1. 殘差獨立性**
違反時可採用:
- 廣義估計方程(GEE)處理相關數據[1][2]
- 混合效應模型納入隨機效應[2][6]
- 貝葉斯分層模型處理複雜數據結構[2]
**2. 同質變異數**
解決方案包括:
- 穩健標準誤(Robust SE)[6][10]
- Bootstrap重抽樣法[10]
- 轉換反應變數(如log轉換)[4][6]
**3. 連結函數正確性**
可透過:
- 殘差診斷圖判讀[1][3]
- 比較不同連結函數的AIC值[1]
- 隨機化檢驗驗證模型穩健性[1]
## 擴展問題處理
**共線性問題**
- 使用嶺回歸(Ridge)或Lasso懲罰[8][9]
- 主成分回歸(PCR)降維[8]
- 增加樣本量或刪除高度相關變數[9]
**測量誤差**
- 結構方程模型(SEM)處理潛在變量[5]
- 測量誤差模型校正偏差[5]
- 提升測量工具信度[5]
**非常態分佈**
- 選擇適當誤差分佈(如Gamma分佈)[1][3]
- 分位數回歸替代[6]
- 轉換反應變數(Box-Cox轉換)[4][6]
實務應用時,需優先檢查殘差圖與影響點[1][3],若主要假設嚴重違反,建議採用模型修正而非單純依賴p值解讀[7]。混合模型與貝葉斯方法能同時處理多種假設違反問題,但需注意模型複雜度與解釋性間的平衡[2][8]。
留言
張貼留言