Outliers

Outliers

離群值（極端值、異常值）

定義：若是常態分布，大於三個標準差（99.7%）以上的差距，若非常態分布，在盒鬚圖中第三/ㄧ四分位數 ± 1.5 x 四分位距以外。工業上的「六西格瑪（標準差）」品管能把瑕疵品的比率控制在小於一百萬分之 3.4。

原因：系統性偏差、技術錯誤、資料鍵入錯誤、真的極端值、其他

處理：刪除（技術錯誤、資料鍵入錯誤）、穩健統計學（真的極端值、其他）

留言