Outliers 取得連結 Facebook X Pinterest 以電子郵件傳送 其他應用程式 8月 29, 2020 離群值(極端值、異常值)定義:若是常態分布,大於三個標準差(99.7%)以上的差距,若非常態分布,在盒鬚圖中第三/ㄧ四分位數 ± 1.5 x 四分位距以外。工業上的「六西格瑪(標準差)」品管能把瑕疵品的比率控制在小於一百萬分之 3.4。原因:系統性偏差、技術錯誤、資料鍵入錯誤、真的極端值、其他處理:刪除(技術錯誤、資料鍵入錯誤)、穩健統計學(真的極端值、其他) 取得連結 Facebook X Pinterest 以電子郵件傳送 其他應用程式 留言
可轉移性、普遍性、代表性和外部有效性 2月 05, 2024 ### 可轉移性(Transportability) - **定義:** 可轉移性指的是將一個研究中得到的因果效應估計從一個人群(研究人群)應用到另一個不同的人群(目標人群)的能力。它涉及特定的統計方法來調整人群之間的差異,並特別關注為了合理和實施此類應用所需的假設和方法。 - **用途:** 當研究人員想知道在一個設置或人群中觀察到的干預效果是否在不同的設置或人群中保持時使用。 ### 普遍性(Generalizability) - **定義:** 普遍性是指研究發現可以應用到更廣泛人群、設置、時間或未直接研究的測量指標的程度。它是一個比可轉移性更廣泛的概念,更多地關注研究結果在特定研究條件之外的適用性。 - **用途:** 在評估研究結果是否適用於明確研究之外的更廣泛背景時考慮,而不必然採用特定的統計方法來進行此類應用。 ### 代表性(Representativeness) - **定義:** 代表性指的是研究樣本如何緊密地反映其所來自的總體或目標人群的特徵。它涉及抽樣過程和樣本在多大程度上體現了更廣泛人群的特徵。 - **用途:** 這一概念在研究設計階段至關重要,影響研究結果能夠被泛化到總體的程度。 ### 外部有效性(External Validity) - **定義:** 外部有效性是指研究結果可以被泛化或應用到原始研究設置、人群、治療變量和結果之外的背景的程度。它包括普遍性和可轉移性的概念,但範圍更廣,包括隨時間和在不同條件下應用研究發現的適用性。 - **用途:** 它涉及到研究發現超出特定研究範圍的整體適用性和相關性,考慮諸如時間、設置和人群等因素。 **關鍵差異和關係:** - **可轉移性與普遍性:** 可轉移性是普遍性的一個子集,特別關注使用統計調整將結果應用到不同人群的能力。普遍性是一個更廣泛的概念,不必然涉及此類調整。 - **代表性與外部有效性:** 代表性樣本可以增強研究的外部有效性,但外部有效性也取決於其他因素,如研究設計和執行。 - **外部有效性包含:** 普遍性和可轉移性,以及其他考慮因素,以便將研究發現應用於原始背景之外。 總之,雖然所有這些概念都涉及到將研究發現應用於原始研究條件之外,但它們每一個都關注此應用的不同方面,從用於調整不同人群之間差異的統計方法(可轉移性)到研究發現的整體適用性(外部有效性)。 - ... 閱讀完整內容
頻率學派 vs 貝氏學派 5月 09, 2024 機率是重複事件長期發生的頻率 vs 主觀上某事件發生的不確定性(比較像是一般人的觀念)。 傳統 vs 新 簡單vs 複雜 人工計算可行 vs 不可行 母數(參數)是未知的常數(沒有機率可言) vs 未知的隨機變數(有機率) 樣本是隨機的變數 vs 已經發生的固定數 客觀(只依據本次試驗的結果)vs 主觀(依據先驗信念及本次試驗的結果而更新成後驗信念)。 H: 假設,D: 資料。H0: 虛無假設(參數或母數 θ 等於 0),H1: 對立假設,p(H1)=1-p(H0)。 一個棒球比賽的觀眾關心的是「機率」p(D|H),亦即預測「這個左打者擊中球的機率是多少?」;當他看見一名打者擊中了球以後,計算這一名打者是一個左打者的機率是多少則是屬於「逆機率」p(H|D)。 醫生關心的是「逆機率」p(H|D):當看見某症候、檢驗、檢查 D時,用貝氏定理計算病人有某疾病 H 的機率。 估計 p 值(H0 為真時,看見 D 或比它更極端的機率 p(D|H0)) vs 估計後驗機率 p(H1|D):p(D|H) ≠ p(H|D)。 95% 信賴區間包含母數的機率是 0% 或 100% vs 95% 置信區間包含母數的機率是 95%。 頻率學派:當 p < α(例如 0.05)時拒絕 H0,當 p ≥ α 時無法拒絕 H0。但是我們無法知道 p(H0|D)、p(H1|D),而且無論 p 值多大都無法接受 H0。 貝氏定理: 1. H1 的後驗勝算 p(H1|D)/(p(H0|D))= 先驗勝算 x 似然比或貝氏因子 p(D|H1)/p(D|H0),勝算=機率/(1-機率),機率=勝算/(勝算+1)。 2. 後驗機率 p(H|D)= 先驗機率 p(H) x p(D/H)/p(D) p(D): p(D/H0) + p(D/H1) RCT 時,頻率學派的 α 是 H0 為真(無效)時,你卻斷言為假(有效)的機率:p(斷言有效|無效)。傳統上它被稱為「第一型錯誤率」,其實它應該是「第一型斷言率」,而不是治療無效你卻以為有效的錯誤機率:貝氏學派的 1 - p(有效|資料,先驗機率)。後者才是我們所關心的。 ESP and the significance of significance 22 https://understandinguncertainty.org/node/1286 爲什麼我... 閱讀完整內容
貝氏分析計算器 1月 30, 2025 貝氏分析計算器 :20250130 by 顧進裕, Claude-3.5-Sonnet 平均值與標準差計算器 貝氏定理:後驗分布 p(H|D) = 先驗分布 p(H) × 似然分布 p(D|H) / 邊際分布 p(D) 似然分布:觀察到的平均值與標準誤 se 後驗分布:95% 可信區間(credible interval) 1. 等尾可信區間:適用於對稱性分布,可以跟 95% CI 比較 2. 最高後驗密度:適用於偏斜或多峰分布 3. 分位數可信區間:適用於單峰的對稱性分布 後驗預測分布:95% 預測區間,p 值靠近 0.5 時表示模型是可靠的 假設: • log(OR), log(RR), log(HR) 都是常態分布 • 先驗 log(OR) = log(RR) = log(HR) = 0(即先驗 OR = RR = HR = 1) • log(先驗反應比率)=log(mean 1/mean2) • 大部分的 OR, RR, HR, log(先驗反應比率) 介於 0.5~2 之內 • 先驗標準平均差 SMD =平均差/標準差 sd= 0 • 大部分的 SMD 介於 -1~1(亦即二組相差一個標準差)之內 多重先驗敏感性分析: • 強先驗: gaussian(0, 0.2),95% confidence interval(信賴區間) -0.4, 0.4, 亦即 OR, RR, HR, 先驗反應比率 0.7, 1.5 • 內定先驗: gaussian(0, 0.42),95% CI(信賴區間) -0.84, 0.84, 亦即 OR, RR, HR, 先驗反應比率 0.4, 2.7 • 弱先驗: gaussian(0, 1),95% CI(信賴區間) -4, 4, 亦即 OR, RR, HR, 先驗反應比率 0.14, 7.4 閱讀完整內容
留言
張貼留言