高斯分布的後驗分布

在使用高斯 (Gaussian) 先驗分布的貝氏分析中,當觀測數據的似然函數也為高斯分布時,後驗分布仍然是高斯分布(即共軛分布)。以下是高斯先驗下的後驗均值與方差的推導與結果。


問題背景

假設觀測數據  x_1, x_2, \dots, x_n  是從一個已知方差  \sigma^2  的高斯分布中獨立抽樣:


x_i \sim \mathcal{N}(\mu, \sigma^2), \quad i = 1, 2, \dots, n


其中, \mu  是未知的均值參數。

先驗分布  \mu  的分布為高斯分布:


\mu \sim \mathcal{N}(\mu_0, \tau^2)


其中  \mu_0  為先驗均值, \tau^2  為先驗方差。


後驗分布推導


利用貝氏公式計算後驗分布:


p(\mu \mid x) \propto p(x \mid \mu) \cdot p(\mu)


1. 似然函數


p(x \mid \mu) \propto \exp\left(-\frac{1}{2\sigma^2} \sum_{i=1}^n (x_i - \mu)^2\right)


2. 先驗分布


p(\mu) \propto \exp\left(-\frac{1}{2\tau^2} (\mu - \mu_0)^2\right)


3. 後驗分布:結合上述兩個項,後驗分布仍然是高斯分布:


p(\mu \mid x) \propto \exp\left(-\frac{1}{2}\left[\frac{1}{\sigma^2}\sum_{i=1}^n (x_i - \mu)^2 + \frac{1}{\tau^2} (\mu - \mu_0)^2\right]\right)


4. 簡化與參數化:通過整理得到後驗分布的均值與方差。


後驗分布的參數


後驗分布為:


\mu \mid x \sim \mathcal{N}(\mu_{\text{post}}, \sigma^2_{\text{post}})


後驗均值


\mu_{\text{post}} = \frac{\frac{\mu_0}{\tau^2} + \frac{\sum_{i=1}^n x_i}{\sigma^2}}{\frac{1}{\tau^2} + \frac{n}{\sigma^2}}


可以解釋為先驗均值  \mu_0  與樣本均值  \bar{x} = \frac{\sum_{i=1}^n x_i}{n}  的加權平均:


\mu_{\text{post}} = w \cdot \mu_0 + (1-w) \cdot \bar{x}


其中權重  w = \frac{\frac{1}{\tau^2}}{\frac{1}{\tau^2} + \frac{n}{\sigma^2}} 。

後驗方差


\sigma^2_{\text{post}} = \frac{1}{\frac{1}{\tau^2} + \frac{n}{\sigma^2}}



直觀解釋

1. 後驗均值

後驗均值  \mu_{\text{post}}  是先驗均值與樣本均值的加權平均,權重取決於先驗不確定性(先驗方差  \tau^2 )與數據不確定性(樣本數   和樣本方差  \sigma^2 )。

當數據量  n  增加時,樣本均值  \bar{x}  的權重增加,後驗分布更依賴數據而非先驗。

2. 後驗方差

後驗方差  \sigma^2_{\text{post}}  總是小於先驗方差和觀測數據的不確定性,反映了通過結合先驗和數據獲得的信息量增加。


總結公式

後驗均值


\mu_{\text{post}} = \frac{\tau^2 \cdot \sum_{i=1}^n x_i + \sigma^2 \cdot \mu_0}{n \cdot \tau^2 + \sigma^2}


後驗方差


\sigma^2_{\text{post}} = \frac{\sigma^2 \cdot \tau^2}{n \cdot \tau^2 + \sigma^2}

留言

這個網誌中的熱門文章

可轉移性、普遍性、代表性和外部有效性

頻率學派 vs 貝氏學派

貝氏分析計算器