淺談卡方檢定@ 生活的希格斯實驗室:: 痞客邦 | 卡方分配相加
類別資料分析最基本也是最前提的知識就是卡方檢定。卡方檢定是卡方分配(Chi-squaredistribution)的一種應用。卡方分配是一種概率的分布模式,它是「連續型」機率分配當中Gamma函數的一種特殊型態;順帶一提,指數分配也是從Gamma分配而來的。 ─卡方分配的由來─ 先討論數學上卡方分配的意義。Gamma分配分為Gamma函數及機率函數Gamma函數Gamma機率函數加上討論可靠度時常用的累積機率函數,積分到t時的累積機率如下:此時Gamma分配的期望值和變異數為而當α=v/2,β=2時,卡方機率函數就誕生了,而卡方分配的期望值和變異數為V為自由度如...
類別資料分析 最基本也是最前提的知識就是卡方檢定。
卡方檢定是卡方分配 (Chi-square distribution) 的一種應用。卡方分配是一種概率的分布模式,它是「連續型」機率分配當中Gamma函數的一種特殊型態;順帶一提,指數分配也是從Gamma分配而來的。
─ 卡方分配的由來 ─
先討論數學上卡方分配的意義。Gamma 分配分為Gamma 函數及機率函數
Gamma函數
Gamma機率函數
加上討論可靠度時常用的累積機率函數,積分到t時的累積機率如下:
此時Gamma 分配的期望值和變異數為
而當 α =v/2,β = 2 時,卡方機率函數就誕生了,而卡方分配的期望值和變異數為
V為自由度
如果我們把卡方分配的圖形依自由度不同畫成一個比較圖,可以看出卡方分配的結果會隨著自由度的增加越來越趨近常態分配的結果。
卡方分配機率圖
之所以先從比較難理解的數學角度上去討論卡方分配,是為了從卡方機率的結果來討論統計上的意義。如果現有一個母體群,我們重覆抽樣並計算每次抽樣的變異數,會發現機率分配呈現一個非對稱的右偏常態分配結果。當抽樣數 (自由度) 越來越多時,其變異數的機率分配會趨近於一個對稱的常態分配。
因此卡方分配和常態分配間的一個重要關係:
z = (x - μ)/σ, zi 為 i 個互相獨立的常態分配,則 Z2 = X2 (v=1)
X2(v=1)為標準卡方分配。
當自由度夠大時 (一般統計會取30,但不限於),可以用下面的公式轉換:
─ 卡方適合度檢定 ─
卡方分配是推論統計中最重要的分配之一,應用範圍很廣,從母體變異數估計、檢定、卡方近似應用、類別資料分析及卡方檢定都會用到這個函數。而卡方檢定不要求母體所屬分配,母體參數也非必要,這是最為強大的應用條件,因此...