Cross Table:卡方分配與卡方檢定 | 卡方分布cdf
卡方檢定(Chi-SquaredTest)這個中文譯名似乎很奇怪,既非人名,也不像在描述函數特徵,或許有人跟我一樣,學統計的時候也曾被這個詭異的名字困擾了一陣子吧。卡方檢定是基礎統計學中經常被低估的一塊,事實上卡方檢定是最古老的統計學基礎之一,從卡方檢定身上可以延伸出許多統計學歷史中的重要進展,而卡方檢定與卡方分配又和二維列聯表(中文有時也稱為交叉表)分析息息相關,是類別資料分析最基本也最重要的前提知識。交叉表的分析議題,可依維度分成二維表及三維表兩大類,本文與《OntheCross:Pearson,YatesandFisher》[1]處理二維...
卡方檢定( Chi-Squared Test )這個中文譯名似乎很奇怪,既非人名,也不像在描述函數特徵,或許有人跟我一樣,學統計的時候也曾被這個詭異的名字困擾了一陣子吧。
卡方檢定是基礎統計學中經常被低估的一塊,事實上卡方檢定是最古老的統計學基礎之一,從卡方檢定身上可以延伸出許多統計學歷史中的重要進展,而卡方檢定與卡方分配又和二維列聯表(中文有時也稱為交叉表)分析息息相關,是類別資料分析最基本也最重要的前提知識。
交叉表的分析議題,可依維度分成二維表及三維表兩大類,本文與《On the Cross:Pearson, Yates and Fisher》[1]處理二維表議題,在《Beyond The Cross :三維表( Three-Way Table )與 Simpson’s Paradox 》[2]當中則介紹三維表的卡方分析。
「卡方」名稱種類與涵義是初學者最容易感到混淆的地方,通常有三個情境會直接簡稱為「卡方」:卡方分配、卡方檢定、卡方統計量。
首先從卡方分配說起。
伽瑪 Gamma、 卡方 Chi-Squared 與 常態分配 Normal Distribution 的關係什麼是卡方分配?卡方分配是「連續型」機率分配當中, Gamma 分配的一個特例,同時指數分配也是由 Gamma 分配衍生而來。
Gamma 分配簡單區分成兩個部份: Gamma 函數與 Gamma 機率函數。
Gamma 分配及 Gamma 函數有許多不同的型態,要了解卡方分配的源頭,只需要理解最基本的寫法即可:
附上維基百科的例圖便於參考:[3]
統計書後所附的查表機率,一般都是指「累積機率函數( c.d.f )」,也就是前式中的第二種寫法。
從 Gamma 的知識中我們已經得到用來推演卡方分配的重要基礎:
一樣附上維基百科例圖:[4]
從卡方分配與常態分配的這層關係就可以大略猜到了,沒錯,大樣本下的卡方分配是近似常態分配的,那就是為什麼卡方機率圖形在教科書裡的樣子會選擇弄成有點像常態的樣子。
當自由度較大時(統計慣...