卡方檢定 | 卡方檢定規定
維基百科,自由的百科全書 此條目介紹的是廣義的卡方檢定。關於一般情況下常代指的卡方檢定,請見「皮爾森卡方檢定」。此圖展示分別在1、2、3、4、5的自由度下,卡方統計量(X軸)與P值(P-value,Y軸)之間的變化關係。卡方檢定(Chi-SquaredTest或χ2{displaystylechi{2}}Test)是一種統計量的分布在虛無假說成立時近似服從卡方分布(χ2{displaystylechi{2}}分布)的假說檢定。在沒有其他的限定條件或說明時,卡方檢定一般代指的是皮爾森卡方檢定。在卡方檢定的一般運用中,研究人員將觀察量的值劃分成若干互斥的分類,並且使用一套...
維基百科,自由的百科全書
此條目介紹的是廣義的卡方檢定。關於一般情況下常代指的卡方檢定,請見「皮爾森卡方檢定」。 此圖展示分別在1、2、3、4、5的自由度下,卡方統計量(X軸)與P值(P-value,Y軸)之間的變化關係。卡方檢定(Chi-Squared Test或χ2{displaystyle chi {2}} Test)是一種統計量的分布在虛無假說成立時近似服從卡方分布(χ2{displaystyle chi {2}}分布)的假說檢定。在沒有其他的限定條件或說明時,卡方檢定一般代指的是皮爾森卡方檢定。在卡方檢定的一般運用中,研究人員將觀察量的值劃分成若干互斥的分類,並且使用一套理論(或虛無假說)嘗試去說明觀察量的值落入不同分類的機率分布的模型。而卡方檢定的目的就在於去衡量這個假設對觀察結果所反映的程度。
在十九世紀,統計分析方法主要被用於生物數據分析。當時主流意見認為常態分布普遍適用於此類數據,例如喬治·比德爾·艾里爵士以及梅里曼教授,而卡爾·皮爾森在他1900年的論文中就針對了他們的研究數據作出了指正[1]。
直到十九世紀末期,皮爾森指出了部分數據具有明顯的偏態,常態分布並不是普遍適用。為了更好地對這些觀察數據進行建模,皮爾森在1893年至1916年發表的系列文章[2][3][4][5]中提出了一個包含常態分布以及眾多偏態分布的連續機率分布族——皮爾森分布族。同時,他指出數據統計分析的步驟應該是在從皮爾森分布族中選取合適的分布來進行建模後,使用適合度檢定技術來評價模型和實驗數據間的適合度。
著名的卡方檢定[編輯] 皮爾森卡方檢定[編輯]在1900年,皮爾森發表了著名的關於χ2{displaystyle chi {2}}檢定的文章[1],該文章被認為是現代統計學的基石之一[6]。在該文章中,皮爾森研究了適合度檢定:
假設實驗中從母體中隨機取樣得到的n{displaystyle n}個觀察值被劃分為k{displaystyle k}個互斥的分類,這樣每個分類都有一個對應的實際觀察次數xi{displaystyle x_{i}}(i=1,2,...,k{displaystyle i=1,2,...,k}...