卡方检验 | chi square test中文
此图展示分别在1、2、3、4、5的自由度下,卡方统计量(X轴)与P值(P-value,Y轴)之间的变化关系。卡方检验(Chi-SquaredTest或χ2{displaystylechi{2}}Test)是一种统计量的分布在零假设成立时近似服从卡方分布(χ2{displaystylechi{2}}分布)的假设检验。在没有其他的限定条件或说明时,卡方检验一般指代的是皮尔森卡方检验。在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论(或零假设)尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所...
此图展示分别在1、2、3、4、5的自由度下,卡方统计量(X轴)与P值(P-value,Y轴)之间的变化关系。卡方检验(Chi-Squared Test或χ2{displaystyle chi {2}} Test)是一种统计量的分布在零假设成立时近似服从卡方分布(χ2{displaystyle chi {2}}分布)的假设检验。在没有其他的限定条件或说明时,卡方检验一般指代的是皮尔森卡方检验。在卡方检验的一般运用中,研究人员将观察量的值划分成若干互斥的分类,并且使用一套理论(或零假设)尝试去说明观察量的值落入不同分类的概率分布的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。
在十九世纪,统计分析方法主要被用于生物数据分析。当时主流意见认为正态分布普遍适用于此类数据,例如乔治·比德尔·艾里爵士以及梅里曼教授,而卡尔·皮尔森在他1900年的论文中就针对了他们的研究数据作出了指正[1]。
直到十九世纪末期,皮尔森指出了部分数据具有明显的偏态,正态分布并不是普遍适用。为了更好地对这些观察数据进行建模,皮尔森在1893年至1916年发表的系列文章[2][3][4][5]中提出了一个包含正态分布以及众多偏态分布的连续概率分布族——皮尔森分布族。同时,他指出数据统计分析的步骤应该是在从皮尔森分布族中选取合适的分布来进行建模后,使用拟合优度检验技术来评价模型和实验数据间的拟合优度。
皮尔森卡方检验[编辑]在1900年,皮尔森发表了著名的关于χ2{displaystyle chi {2}}检验的文章[1],该文章被认为是现代统计学的基石之一[6]。在该文章中,皮尔森研究了拟合优度检验:
假设实验中从总体中随机取样得到的n{displaystyle n}个观察值被划分为k{displaystyle k}个互斥的分类,这样每个分类都有一个对应的实际观察次数xi{displaystyle x_{i}}(i=1,2,...,k{displaystyle i=1,2,...,k})。研究人员会对实验中各个观察值落入第i{displaystyle i}个分类的概率pi{displaystyle p_{i}}的分布提出零假设,从而获得了对应所有第i{displaystyle...