卡方檢驗 | chi square test中文
出自MBA智库百科(https://wiki.mbalib.com/[1])卡方檢驗(Chi-squaretest/Chi-SquareGoodness-of-FitTest) 卡方檢驗是一種用途很廣的計數資料的假設檢驗[2]方法。它屬於非參數檢驗[3]的範疇,主要是比較兩個及兩個以上樣本率(構成比)以及兩個分類變數[4]的關聯性分析。其根本思想就是在於比較理論頻數和實際頻數的吻合程度或擬合優度問題。 它在分類資料統計推斷[5]中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析[6]等。卡方檢驗的基本原理[1]卡方檢驗的基本思想...
出自 MBA智库百科(https://wiki.mbalib.com/[1])卡方檢驗(Chi-square test/Chi-Square Goodness-of-Fit Test)
卡方檢驗是一種用途很廣的計數資料的假設檢驗[2]方法。它屬於非參數檢驗[3]的範疇,主要是比較兩個及兩個以上樣本率( 構成比)以及兩個分類變數[4]的關聯性分析。其根本思想就是在於比較理論頻數和實際頻數的吻合程度或擬合優度問題。
它在分類資料統計推斷[5]中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析[6]等。
卡方檢驗的基本原理[1] 卡方檢驗的基本思想卡方檢驗是以χ2分佈為基礎的一種常用假設檢驗方法,它的無效假設H0是:觀察頻數與期望頻數沒有差別。
該檢驗的基本思想是:首先假設H0成立,基於此前提計算出χ2值,它表示觀察值與理論值之間的偏離程度。根據χ2分佈及自由度可以確定在H0假設成立的情況下獲得當前統計量及更極端情況的概率[7]P。如果P值很小,說明觀察值與理論值偏離程度太大,應當拒絕無效假設,表示比較資料之間有顯著差異[8];否則就不能拒絕無效假設,尚不能認為樣本[9]所代表的實際情況和理論假設有差別。
卡方值的計算與意義χ2值表示觀察值與理論值之間的偏離程度。計算這種偏離程度的基本思路如下。
(1)設A代表某個類別的觀察頻數,E代表基於H0計算出的期望頻數,A與E之差稱為殘差。
(2)顯然,殘差可以表示某一個類別觀察值和理論值的偏離程度,但如果將殘差簡單相加以表示各類別觀察頻數與期望頻數的差別,則有一定的不足之處。因為殘差有正有負,相加後會彼此抵消[10],總和仍然為0,為此可以將殘差平方後求和。
(3)另一方面,殘差大小是一個相對的概念,相對於期望頻數為10時,期望頻數為20的殘差非常大,但相對於期望頻數為1 000時20的殘差就很小了。考慮到這一點,人們又將殘差平方除以期望頻數再求和,以估計觀察頻數與期望頻數的差別。
進行上述操作之後,就得到了常用的χ2統計量,由於它最...