統計學常用概念:T檢驗、F檢驗、卡方檢驗、P值、自由度 | f檢定p值
1,T檢驗和F檢驗的由來一般而言,為了確定從樣本(sample)統計結果推論至總體時所犯錯的概率,我們會利用統計學家所開發的一些統計方法,進行統計檢定。通過把所得到的統計檢定值,與統計學家建立了一些隨機變數的概率分佈(probabilitydistribution)進行比較,我們可以知道在多少%的機會下會得到目前的結果。倘若經比較後發現,出現這結果的機率很少,亦即是說,是在機會很少、很罕有的情況下才出現;那我們便可以有信心的說,這不是巧合,是具有統計學上的意義的(用統計學的話講,就是能夠拒絕虛無假設nullhypothesis,Ho)。相反,若比...
1,T檢驗和F檢驗的由來
一般而言,為了確定從樣本(sample)統計結果推論至總體時所犯錯的概率,我們會利用統計學家所開發的一些統計方法,進行統計檢定。
通過把所得到的統計檢定值,與統計學家建立了一些隨機變數的概率分佈(probability distribution)進行比較,我們可以知道在多少%的機會下會得到目前的結果。倘若經比較後發現,出現這結果的機率很少,亦即是說,是在機會很 少、很罕有的情況下才出現;那我們便可以有信心的說,這不是巧合,是具有統計學上的意義的(用統計學的話講,就是能夠拒絕虛無假設null hypothesis,Ho)。相反,若比較後發現,出現的機率很高,並不罕見;那我們便不能很有信心的直指這不是巧合,也許是巧合,也許不是,但我們沒 能確定。
F值和t值就是這些統計檢定值,與它們相對應的概率分佈,就是F分佈和t分佈。統計顯著性(sig)就是出現目前樣本這結果的機率。
2,統計學意義(P值或sig值)結果的統計學意義是結果真實程度(能夠代表總體)的一種估計方法。專業上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變數的關聯 是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.05提示樣本中變數關聯有5%的可能是由於偶然性造成 的。即假設總體中任意變數間均無關聯,我們重複類似實驗,會發現約20個實驗中有一個實驗,我們所研究的變數關聯將等於或強於我們的實驗結果。(這並不是 說如果變數間存在關聯,我們可得到5%或95%次數的相同結果,當總體中的變數存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)在許多研 究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。
3,T檢驗和F檢驗
至於具體要檢定的內容,須看你是在做哪一個統計程式。
舉一個例子,比如,你要檢驗兩獨立樣本均數差異是否能推論至總體,而行的t檢驗。兩樣本(如某班男生和女生)某變數(如身高)的均數並不相同,但這差別是否能推論至總體,代表總體的情況也是存在著差異呢?會不會總體中男女生根本沒有差別,只不過是你那麼巧抽到這2樣本的數值不同?為此,我們進行t檢定,算出一個t檢定值。與統...