為什麼統計的樣本標準差計算要除(n | 自由度 n 1
![為什麼統計的樣本標準差計算要除(n](https://i.imgur.com/axBPWDg.jpg)
相信這也是許多人的疑問,為什麼統計學在計算母體標準差與樣本標準差的時候要分別除以n與(n-1)呢?一般人大概可以理解母體標準差除以n的道理,因為總共有n筆資料。那為什麼計算樣本標準差時就要把分母減去1,就是除以(n-1)呢?工作熊知道自己的回答無法讓所有的人滿意,但在你質疑工作熊之前請先讀完整篇文章好嘛!在回答這個問題之前,工作熊要先請大家想想看,當同一數值同時除以n及(n-1)時,除以(n-1)所得出來的數值是否會比較大?答案是肯定的,因為樣本的標準差是總體標準差的估計值(你問工作熊為什麼是「估計值」…?因為是「抽...
![為什麼統計的樣本標準差計算要除(n](https://i.imgur.com/H8YKUrg.jpg)
相信這也是許多人的疑問,為什麼統計學在計算母體標準差與樣本標準差的時候要分別除以n與(n-1)呢?
一般人大概可以理解母體標準差除以n的道理,因為總共有n筆資料。
那為什麼計算樣本標準差時就要把分母減去1,就是除以(n-1)呢?
工作熊知道自己的回答無法讓所有的人滿意,但在你質疑工作熊之前請先讀完整篇文章好嘛!
在回答這個問題之前,工作熊要先請大家想想看,當同一數值同時除以n及(n-1)時,除以(n-1)所得出來的數值是否會比較大?答案是肯定的,因為樣本的標準差是總體標準差的估計值(你問工作熊為什麼是「估計值」…?因為是「抽樣」的關係啊。比如說全校學生共有500人,抽樣50人,取身高來代表全校學生的身高,也就是用50人的身高來推估500人的身高,雖然50個人可以大致代表全校學生,但究竟還是跟實際計算500人的身高數值會稍有不同,也就是說兩者不會一模一樣)。
由樣本計算出來的標準差終究不是整體實際的標準差,也就是說樣本標準差是個不確定的數值,也就是說它是一個估計值。一般來說一位嚴謹的工程人員在估計數值的時候總是比較偏向保守,尤其事關安全時,當他無法準確的計算出一個數值時,就寧願讓數值偏向較差的方向,也就是故意將樣本標準差的值高估於總體標準差,以取得保險,免得到時出錯造成損失。於是,將之除以一個較小的分母(n-1)就可以讓我們做到這一點。標準差越大表示製程能力越差,除以(n-1)會讓數值變大。
其實,如果樣本的數量越大時,那麼除以n和除以(n-1)的差異將會越趨於一致。換句話說,其所引起的「量變」就不會太大,但是它們卻有著「有偏估計」與「無偏估計」的「質變」。所以,一般我們在計算樣本標準差時總會要求數據量至少要大於25個,或大於30個,數據當然要越多越好,只是為了取得實用與經濟的平衡點而不得不取一個建議的數量。因此,樣本標準差公式取的是除以(n-1),只有當它除以(n-1)時,得出的結果才會是「無偏估計」。
以上所言,...