T檢驗(yàn)、F檢驗(yàn)和卡方檢驗(yàn)
T檢驗(yàn)、F檢驗(yàn)、卡方檢驗(yàn)是統(tǒng)計(jì)學(xué)中常見(jiàn)的假設(shè)檢驗(yàn),今天記錄下這幾個(gè)假設(shè)檢驗(yàn)的原理和應(yīng)用場(chǎng)景。
| 檢驗(yàn)方法 | 應(yīng)用場(chǎng)景 |
|---|---|
| T檢驗(yàn) | 比較兩個(gè)樣本均值是否有差異 |
| F檢驗(yàn) | 比較兩個(gè)及兩個(gè)以上樣本均值是否有差異 |
| 卡方檢驗(yàn) | 比較兩組或者多組之間的分類型變量是否差異 |
T檢驗(yàn)
T檢驗(yàn)又稱學(xué)生T檢驗(yàn),用于統(tǒng)計(jì)量服從正態(tài)分布,總體方差未知且樣本量較?。╪<30)情況下,用來(lái)比較兩個(gè)均值差異是否顯著??煞譃榕鋵?duì)樣本T檢驗(yàn)、單樣本T檢驗(yàn)和兩獨(dú)立樣本T檢驗(yàn) 3 種類型。
配對(duì)樣本T檢驗(yàn)
用于檢驗(yàn)兩個(gè)配對(duì)樣本均值的差是否等于零。如比較一個(gè)受試者在不同治療方式后的指標(biāo)差異,或不能在同一個(gè)受試者上開(kāi)展實(shí)驗(yàn),把接受 A 治療的人和接受 B 治療的人配對(duì),通常會(huì)基于年齡、性別或其他我們認(rèn)為重要的變量進(jìn)行配對(duì),配對(duì)的目的是使 A 組和 B 組的人盡可能相同。
單樣本T檢驗(yàn)
檢驗(yàn)單個(gè)樣本的均值是否與已知的總體均值相等,比如:某大學(xué)生的身高是否大于全國(guó)平均身高。
兩獨(dú)立樣本T檢驗(yàn)
檢驗(yàn)兩獨(dú)立樣本的均值是否相等,如 A/B Test,不同的按鈕顏色,對(duì)于訪問(wèn)量是否有顯著差異。
F檢驗(yàn)
方差分析就是對(duì)試驗(yàn)數(shù)據(jù)進(jìn)行分析,檢驗(yàn)方差相等的多個(gè)因素均值是否相等,來(lái)判斷各因素對(duì)試驗(yàn)指標(biāo)的影響是否顯著。其原理是從差異的源頭入手,一類是組內(nèi)隨機(jī)差異造成的,一類是不同組的組間差異造成的??刹鸾鉃榭偲椒胶蚐ST = 組內(nèi)殘差平方和 SSE(不可解釋的差異) + 組間因素平方和 SSTR(可解釋的差異),F(xiàn)統(tǒng)計(jì)量是組間均方與組內(nèi)均方的比值。其計(jì)算公式如下:
組間因素平均平方和 MSTR,K-1 代表自由度,K 代表有多少組:

組內(nèi)殘差平均平方和 MSE,n 代表觀測(cè)值的個(gè)數(shù):

根據(jù)求得的F統(tǒng)計(jì)量,查F表,如果大于臨界值則拒絕原假設(shè),就意味著差異的主要來(lái)源是由于組與組的不同而造成的,即組間具有顯著性的差異。相反,如果F值小于臨界值則接受原假設(shè),說(shuō)明組內(nèi)的均方 MSE 比較大,差異的主要來(lái)源并不是組與組的不同,而是組內(nèi)隨機(jī)變化的結(jié)果,組間無(wú)顯著性差異。
卡方檢驗(yàn)
卡方檢驗(yàn)主要是統(tǒng)計(jì)樣本的實(shí)際觀測(cè)值與理論推斷值之間的偏離程度,來(lái)判斷變量之間是否有相關(guān)關(guān)系。適用于比較兩組或者多組之間的分類型變量之間是否有顯著的差異??ǚ街涤?jì)算公式如下:
根據(jù)自由度((行-1)*(列-1)),結(jié)合我們定義的置信水平,查卡方分布臨界表,卡方值大于臨界值,則拒絕原假設(shè),可判斷有顯著差異。詳細(xì)案例介紹大家可參考這篇文章《卡方檢驗(yàn)的理解》。另外更正一下,《卡方檢驗(yàn)的理解》這篇文章中最后的自由度的乘號(hào)寫成了減號(hào)。
