10個必知必會的統(tǒng)計學(xué)問題
正文
來源:計量經(jīng)濟(jì)學(xué)
答:(定義)構(gòu)成樣本統(tǒng)計量的獨(dú)立的樣本觀測值的數(shù)目或自由變動的樣本觀測值的數(shù)目。用df表示。
自由度的設(shè)定是出于這樣一個理由:在總體平均數(shù)未知時,用樣本平均數(shù)去計算離差(常用小s)會受到一個限制——要計算標(biāo)準(zhǔn)差(小s)就必須先知道樣本平均數(shù),而樣本平均數(shù)和n都知道的情況下,數(shù)據(jù)的總和就是一個常數(shù)了。
所以,“最后一個”樣本數(shù)據(jù)就不可以變了,因?yàn)樗亲儯偤途妥兞耍@是不允許的。
通俗點(diǎn)說,一個班上有50個人,我們知道他們語文成績平均分為80,現(xiàn)在只需要知道49個人的成績就能推斷出剩下那個人的成績。你可以隨便報出49個人的成績,但是最后一個人的你不能瞎說,因?yàn)槠骄忠呀?jīng)固定下來,自由度少一個。
答:在正態(tài)分布檢驗(yàn)中,這里的M(三個統(tǒng)計量)為:N(總數(shù))、平均數(shù)和標(biāo)準(zhǔn)差。
因?yàn)槲覀冊谧稣龖B(tài)檢驗(yàn)時,要使用到平均數(shù)和標(biāo)準(zhǔn)差以確定該正態(tài)分布形態(tài),此外,要計算出各個區(qū)間的理論次數(shù),我們還需要使用到N。
所以在正態(tài)分布檢驗(yàn)中,自由度為K-3。
答:t檢驗(yàn)適用于兩個變量均數(shù)間的差異檢驗(yàn),多于兩個變量間的均數(shù)比較要用方差分析。
無論哪種類型的t檢驗(yàn),都必須在滿足特定的前提條件下: 正態(tài)性和方差齊性,應(yīng)用才是合理的。這是因?yàn)楸仨氃谶@樣的前提下所計算出的t統(tǒng)計量才服從t分布,而t檢驗(yàn)正是以t分布作為其理論依據(jù)的檢驗(yàn)方法。
t檢驗(yàn)是目前醫(yī)學(xué)研究中使用頻率最高,醫(yī)學(xué)論文中最常見到的處理定量資料的假設(shè)檢驗(yàn)方法。
答:結(jié)果的統(tǒng)計學(xué)意義是結(jié)果真實(shí)程度(能夠代表總體)的一種估計方法。專業(yè)上,P值為結(jié)果可信程度的一個遞減指標(biāo),P值越大,我們越不能認(rèn)為樣本中變量的關(guān)聯(lián)是總體中各變量關(guān)聯(lián)的可靠指標(biāo)。
P值是將觀察結(jié)果認(rèn)為有效即具有總體代表性的犯錯概率。如P=0.05提示樣本中變量關(guān)聯(lián)有5%的可能是由于偶然性造成的。即假設(shè)總體中任意變量間均無關(guān)聯(lián)
在許多研究領(lǐng)域,0.05的P值通常被認(rèn)為是可接受錯誤的邊界水平。
答:在最后結(jié)論中判斷什么樣的顯著性水平具有統(tǒng)計學(xué)意義,不可避免地帶有武斷性。換句話說,認(rèn)為結(jié)果無效而被拒絕接受的水平的選擇具有武斷性。
答:并不完全如此,但大多數(shù)檢驗(yàn)都直接或間接與之有關(guān),可以從正態(tài)分布中推導(dǎo)出來,如t檢驗(yàn)、F檢驗(yàn)或卡方檢驗(yàn)。這些檢驗(yàn)一般都要求:所分析變量在總體中呈正態(tài)分布,即滿足所謂的正態(tài)假設(shè)。許多觀察變量的確是呈正態(tài)分布的,這也是正態(tài)分布是現(xiàn)實(shí)世界的基本特征的原因。
答:在假設(shè)檢驗(yàn)中,由于隨機(jī)性我們可能在決策上犯兩類錯誤,一類是假設(shè)正確,但我們拒絕了假設(shè),這類錯誤是“棄真”錯誤,被稱為第一類錯誤;
1)確定假設(shè);
2)進(jìn)行抽樣,得到一定的數(shù)據(jù);
4)依據(jù)所構(gòu)造的檢驗(yàn)統(tǒng)計量的抽樣分布,和給定的顯著性水平,確定拒絕域及其臨界值;
5)比較這次抽樣中檢驗(yàn)統(tǒng)計量的值與臨界值的大小,如果檢驗(yàn)統(tǒng)計量的值在拒絕域內(nèi),則拒絕假設(shè);
答:與其它檢驗(yàn)一樣,所計算出的統(tǒng)計量越大,在分布中越接近分布的尾端,所對應(yīng)的概率值越小。如果試驗(yàn)設(shè)計合理、數(shù)據(jù)正確,顯著或不顯著都是客觀反映。沒有什么好與不好。
答:卡方分布主要用于多組多類的比較,是檢驗(yàn)研究對象總數(shù)與某一類別組的觀察頻數(shù)和期望頻數(shù)之間是否存在顯著差異,要求每格中頻數(shù)不小于5,如果小于5則合并相鄰組。
答:從三個方面來回答,
1)設(shè)計類型是完全隨機(jī)設(shè)計兩組數(shù)據(jù)比較,不知道數(shù)據(jù)是否是連續(xù)性變量?
2)比較方法:如果數(shù)據(jù)是連續(xù)性數(shù)據(jù),且兩組數(shù)據(jù)分別服從正態(tài)分布和方差齊性檢驗(yàn),則可以采用t檢驗(yàn),如果不服從以上條件可以采用其他檢驗(yàn)。
3)想知道兩組數(shù)據(jù)是否有明顯差異?不知道這個明顯差異是什么意思?是問差別有無統(tǒng)計學(xué)意義(即差別的概率有多大)還是兩總體均數(shù)差值在哪個范圍波動?如果是前者則可以用第2步可以得到P值,如果是后者,則是用均數(shù)差值的置信區(qū)間來完成的。



評論
圖片
表情
