<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          超全干貨 | 統(tǒng)計(jì)學(xué)中常用的數(shù)據(jù)分析方法匯總!

          共 4422字,需瀏覽 9分鐘

           ·

          2020-10-01 21:11

          ↑↑↑點(diǎn)擊上方藍(lán)字,回復(fù)資料,10個(gè)G的驚喜


          一、描述統(tǒng)計(jì)

          描述統(tǒng)計(jì)是通過圖表或數(shù)學(xué)方法,對數(shù)據(jù)資料進(jìn)行整理、分析,并對數(shù)據(jù)的分布狀態(tài)、數(shù)字特征和隨機(jī)變量之間關(guān)系進(jìn)行估計(jì)和描述的方法。描述統(tǒng)計(jì)分為集中趨勢分析、離中趨勢分析和相關(guān)分析三大部分。

          1. 集中趨勢分析

          集中趨勢分析主要靠平均數(shù)、中數(shù)、眾數(shù)等統(tǒng)計(jì)指標(biāo)來表示數(shù)據(jù)的集中趨勢。例如被試的平均成績多少?是正偏分布還是負(fù)偏分布?

          2. 離中趨勢分析

          離中趨勢分析主要靠全距、四分差、平均差、方差(協(xié)方差:用來度量兩個(gè)隨機(jī)變量關(guān)系的統(tǒng)計(jì)量)、標(biāo)準(zhǔn)差等統(tǒng)計(jì)指標(biāo)來研究數(shù)據(jù)的離中趨勢。例如,我們想知道兩個(gè)教學(xué)班的語文成績中,哪個(gè)班級內(nèi)的成績分布更分散,就可以用兩個(gè)班級的四分差或百分點(diǎn)來比較。

          3. 相關(guān)分析

          相關(guān)分析探討數(shù)據(jù)之間是否具有統(tǒng)計(jì)學(xué)上的關(guān)聯(lián)性。這種關(guān)系既包括兩個(gè)數(shù)據(jù)之間的單一相關(guān)關(guān)系,如年齡與個(gè)人領(lǐng)域空間之間的關(guān)系,也包括多個(gè)數(shù)據(jù)之間的多重相關(guān)關(guān)系——如年齡、抑郁癥發(fā)生率、個(gè)人領(lǐng)域空間之間的關(guān)系;既包括A大B就大(小),A小B就小(大)的直線相關(guān)關(guān)系,也可以是復(fù)雜相關(guān)關(guān)系(A=Y-B*X);既可以是A、B變量同時(shí)增大這種正相關(guān)關(guān)系,也可以是A變量增大時(shí)B變量減小這種負(fù)相關(guān),還包括兩變量共同變化的緊密程度——即相關(guān)系數(shù)。

          實(shí)際上,相關(guān)關(guān)系唯一不研究的數(shù)據(jù)關(guān)系,就是數(shù)據(jù)協(xié)同變化的內(nèi)在根據(jù)——即因果關(guān)系。

          獲得相關(guān)系數(shù)有什么用呢?簡而言之,有了相關(guān)系數(shù),就可以根據(jù)回歸方程,進(jìn)行A變量到B變量的估算,這就是所謂的回歸分析,因此,相關(guān)分析是一種完整的統(tǒng)計(jì)研究方法,它貫穿于提出假設(shè),數(shù)據(jù)研究,數(shù)據(jù)分析,數(shù)據(jù)研究的始終。

          4. 推論統(tǒng)計(jì)

          推論統(tǒng)計(jì)是統(tǒng)計(jì)學(xué)乃至于心理統(tǒng)計(jì)學(xué)中較為年輕的一部分內(nèi)容。它以統(tǒng)計(jì)結(jié)果為依據(jù),來證明或推翻某個(gè)命題。具體來說,就是通過分析樣本與樣本分布的差異,來估算樣本與總體、同一樣本的前后測成績差異,樣本與樣本的成績差距、總體與總體的成績差距是否具有顯著性差異。

          正態(tài)性檢驗(yàn):很多統(tǒng)計(jì)方法都要求數(shù)值服從或近似服從正態(tài)分布,所以之前需要進(jìn)行正態(tài)性檢驗(yàn)。

          常用方法:非參數(shù)檢驗(yàn)的K-量檢驗(yàn)、P-P圖、Q-Q圖、W檢驗(yàn)、動(dòng)差法。



          二、假設(shè)檢驗(yàn)

          1. 參數(shù)檢驗(yàn)


          參數(shù)檢驗(yàn)是在已知總體分布的條件下(一般要求總體服從正態(tài)分布)對一些主要的參數(shù)(如均值、百分?jǐn)?shù)、方差、相關(guān)系數(shù)等)進(jìn)行的檢驗(yàn)。

          1)U驗(yàn) :使用條件:當(dāng)樣本含量n較大時(shí),樣本值符合正態(tài)分布
          2)T檢驗(yàn) 使用條件:當(dāng)樣本含量n較小時(shí),樣本值符合正態(tài)分布

          A:單樣本t檢驗(yàn):推斷該樣本來自的總體均數(shù)μ與已知的某一總體均數(shù)μ0 (常為理論值或標(biāo)準(zhǔn)值)有無差別;

          B:配對樣本t檢驗(yàn):當(dāng)總體均數(shù)未知時(shí),且兩個(gè)樣本可以配對,同對中的兩者在可能會(huì)影響處理效果的各種條件方面為相似;

          C:兩獨(dú)立樣本t檢驗(yàn):無法找到在各方面極為相似的兩樣本作配對比較時(shí)使用。

          2. 非參數(shù)檢驗(yàn)


          非參數(shù)檢驗(yàn)則不考慮總體分布是否已知,常常也不是針對總體參數(shù),而是針對總體的某些一股性假設(shè)(如總體分布的位罝是否相同,總體分布是否正態(tài))進(jìn)行檢驗(yàn)。

          適用情況:順序類型的數(shù)據(jù)資料,這類數(shù)據(jù)的分布形態(tài)一般是未知的。
          A:雖然是連續(xù)數(shù)據(jù),但總體分布形態(tài)未知或者非正態(tài);
          B:體分布雖然正態(tài),數(shù)據(jù)也是連續(xù)類型,但樣本容量極小,如10以下;

          主要方法包括:卡方檢驗(yàn)、秩和檢驗(yàn)、二項(xiàng)檢驗(yàn)、游程檢驗(yàn)、K-量檢驗(yàn)等


          三、信服分析

          介紹:信度(Reliability)即可靠性,它是指采用同樣的方法對同一對象重復(fù)測量時(shí)所得結(jié)果的一致性程度。?

          信度指標(biāo)多以相關(guān)系數(shù)表示,大致可分為三類:穩(wěn)定系數(shù)(跨時(shí)間的一致性),等值系數(shù)(跨形式的一致性)和內(nèi)在一致性系數(shù)(跨項(xiàng)目的一致性)。信度分析的方法主要有以下四種:重測信度法、復(fù)本信度法、折半信度法、α信度系數(shù)法。

          1.重測信度法編輯

          這一方法是用同樣的問卷對同一組被調(diào)查者間隔一定時(shí)間重復(fù)施測,計(jì)算兩次施測結(jié)果的相關(guān)系數(shù)。顯然,重測信度屬于穩(wěn)定系數(shù)。重測信度法特別適用于事實(shí)式問卷,如性別、出生年月等在兩次施測中不應(yīng)有任何差異,大多數(shù)被調(diào)查者的興趣、愛好、習(xí)慣等在短時(shí)間內(nèi)也不會(huì)有十分明顯的變化。如果沒有突發(fā)事件導(dǎo)致被調(diào)查者的態(tài)度、意見突變,這種方法也適用于態(tài)度、意見式問卷。由于重測信度法需要對同一樣本試測兩次,被調(diào)查者容易受到各種事件、活動(dòng)和他人的影響,而且間隔時(shí)間長短也有一定限制,因此在實(shí)施中有一定困難。

          2.復(fù)本信度法編輯

          讓同一組被調(diào)查者一次填答兩份問卷復(fù)本,計(jì)算兩個(gè)復(fù)本的相關(guān)系數(shù)。復(fù)本信度屬于等值系數(shù)。復(fù)本信度法要求兩個(gè)復(fù)本除表述方式不同外,在內(nèi)容、格式、難度和對應(yīng)題項(xiàng)的提問方向等方面要完全一致,而在實(shí)際調(diào)查中,很難使調(diào)查問卷達(dá)到這種要求,因此采用這種方法者較少。

          3.α信度系數(shù)法編輯

          α信度系數(shù)是目前最常用的信度系數(shù),其公式為:α=(k/(k-1))*(1-(∑Si^2)/ST^2)

          其中,K為量表中題項(xiàng)的總數(shù), Si^2為第i題得分的題內(nèi)方差, ST^2為全部題項(xiàng)總得分的方差。從公式中可以看出,α系數(shù)評價(jià)的是量表中各題項(xiàng)得分間的一致性,屬于內(nèi)在一致性系數(shù)。這種方法適用于態(tài)度、意見式問卷(量表)的信度分析。

          總量表的信度系數(shù)最好在0.8以上,0.7-0.8之間可以接受;分量表的信度系數(shù)最好在0.7以上,0.6-0.7還可以接受。Cronbach 's alpha系數(shù)如果在0.6以下就要考慮重新編問卷。

          檢査測量的可信度,例如調(diào)查問卷的真實(shí)性。
          分類:
          1. 外在信度:不同時(shí)間測量時(shí)量表的一致性程度,常用方法重測信度。
          2. 內(nèi)在信度:每個(gè)量表是否測量到單一的概念,同時(shí)組成兩表的內(nèi)在體項(xiàng)一致性如何,常用方法分半信度。


          四、列聯(lián)表分析

          列聯(lián)表是觀測數(shù)據(jù)按兩個(gè)或更多屬性(定性變量)分類時(shí)所列出的頻數(shù)表。

          列聯(lián)表又稱交互分類表,所謂交互分類,是指同時(shí)依據(jù)兩個(gè)變量的值,將所研究的個(gè)案分類。交互分類的目的是將兩變量分組,然后比較各組的分布狀況,以尋找變量間的關(guān)系。

          用于分析離散變量或定型變量之間是否存在相關(guān)。

          列聯(lián)表分析的基本問題是,判明所考察的各屬性之間有無關(guān)聯(lián),即是否獨(dú)立。如在前例中,問題是:一個(gè)人是否色盲與其性別是否有關(guān)?在r×с表中,若以pi、pj和pij分別表示總體中的個(gè)體屬于等級Ai,屬于等級Bj和同時(shí)屬于Ai、Bj的概率(pi,pj稱邊緣概率,pij稱格概率),“A、B兩屬性無關(guān)聯(lián)”的假設(shè)可以表述為H0:pij=pi·pj,(i=1,2,…,r;j=1,2,…,с),未知參數(shù)pij、pi、pj的最大似然估計(jì)(見點(diǎn)估計(jì))分別為行和及列和(統(tǒng)稱邊緣和)為樣本大小。

          根據(jù)K.皮爾森(1904)的擬合優(yōu)度檢驗(yàn)或似然比檢驗(yàn)(見假設(shè)檢驗(yàn)),當(dāng)h0成立,且一切pi>0和pj>0時(shí),統(tǒng)計(jì)量的漸近分布是自由度為(r-1)(с-1) 的Ⅹ分布,式中Eij=(ni·nj)/n稱為期望頻數(shù)。當(dāng)n足夠大,且表中各格的Eij都不太小時(shí),可以據(jù)此對h0作檢驗(yàn):若Ⅹ值足夠大,就拒絕假設(shè)h0,即認(rèn)為A與B有關(guān)聯(lián)。在前面的色覺問題中,曾按此檢驗(yàn),判定出性別與色覺之間存在某種關(guān)聯(lián)。

          需要注意:若樣本大小n不是很大,則上述基于漸近分布的方法就不適用。對此,在四格表情形,R.A.費(fèi)希爾(1935)提出了一種適用于所有n的精確檢驗(yàn)法。其思想是在固定各邊緣和的條件下,根據(jù)超幾何分布(見概率分布),可以計(jì)算觀測頻數(shù)出現(xiàn)任意一種特定排列的條件概率。把實(shí)際出現(xiàn)的觀測頻數(shù)排列,以及比它呈現(xiàn)更多關(guān)聯(lián)跡象的所有可能排列的條件概率都算出來并相加,若所得結(jié)果小于給定的顯著性水平,則判定所考慮的兩個(gè)屬性存在關(guān)聯(lián),從而拒絕h0。

          對于二維表,可進(jìn)行卡方檢驗(yàn),對于三維表,可作Mentel-Hanszel分層分析。

          列聯(lián)表分析還包括配對計(jì)數(shù)資料的卡方檢驗(yàn)、行列均為順序變量的相關(guān)檢驗(yàn)。



          五、相關(guān)分析

          研究現(xiàn)象之間是否存在某種依存關(guān)系,對具體有依存關(guān)系的現(xiàn)象探討相關(guān)方向及相關(guān)程度。

          1. 單相關(guān):兩個(gè)因素之間的相關(guān)關(guān)系叫單相關(guān),即研究時(shí)只涉及一個(gè)自變量和一個(gè)因變量;
          2. 復(fù)相關(guān) :三個(gè)或三個(gè)以上因素的相關(guān)關(guān)系叫復(fù)相關(guān),即研究時(shí)涉及兩個(gè)或兩個(gè)以上的自變量和因變量相關(guān);
          3. 偏相關(guān):在某一現(xiàn)象與多種現(xiàn)象相關(guān)的場合,當(dāng)假定其他變量不變時(shí),其中兩個(gè)變量之間的相關(guān)關(guān)系稱為偏相關(guān)。



          六、方差分析

          使用條件:各樣本須是相互獨(dú)立的隨機(jī)樣本;各樣本來自正態(tài)分布總體;各總體方差相等。

          分類:
          1. 單因素方差分析:一項(xiàng)試驗(yàn)只有一個(gè)影響因素,或者存在多個(gè)影響因素時(shí),只分析一個(gè)因素與響應(yīng)變量的關(guān)系

          2. 多因素有交互方差分析:一項(xiàng)實(shí)驗(yàn)有多個(gè)影響因素,分析多個(gè)影響因素與響應(yīng)變量的關(guān)系,同時(shí)考慮多個(gè)影響因素之間的關(guān)系

          3. 多因素?zé)o交互方差分析:分析多個(gè)影響因素與響應(yīng)變量的關(guān)系,但是影響因素之間沒有影響關(guān)系或忽略影響關(guān)系

          4. 協(xié)方差分析:傳統(tǒng)的方差分析存在明顯的弊端,無法控制分析中存在的某些隨機(jī)因素,使之影響了分析結(jié)果的準(zhǔn)確度。協(xié)方差分析主要是在排除了協(xié)變量的影響后再對修正后的主效應(yīng)進(jìn)行方差分析,是將線性回歸與方差分析結(jié)合起來的一種分析方法。



          七、回歸分析

          1. 一元線性回歸分析

          只有一個(gè)自變量X與因變量Y有關(guān),X與Y都必須是連續(xù)型變量,因變量y或其殘差必須服從正態(tài)分布。

          2. 多元線性回歸分析使用條件

          分析多個(gè)自變量與因變量Y的關(guān)系,X與Y都必須是連續(xù)型變量,因變量y或其殘差必須服從正態(tài)分布 。

          變量篩選方式:選擇最優(yōu)回歸方程的變量篩選法包括全橫型法(CP法)、逐步回歸法,向前引入法和向后剔除法

          橫型診斷方法

          殘差檢驗(yàn):觀測值與估計(jì)值的差值要跟從正態(tài)分布

          強(qiáng)影響點(diǎn)判斷:尋找方式一般分為標(biāo)準(zhǔn)誤差法、Mahalanobis距離法

          共線性診斷:診斷方式:容忍度、方差擴(kuò)大因子法(又稱膨脹系數(shù)VIF)、特征根判定法、條件指針CI、方差比例,處理方法:增加樣本容量或選取另外的回歸如主成分回歸等


          3. Logistic回歸分析

          線性回歸模型要求因變量是連續(xù)的正態(tài)分布變量,且自變量和因變量呈線性關(guān)系,而Logistic回歸模型對因變量的分布沒有要求,一般用于因變量是離散時(shí)的情況

          分類:
          Logistic回歸模型有條件與非條件之分,條件Logistic回歸模型和非條件Logistic回歸模型的區(qū)別在于參數(shù)的估計(jì)是否用到了條件概率。

          4. 其他回歸方法

          非線性回歸、有序回歸、Probit回歸、加權(quán)回歸等。

          推薦閱讀

          (點(diǎn)擊標(biāo)題可跳轉(zhuǎn)閱讀)

          貝葉斯:沒有人比我更懂南京市長江大橋

          華為提出十大數(shù)學(xué)挑戰(zhàn)!解出一個(gè)就是年薪百萬!

          七種回歸分析方法,個(gè) 個(gè) 經(jīng) 典

          15分鐘入門蒙特卡洛 Monte Carlo

          機(jī) 器 學(xué) 習(xí) 算 法 沒 那 么 重 要

          瀏覽 63
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  青娱乐凹凸 | 操骚屄午夜视频 | 亚洲第一A片 | 久久夜色精品亚洲 | 99久久毛片 |