七種回歸分析方法 個(gè)個(gè)經(jīng)典
日期:2020年09月23日
正文共:4127字6圖
預(yù)計(jì)閱讀時(shí)間:11分鐘
來源:Sunli day

它表明自變量和因變量之間的顯著關(guān)系;
它表明多個(gè)自變量對一個(gè)因變量的影響強(qiáng)度。



要點(diǎn): 1.自變量與因變量之間必須有線性關(guān)系 2.多元回歸存在多重共線性,自相關(guān)性和異方差性。 3.線性回歸對異常值非常敏感。它會(huì)嚴(yán)重影響回歸線,最終影響預(yù)測值。 4.多重共線性會(huì)增加系數(shù)估計(jì)值的方差,使得在模型輕微變化下,估計(jì)非常敏感。結(jié)果就是系數(shù)估計(jì)值不穩(wěn)定 5.在多個(gè)自變量的情況下,我們可以使用向前選擇法,向后剔除法和逐步篩選法來選擇最重要的自變量。

要點(diǎn): 1.它廣泛的用于分類問題。 2.邏輯回歸不要求自變量和因變量是線性關(guān)系。它可以處理各種類型的關(guān)系,因?yàn)樗鼘︻A(yù)測的相對風(fēng)險(xiǎn)指數(shù)OR使用了一個(gè)非線性的log轉(zhuǎn)換。 3.為了避免過擬合和欠擬合,我們應(yīng)該包括所有重要的變量。有一個(gè)很好的方法來確保這種情況,就是使用逐步篩選方法來估計(jì)邏輯回歸。 4.它需要大的樣本量,因?yàn)樵跇颖緮?shù)量較少的情況下,極大似然估計(jì)的效果比普通的最小二乘法差。 5.自變量不應(yīng)該相互關(guān)聯(lián)的,即不具有多重共線性。然而,在分析和建模中,我們可以選擇包含分類變量相互作用的影響。 6.如果因變量的值是定序變量,則稱它為序邏輯回歸。 7.如果因變量是多類的話,則稱它為多元邏輯回歸。

重點(diǎn): 雖然會(huì)有一個(gè)誘導(dǎo)可以擬合一個(gè)高次多項(xiàng)式并得到較低的錯(cuò)誤,但這可能會(huì)導(dǎo)致過擬合。你需要經(jīng)常畫出關(guān)系圖來查看擬合情況,并且專注于保證擬合合理,既沒有過擬合又沒有欠擬合。

標(biāo)準(zhǔn)逐步回歸法做兩件事情。即增加和刪除每個(gè)步驟所需的預(yù)測。
向前選擇法從模型中最顯著的預(yù)測開始,然后為每一步添加變量。
向后剔除法與模型的所有預(yù)測同時(shí)開始,然后在每一步消除最小顯著性的變量。

要點(diǎn): 1.除常數(shù)項(xiàng)以外,這種回歸的假設(shè)與最小二乘回歸類似; 2.它收縮了相關(guān)系數(shù)的值,但沒有達(dá)到零,這表明它沒有特征選擇功能 3.這是一個(gè)正則化方法,并且使用的是L2正則化。

要點(diǎn): 1.除常數(shù)項(xiàng)以外,這種回歸的假設(shè)與最小二乘回歸類似; 2.它收縮系數(shù)接近零(等于零),這確實(shí)有助于特征選擇; 3.這是一個(gè)正則化方法,使用的是L1正則化; 如果預(yù)測的一組變量是高度相關(guān)的,Lasso 會(huì)選出其中一個(gè)變量并且將其它的收縮為零。

要點(diǎn): 1.在高度相關(guān)變量的情況下,它會(huì)產(chǎn)生群體效應(yīng); 2.選擇變量的數(shù)目沒有限制; 3.它可以承受雙重收縮。
—?THE END —

評(píng)論
圖片
表情
