<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          如何通俗的理解協(xié)方差、相關(guān)系數(shù)?

          共 2501字,需瀏覽 6分鐘

           ·

          2021-10-12 18:57

          點(diǎn)擊上方機(jī)器學(xué)習(xí)與生成對(duì)抗網(wǎng)絡(luò)”,關(guān)注星標(biāo)

          獲取有趣、好玩的前沿干貨!

          來(lái)源:硬數(shù)據(jù)?侵刪


          Part1 方差


          之前介紹了方差是用來(lái)刻畫(huà)數(shù)據(jù)波動(dòng)性的統(tǒng)計(jì)量,那么協(xié)方差就是描述兩個(gè)變量之間的變動(dòng)關(guān)系。

          通俗地理解為:兩個(gè)變量是同向變化?還是反向變化?同向或反向程度有多少?

          X變大,Y也變大,說(shuō)明兩個(gè)變量是同向變化的,這時(shí)協(xié)方差就是正的。
          X變大,Y變小,說(shuō)明兩個(gè)變量是反向變化的,這時(shí)協(xié)方差就是負(fù)的。
          并且從數(shù)值大小來(lái)看,協(xié)方差的絕對(duì)值越大,則兩個(gè)變量同向或反向的程度也越大,即有較強(qiáng)的相關(guān)。


          公式的計(jì)算很簡(jiǎn)單,每個(gè)X與其均值之差乘以Y與其均值之差得到一個(gè)乘積,再將其都加起來(lái)求個(gè)均值即可。

          比如有兩個(gè)變量X,Y,觀察7個(gè)樣本,畫(huà)出他們的變化情況,并且很明顯是同向變化的。
          可以發(fā)現(xiàn)每一時(shí)刻的值與的值的正負(fù)號(hào)相同(比如t1時(shí)刻,他們同為正,t2時(shí)刻他們同為負(fù)):
          于是當(dāng)他們同向變化時(shí),的乘積為正。這樣,當(dāng)你把7個(gè)時(shí)刻的乘積加在一起,求平均后也就是正數(shù)了。

          如果反向運(yùn)動(dòng)

          很明顯,的值與的值的正負(fù)號(hào)相反,于是其乘積就是負(fù)值,計(jì)算出來(lái)的協(xié)方差也就是負(fù)數(shù)了。

          上面說(shuō)的兩種情況比較特殊,很多時(shí)候XY兩個(gè)變量的變動(dòng)沒(méi)有規(guī)律,比如:

          這種情況下某些的值與的值乘積為正,某些的值與的值乘積為負(fù)。

          加在一起后,其中的一些正負(fù)項(xiàng)就會(huì)抵消掉,最后平均得出的值就是協(xié)方差,通過(guò)協(xié)方差的數(shù)值大小,就可以判斷這兩個(gè)變量同向或反向的程度了。

          所以,在7個(gè)樣本中,的乘積為正的越多,說(shuō)明同向變化的次數(shù)越多,亦即同向程度越高,反之亦然。

          總而言之,
          若協(xié)方差為正,則X和Y同向變化;
          反之協(xié)方差為負(fù),則反向變化;
          協(xié)方差絕對(duì)值越大表示同向或反向的程度越深。

          其實(shí)方差也是一種特殊的協(xié)方差,只不過(guò)是X和X之間的協(xié)方差。



          Part2 相關(guān)系數(shù)


          相關(guān)系數(shù)的公式為:



          其實(shí)就是用X、Y的協(xié)方差除以X和Y的標(biāo)準(zhǔn)差。

          所以相關(guān)系數(shù)可以看成剔除了兩個(gè)變量單位的影響、標(biāo)準(zhǔn)化后的特殊協(xié)方差。它可以反映兩個(gè)變量變化是同向還是反向的,同向?yàn)檎聪驗(yàn)樨?fù)。

          并且它又是標(biāo)準(zhǔn)化后的協(xié)方差,則它出現(xiàn)最重要的目的來(lái)了,就是消除兩個(gè)變量單位的影響,使得不同變量的相關(guān)系數(shù)之間具有可比性。

          比如下面兩種情況,關(guān)注一下縱軸的刻度:


          很容易可以看出兩種情況下X和Y都是同向變化的,并且它們變化的方式都大致相同,在特定的樣本點(diǎn)同為正或同為負(fù),那么它們理應(yīng)具有相同的相關(guān)關(guān)系。于是可以計(jì)算一下他們的協(xié)方差:

          第一種情況下:

          [(100-0)×(70-0)+(-100-0)×(-70-0)+(-200-0)×(-200-0)…]÷7≈15428.57

          第二種情況下:

          [(0.01-0)×(70-0)+(-0.01-0)×(-70-0)+(-0.02-0)×(-200-0)…]÷7≈1.542857

          協(xié)方差差了一萬(wàn)倍,只能看出兩種情況都是正相關(guān)的,但是我們能說(shuō)第一種情況就相關(guān)性更強(qiáng)嗎?

          在上面兩種情況中,雖然X和Y的變化方向都相同,但是每次變化的幅度不相同,主要原因是單位的不一致引起的。

          所以,為了能準(zhǔn)確比較兩個(gè)變量的相關(guān)程度,我們就要把變化幅度對(duì)協(xié)方差的影響中剔除掉,也就是要去掉單位的影響,于是就要使用相關(guān)系數(shù)。

          那么如何剔除變量變化幅度的影響呢?很自然的就應(yīng)該使用前面提到的方差和標(biāo)準(zhǔn)差了!

          相關(guān)系數(shù)是協(xié)方差除以標(biāo)準(zhǔn)差,當(dāng)X或Y的波動(dòng)變大的時(shí)候,它們的協(xié)方差會(huì)變大,標(biāo)準(zhǔn)差也會(huì)變大,這樣相關(guān)系數(shù)的分子分母都變大,相互抵消,變小時(shí)也亦然。

          于是相關(guān)系數(shù)不像協(xié)方差一樣可以在實(shí)數(shù)域上取值,它只能在+1到-1之間變化,具體為什么是+1和-1,可以自行Google柯西-斯瓦茨不等式。

          總之,對(duì)于兩個(gè)變量X、Y,

          當(dāng)他們的相關(guān)系數(shù)為1時(shí),說(shuō)明兩個(gè)變量線性相關(guān)程度最大,兩個(gè)變量存在線性關(guān)系。
          隨著相關(guān)系數(shù)減小,兩個(gè)變量相關(guān)程度也變小。
          當(dāng)相關(guān)系數(shù)為0時(shí),兩個(gè)變量的線性無(wú)關(guān),但要注意,無(wú)關(guān)不一定獨(dú)立。
          當(dāng)相關(guān)系數(shù)繼續(xù)變小,小于0時(shí),兩個(gè)變量開(kāi)始出現(xiàn)反向相關(guān)。
          當(dāng)相關(guān)系數(shù)為-1時(shí),說(shuō)明兩個(gè)變量線性相關(guān)程度也最強(qiáng),不過(guò)是相反的線性相關(guān),反相變化。

          讓我們?cè)倩氐角懊鎄和Y的例子,用相關(guān)系數(shù)來(lái)衡量相關(guān)程度:

          X的標(biāo)準(zhǔn)差為


          Y的標(biāo)準(zhǔn)差為


          于是相關(guān)系數(shù)為


          說(shuō)明第一種情況下,X和Y有極強(qiáng)的相關(guān)性,幾乎是線性相關(guān)。

          那第二種情況:

          X的標(biāo)準(zhǔn)差為


          Y的標(biāo)準(zhǔn)差為


          于是相關(guān)系數(shù)為


          在第二種情況下,X的標(biāo)準(zhǔn)差較第一種小了10000倍,即變化幅度小了,但是并不改變X和Y線性高度相關(guān)的事實(shí)。

          兩種情況的相關(guān)系數(shù)相等,X和Y具有相同的相關(guān)性,故而使用相關(guān)系數(shù)來(lái)衡量和比較相關(guān)性,要比協(xié)方差合適很多。

          在第二種情況下,X的標(biāo)準(zhǔn)差較第一種小了10000倍,即變化幅度小了,但是并不改變X和Y線性高度相關(guān)的事實(shí)。

          兩種情況的相關(guān)系數(shù)相等,X和Y具有相同的相關(guān)性,故而使用相關(guān)系數(shù)來(lái)衡量和比較相關(guān)性,要比協(xié)方差合適很多。


          猜您喜歡:

          等你著陸!【GAN生成對(duì)抗網(wǎng)絡(luò)】知識(shí)星球!

          CVPR 2021專(zhuān)題1:GAN的改進(jìn)

          CVPR 2021 | GAN的說(shuō)話人驅(qū)動(dòng)、3D人臉論文匯總

          CVPR 2021 | 圖像轉(zhuǎn)換 今如何?幾篇GAN論文

          【CVPR 2021】通過(guò)GAN提升人臉識(shí)別的遺留難題

          CVPR 2021生成對(duì)抗網(wǎng)絡(luò)GAN部分論文匯總

          經(jīng)典GAN不得不讀:StyleGAN

          最新最全20篇!基于 StyleGAN 改進(jìn)或應(yīng)用相關(guān)論文

          超100篇!CVPR 2020最全GAN論文梳理匯總!

          附下載 | 《Python進(jìn)階》中文版

          附下載 | 經(jīng)典《Think Python》中文版

          附下載 | 《Pytorch模型訓(xùn)練實(shí)用教程》

          附下載 | 最新2020李沐《動(dòng)手學(xué)深度學(xué)習(xí)》

          附下載 |?《可解釋的機(jī)器學(xué)習(xí)》中文版

          附下載 |《TensorFlow 2.0 深度學(xué)習(xí)算法實(shí)戰(zhàn)》

          附下載 | 超100篇!CVPR 2020最全GAN論文梳理匯總!

          附下載 |《計(jì)算機(jī)視覺(jué)中的數(shù)學(xué)方法》分享

          瀏覽 32
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  欧美撸一撸 | 操逼激情网 | 欧洲肥屄黑人又大又长 | 大香蕉超碰 | 日韩精品国产一区二区 |