<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          做數(shù)據(jù)分析,需要懂多少統(tǒng)計(jì)學(xué)

          共 2445字,需瀏覽 5分鐘

           ·

          2021-10-17 18:44

          ↑ 點(diǎn)擊上方 “碼工小熊” 關(guān)注 + 星標(biāo) ~ 
          第一時(shí)間獲取最新內(nèi)容哦  

          大家好,我是愛學(xué)習(xí)的xiong熊妹

          很多小伙伴會(huì)問:做數(shù)據(jù)分析,需要懂多少統(tǒng)計(jì)學(xué)知識(shí)?今天簡單跟大家分享一下。

          一、統(tǒng)計(jì)學(xué)是個(gè)啥

          統(tǒng)計(jì)學(xué)是個(gè)歷史悠久的學(xué)科,有著300年以上歷史。隨著近代科學(xué)的發(fā)展,人們不再滿足于“普天之下”“眾所周知”這一類含糊的描述,希望用精確的數(shù)據(jù)來描述事物,因此誕生了描述性統(tǒng)計(jì)(descriptive statistics)。

          這是統(tǒng)計(jì)學(xué)最早,也是最普遍的應(yīng)用。我們經(jīng)常說的平均數(shù)、中位數(shù)、眾數(shù)等等概念,都是描述性統(tǒng)計(jì)的概念。

          另一方面,人們發(fā)現(xiàn):獲得數(shù)據(jù)太難了!尤其在300年前,遍地文盲,口述手抄的時(shí)代,想獲取數(shù)據(jù)難如登天。怎么辦呢?人們開始思考:能否從總體中,抽一些樣本,通過樣本情況推斷總體情況。這樣就一定程度上解決了數(shù)據(jù)獲取難的問題,是所謂的推斷性統(tǒng)計(jì)(inferential statistics)。

          上過《統(tǒng)計(jì)學(xué)》課的小伙伴,都對(duì)假設(shè)檢驗(yàn)、統(tǒng)計(jì)量、分布函數(shù)等概念記憶深刻。這些東西很難搞懂,實(shí)際工作中似乎又很少用到。因?yàn)檫@些東西,都是推斷性統(tǒng)計(jì)的概念。

          二、統(tǒng)計(jì)學(xué)有哪些內(nèi)容

          隨便百度一本統(tǒng)計(jì)學(xué)術(shù)的目錄,可以看到,有以下章節(jié)(如下圖)


          其實(shí)大部分統(tǒng)計(jì)學(xué)書都是這么布局的,大同小異。一般四大部分
          • 第一部分:描述性統(tǒng)計(jì)。
          • 第二部分:概率與抽樣。
          • 第三部分:假設(shè)檢驗(yàn)。
          • 第四部分:統(tǒng)計(jì)模型。(如下圖)


          那么,到底需要掌握多少呢?

          三、初級(jí)數(shù)據(jù)分析師,要掌握哪些

          第一部分描述性統(tǒng)計(jì)是人人必會(huì)的。因?yàn)檫@是做數(shù)據(jù)分析的最基礎(chǔ)知識(shí)和基本概念,不管做什么工作都要用到。而且這一部分概念簡單,很容易掌握。所以入門的新人,最好人手必備
          包括
          • 基礎(chǔ)變量概念(連續(xù)、定序、分類)
          • 描述集中程度(均值、中位數(shù)、眾數(shù))
          • 描述離散程度(平均差、方差、標(biāo)準(zhǔn)差)
          • 描述數(shù)據(jù)分布形態(tài)(箱型圖)
          • 數(shù)據(jù)圖形展示(8種基礎(chǔ)圖形)

          很多基礎(chǔ)的數(shù)據(jù)分析方法,比如分層分析、矩陣分析等,其實(shí)就是描述性統(tǒng)計(jì)+數(shù)據(jù)交叉表。所以如果真的是小白入行,統(tǒng)計(jì)學(xué)數(shù)一般看到前四章就能打住了。不用自己難為自己。

          當(dāng)掌握基礎(chǔ)知識(shí),要參加面試的時(shí)候,可以適當(dāng)補(bǔ)充第二部分:概率與抽樣的知識(shí)。并非因?yàn)檫@一部分用處多,而是很多企業(yè)喜歡在面試時(shí)候問這些問題(就是一個(gè)字:卷)。學(xué)這一部分,最好的辦法是對(duì)著章節(jié)后邊的習(xí)題做。做對(duì)題,通過面試是第一目標(biāo)。

          四、中級(jí)數(shù)據(jù)分析師,要掌握哪些

          第三部分知識(shí),是中級(jí)以后數(shù)據(jù)分析師要掌握的。因?yàn)檫@一部分,講的是用抽樣方法做統(tǒng)計(jì)推斷。實(shí)際工作中,大部分場景不需要做抽樣。比如統(tǒng)計(jì)銷售、運(yùn)營、產(chǎn)品情況,都是全量統(tǒng)計(jì),很少做抽樣。只有特定場景需要

          最典型的就是質(zhì)量檢測(cè)。比如檢查產(chǎn)品的使用壽命、耐用程度、物理強(qiáng)度等指標(biāo),就一定得對(duì)產(chǎn)品做破壞性檢測(cè)。這就意味著不可能100%檢測(cè),一定得抽樣。類似的場景,在供應(yīng)鏈上還有很多,比如檢測(cè)生產(chǎn)線生產(chǎn)質(zhì)量,比如檢測(cè)藥品服用效果等等。

          之所以在供應(yīng)鏈應(yīng)用多,還有一個(gè)深層次原因,就是:供應(yīng)鏈的檢測(cè),檢測(cè)的是一個(gè)有固定物理/化學(xué)屬性的事物這樣有可能通過小樣本抽樣,推斷出總體的物理/化學(xué)屬性。這樣使得抽樣檢測(cè)的結(jié)果很穩(wěn)定,有指導(dǎo)意義。

          在營銷端也有類似應(yīng)用,一般是用在未上線的產(chǎn)品/概念/價(jià)格。比如傳統(tǒng)企業(yè)流行的包裝測(cè)試/口味測(cè)試/價(jià)格彈性測(cè)試,或者互聯(lián)網(wǎng)企業(yè)流行的ABtest因?yàn)檫@些測(cè)試,都是挑選一小批用戶參與測(cè)試,因此涉及小樣本推斷總體情況的判斷,就得用到概率和假設(shè)檢驗(yàn)。

          但要注意的是:抽樣方法,往往和具體業(yè)務(wù)場景捆綁緊密。都是抽樣,質(zhì)檢端可能就是按產(chǎn)品編號(hào)抽;調(diào)研則得先攔截受訪者,再甄別特征;互聯(lián)網(wǎng)產(chǎn)品的ABtest,則是先對(duì)流量做分桶。因此孤零零看統(tǒng)計(jì)學(xué)知識(shí),無法滿足實(shí)際工作需要,得結(jié)合具體業(yè)務(wù)場景學(xué)習(xí)才行。

          五、高級(jí)數(shù)據(jù)分析師,要掌握哪些

          第四部分回歸/預(yù)測(cè)模型,建議緩看。因?yàn)檫@一部分涉及知識(shí)量大,且平時(shí)工作中不怎么用得上,并且現(xiàn)在機(jī)器學(xué)習(xí)流行,其計(jì)算模型思路和統(tǒng)計(jì)學(xué)不太一樣。所以這一部分,建議在自己已經(jīng)有積累情況下再看。

          另一個(gè)問題是:統(tǒng)計(jì)模型經(jīng)常被錯(cuò)用、亂用。特別是相關(guān)分析和回歸分析,因?yàn)檫@兩個(gè)非常簡單,用excel就能做,所以經(jīng)常被一知半解的小白拿出來亂用。結(jié)果,要么是業(yè)務(wù)表示看不懂,不認(rèn)可;要么是做的錯(cuò)誤百出,無法自圓其說。所以新人真的慎用。

          如果新人真的想看這一塊,建議只看時(shí)間序列預(yù)測(cè)。因?yàn)闀r(shí)間序列預(yù)測(cè)使用范圍非常廣,特別適合領(lǐng)導(dǎo)扔幾個(gè)數(shù)據(jù)過來,讓我們“做個(gè)預(yù)測(cè)看看”的場景。至于其他方法,建議找個(gè)現(xiàn)成的工具(比如SPSS),把數(shù)據(jù)懟進(jìn)去,然后對(duì)著輸出參數(shù)做解讀。

          以上就是我個(gè)人在工作中運(yùn)用心得,供大家參考。估計(jì)有小伙伴會(huì)表示:“小熊妹,你這完全不夠呀!最近招聘越來越內(nèi)卷了,問的統(tǒng)計(jì)學(xué)知識(shí)越來越多,咋辦!”從我的面試經(jīng)歷看,一般這些卷王們,喜歡卷三個(gè)話題:
          • ABtest(涉及假設(shè)檢驗(yàn)、抽樣)
          • 因果推斷(涉及統(tǒng)計(jì)推斷、控制變量)
          • 預(yù)測(cè)模型(時(shí)間序列/因果關(guān)系模型)

          這個(gè)只能見招拆招了,大家感興趣的話,記得點(diǎn)贊+轉(zhuǎn)發(fā)+在看,支持下小熊妹,我后邊專門分享這三個(gè)話題哦,謝謝大家。



          往期精彩回顧
          九大數(shù)據(jù)分析方法之:周期性分析法
          九大數(shù)據(jù)分析方法:結(jié)構(gòu)分析法
          九大數(shù)據(jù)分析方法:矩陣分析法
          九大數(shù)據(jù)分析方法:分層分析法
          3分鐘,看懂ABtest基本原理
          3分鐘,看懂假設(shè)檢驗(yàn)
          3分鐘,看懂區(qū)間估計(jì)and置信區(qū)間
          統(tǒng)計(jì)學(xué)資料領(lǐng)取


          大彩蛋,想進(jìn)一步了解統(tǒng)計(jì)學(xué)的盆友們,小熊妹給大家找來了《深入淺出統(tǒng)計(jì)學(xué)》的PDF版哦。關(guān)注公眾號(hào)【碼工小熊】,在會(huì)話欄回復(fù)統(tǒng)計(jì)學(xué)即可獲取哦!

          另外,掃碼可添加小熊妹微信,交流學(xué)習(xí)數(shù)據(jù)知識(shí)哦。

          瀏覽 49
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  五月天欧美色图 | 藤浦惠一区二区三区免费观看 | 看黄在线网站 | www.少妇| 99视频在线免费观看 |