<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          大數(shù)據(jù)分析,到底分析了啥?

          共 3058字,需瀏覽 7分鐘

           ·

          2022-05-20 13:08

          “大數(shù)據(jù)”仨字已經(jīng)被喊爛了,“大數(shù)據(jù)分析”也經(jīng)常被人提起。可到底咋完全是“大數(shù)據(jù)分析”?為啥大家喊得很多,平時(shí)工作中很少感受得到?今天系統(tǒng)講解一下。


          01
          普通人理解的“大數(shù)據(jù)”


          普通人理解的大數(shù)據(jù)可謂千奇百怪,比如:


          1、一個(gè)excel文件 200M,多大的數(shù)據(jù)呀!
          2、我國(guó)人口14億,這個(gè)數(shù)據(jù)好大呀!
          3、臥槽,我剛看了車(chē),就有4S店推廣電話(huà),肯定收集了我的大數(shù)據(jù)
          ……


          這些千奇百怪的理解,都是來(lái)自對(duì)“數(shù)據(jù)”本身不夠了解導(dǎo)致的。想整明白“大數(shù)據(jù)”真正的含義,得從數(shù)據(jù)是從哪里來(lái)的講起。


          02
          先理解“小數(shù)據(jù)”,再談“大數(shù)據(jù)”


          最原始的數(shù)據(jù)采集方式就是:?jiǎn)柧?。由?zhuān)門(mén)的調(diào)查人員,借助一張張調(diào)查問(wèn)卷,通過(guò)現(xiàn)場(chǎng)詢(xún)問(wèn)、測(cè)量等方式獲得數(shù)據(jù)。這種方法已經(jīng)沿用了400多年,經(jīng)典的統(tǒng)計(jì)學(xué)、管理學(xué)理論都是建立在此之上的(如下圖)。



          小數(shù)據(jù)有沒(méi)用?有用!非常有用!


          能采集到某個(gè)地區(qū)的數(shù)據(jù),代表著政府對(duì)這個(gè)地區(qū)有統(tǒng)治力。
          能采集到越多的數(shù)據(jù),中央就能掌握地方情況,從而加強(qiáng)管理。
          ?

          數(shù)據(jù)是如此重要,以至于歷史上很長(zhǎng)一段時(shí)間,統(tǒng)計(jì)任務(wù)歸屬于政府、軍隊(duì)、情報(bào)機(jī)關(guān)。我國(guó)的第一家調(diào)查公司還是在90年代初,在寶潔強(qiáng)烈要求下成立的。


          但是,調(diào)研做法有三個(gè)明顯的問(wèn)題:


          1、非常耗費(fèi)人力。訪(fǎng)問(wèn)員、督導(dǎo)、審核、錄入、數(shù)據(jù)處理……都是人

          2、非常耗費(fèi)時(shí)間。設(shè)計(jì)問(wèn)卷、填寫(xiě)、回收、都是時(shí)間

          3、準(zhǔn)確度低?,F(xiàn)場(chǎng)測(cè)量的數(shù)據(jù)會(huì)相對(duì)準(zhǔn),但口頭問(wèn)回來(lái)的大部分都不準(zhǔn)

          ?


          這些問(wèn)題,導(dǎo)致了問(wèn)卷時(shí)代的數(shù)據(jù)采集,只能有抽樣式的,不能是全量采集。也因此衍生出了專(zhuān)門(mén)的抽樣理論和方法。但無(wú)論數(shù)據(jù)方法怎么改進(jìn),在業(yè)務(wù)上,抽樣,始終是一個(gè)難以逾越的梗阻。決策者總會(huì)覺(jué)得:


          1、是不是樣本量太少
          2、是不是代表性不夠
          3、沒(méi)有覆蓋的樣本是不是真的一致
          ?

          只要是抽樣數(shù)據(jù),就一定會(huì)被質(zhì)疑,就總是充滿(mǎn)懷疑。這也是最初“小數(shù)據(jù)”的說(shuō)法來(lái)源,后續(xù)所有“大數(shù)據(jù)”其實(shí)都是圍繞“小數(shù)據(jù)”問(wèn)題而來(lái)。


          數(shù)據(jù)變大第一步:系統(tǒng)采集


          數(shù)據(jù)從小變大的第一步,從系統(tǒng)采集開(kāi)始。比如企業(yè)擴(kuò)大規(guī)模,要在各地建連鎖店,第一步做得就是裝POS機(jī),把交易數(shù)據(jù)采集進(jìn)來(lái),替代紙質(zhì)訂貨單/出貨單。此時(shí)想了解銷(xiāo)售數(shù)據(jù),是可以基于POS機(jī)收集的數(shù)據(jù)全量查看的(如下圖)。



          從抽樣數(shù)據(jù)到全量數(shù)據(jù),是一個(gè)質(zhì)的變化?;谌繑?shù)據(jù),可以直接管理到各個(gè)終端門(mén)店,直接基于數(shù)據(jù)作出經(jīng)營(yíng)決策。因此大部分企業(yè)的銷(xiāo)售分析、經(jīng)營(yíng)分析、業(yè)務(wù)分析體系,都是在此基礎(chǔ)之上建立起來(lái)的(如下圖)。



          但是這個(gè)階段的局限也是很明顯的:POS機(jī)只能記錄交易結(jié)果,對(duì)過(guò)程一概不知。誰(shuí)在買(mǎi),買(mǎi)了多少,為啥買(mǎi),通通不清楚。


          這個(gè)階段的分析,是典型的知其然,不知其所以然的分析,大部分分析只能通過(guò)成交結(jié)果去猜。如果只有這個(gè)階段的數(shù)據(jù),想做深入分析,還是得依靠調(diào)研。比如傳統(tǒng)企業(yè)想了解門(mén)店成交流程,會(huì)做門(mén)店調(diào)查,研究消費(fèi)者在門(mén)店的動(dòng)線(xiàn),詢(xún)問(wèn)消費(fèi)者體驗(yàn)。


          數(shù)據(jù)變大第二步:主動(dòng)采集


          有了系統(tǒng)采集以后,大家自然地會(huì)想:除了交易數(shù)據(jù),其他數(shù)據(jù)也能通過(guò)系統(tǒng)化采集。比如最簡(jiǎn)單的形式:讓用戶(hù)自己交身份證,通過(guò)圖像識(shí)別錄入。這樣既能采集到用戶(hù)數(shù)據(jù),又能避免手動(dòng)填寫(xiě)的錯(cuò)誤。


          但是問(wèn)題來(lái)了:憑啥要交身份證給你呀!于是傳統(tǒng)采集,只有銀行、航空、通訊等有國(guó)家背景+法律規(guī)范要求的地方,才能相對(duì)準(zhǔn)確的采集這些真實(shí)數(shù)據(jù)。



          不過(guò)這些困難并沒(méi)有阻擋住企業(yè)采集信息的熱情。常見(jiàn)的手段,比如:勾引用戶(hù)辦會(huì)員卡,給生日禮遇讓用戶(hù)填寫(xiě)生日。用戶(hù)完成信息給積分獎(jiǎng)勵(lì)之類(lèi)。更激進(jìn)的,甚至有常識(shí)在門(mén)店裝人臉識(shí)別、裝眼動(dòng)儀跟蹤設(shè)備來(lái)采集數(shù)據(jù)(當(dāng)然,成本很高)。


          為什么企業(yè)會(huì)孜孜不倦追求這些數(shù)據(jù),因?yàn)檫@些數(shù)據(jù)真的有用。至少能把數(shù)據(jù)具體到一個(gè)人的身上,能識(shí)別出誰(shuí)是高端用戶(hù),誰(shuí)是沉睡用戶(hù),從而精細(xì)化運(yùn)作(如下圖)



          真正低成本的、解決采集消費(fèi)者行為數(shù)據(jù)的問(wèn)題,還得靠互聯(lián)網(wǎng)產(chǎn)品。


          數(shù)據(jù)變大第三步:行為加入


          互聯(lián)網(wǎng)產(chǎn)品的最大優(yōu)勢(shì),在于App/小程序/H5本身就是數(shù)字化產(chǎn)品。此時(shí)不但有條件記錄到用戶(hù)的點(diǎn)擊、登錄等行為數(shù)據(jù),而且能將用戶(hù)ID、手機(jī)號(hào)等信息整合成統(tǒng)一ID,效率比依賴(lài)線(xiàn)下紙質(zhì)單張申請(qǐng)的流程強(qiáng)無(wú)數(shù)倍。


          還能將視頻、圖片、文章等內(nèi)容打標(biāo)簽,通過(guò)用戶(hù)點(diǎn)擊、轉(zhuǎn)發(fā)次數(shù),瀏覽時(shí)長(zhǎng),反推用戶(hù)需求。對(duì)于經(jīng)歷過(guò)傳統(tǒng)企業(yè)數(shù)據(jù)的人來(lái)說(shuō),互聯(lián)網(wǎng)產(chǎn)品的數(shù)據(jù)簡(jiǎn)直就是鳥(niǎo)槍換炮。


          相較之傳統(tǒng)的會(huì)員基礎(chǔ)信息、消費(fèi)流水?dāng)?shù)據(jù),用戶(hù)行為數(shù)據(jù)量特別、特別的大,大家想想自己在淘寶逛多久才買(mǎi)一件東西就知道了??赡苤皫装俅吸c(diǎn)擊瀏覽,最后才有一單交易。


          因此,需要專(zhuān)門(mén)的大數(shù)據(jù)架構(gòu)來(lái)支持這些數(shù)據(jù)的存儲(chǔ)和計(jì)算。狹義上的大數(shù)據(jù)技術(shù),特指對(duì)大量的用戶(hù)行為數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)和計(jì)算。


          有了這些數(shù)據(jù),才有現(xiàn)在我們流行的互聯(lián)網(wǎng)分析方法,比如漏斗分析法(如下圖)。



          基于這些基礎(chǔ)數(shù)據(jù)采集,還能延伸出更多數(shù)據(jù)應(yīng)用,比如:


          1、模型類(lèi):行為預(yù)測(cè)、推薦算法
          2、測(cè)試類(lèi):產(chǎn)品ABtest
          3、畫(huà)像類(lèi):用戶(hù)畫(huà)像
          ?


          雖然這些方法,基于交易數(shù)據(jù)也能做,但是數(shù)據(jù)量多寡,直接決定了結(jié)果準(zhǔn)確度。從而影響到業(yè)務(wù)端使用。在傳統(tǒng)時(shí)代,只有銀行、運(yùn)營(yíng)商、航空公司獨(dú)享的分析方法,成為現(xiàn)在互聯(lián)網(wǎng)公司的標(biāo)配。


          然而即使這樣,既然有一些問(wèn)題不能解決


          用戶(hù)數(shù)據(jù)分散在若干平臺(tái),導(dǎo)致單一平臺(tái)數(shù)據(jù)不足
          ●?用戶(hù)心理無(wú)法直接反應(yīng)為數(shù)據(jù),沖動(dòng)型行為會(huì)干擾正常數(shù)據(jù)判斷
          ●?信息安全法規(guī)要求越發(fā)嚴(yán)格,對(duì)數(shù)據(jù)采集/使用限制在增多
          ?

          因此,如何合法合規(guī)、持續(xù)利用大數(shù)據(jù)資源,依然是今天一個(gè)重要議題。


          03
          上不了臺(tái)面的“變大”方法


          當(dāng)然,還有一些灰色/黑色的方法,讓數(shù)據(jù)變大


          1、直接從“有數(shù)據(jù)”的人手上,買(mǎi)數(shù)據(jù)!
          2、爬蟲(chóng)、撞庫(kù),硬撈用戶(hù)數(shù)據(jù)
          3、通過(guò)設(shè)備,默默收集用戶(hù)數(shù)據(jù)
          ?

          這就是各種騷擾電話(huà)、垃圾短信的源頭。當(dāng)然,隨著國(guó)家對(duì)信息安全保護(hù)要求越來(lái)越嚴(yán)格,這些玩意生存空間也是逐步被壓縮,所以不談也罷。


          04
          “大數(shù)據(jù)有啥用”的終極答案


          縱觀數(shù)據(jù)從小到大的整個(gè)過(guò)程可以看出:數(shù)據(jù)從來(lái)都有用。即使最簡(jiǎn)單、最不準(zhǔn)的數(shù)據(jù),也能反應(yīng)管理上的問(wèn)題。因此決策者們對(duì)于數(shù)據(jù)的追求,永遠(yuǎn)是孜孜不倦的,永遠(yuǎn)是不滿(mǎn)足的。(如下圖)



          那么,為什么還有這么多人在問(wèn)“大數(shù)據(jù)有啥用”呢?

          因?yàn)椴⒎撬腥硕祭斫狻皵?shù)據(jù)”的用途,別說(shuō)大數(shù)據(jù)了,小數(shù)據(jù)丫也照樣不會(huì)用。


          截止到2021年,依然有人是拍腦袋決策,拍胸脯保證;依然有人沉迷于“老夫從業(yè)十年,我說(shuō)的就是對(duì)的”;依然有人覺(jué)得大數(shù)據(jù)包治百病,代碼一敲,鈔票從電腦屏幕里噴薄而出;依然有人迷信“底層邏輯”“核心思維”,苦練內(nèi)功心法。


          總之,想用好數(shù)據(jù),就得深入業(yè)務(wù)流程,具體了解數(shù)據(jù)采集方式,這樣才能讀懂?dāng)?shù)據(jù)背后的業(yè)務(wù)含義,才能把自己面臨的具體問(wèn)題轉(zhuǎn)化為數(shù)據(jù)問(wèn)題,才能解出正確答案。



          采集和計(jì)算數(shù)據(jù),是一門(mén)科學(xué)

          應(yīng)用數(shù)據(jù)產(chǎn)生價(jià)值,是一種藝術(shù)

          差別大致如此。


          知識(shí)星球歷史已上傳相關(guān)資料概覽:


          【數(shù)據(jù)分析】相關(guān)資料匯總



          報(bào)告已同步至知識(shí)星球,需要源文件請(qǐng)公眾號(hào)后臺(tái)回復(fù):報(bào)告

          報(bào)告僅做分享交流,文章開(kāi)頭已注明來(lái)源,如有侵權(quán),請(qǐng)聯(lián)系刪除;



          --------? ?往 期 推 薦??----------



          瀏覽 76
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  家庭乱伦第1页 | 青青视频大香蕉 | www.日逼网站 | 操操网 | 亚洲成人视频免费观看 |