<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          如何突破數(shù)據(jù)分析

          共 14117字,需瀏覽 29分鐘

           ·

          2020-09-23 01:11

          點擊上方數(shù)據(jù)管道”,選擇“置頂星標(biāo)”公眾號

          干貨福利,第一時間送達(dá)

          本文整理自知乎專欄:突破數(shù)據(jù)分析[1],作者是網(wǎng)易數(shù)據(jù)分析高級總監(jiān)賀志,文末閱讀原文也可訪問賀老師文章。


          我是一個數(shù)據(jù)從業(yè)者,很早以前就想把自己在工作和學(xué)習(xí)中的心得做個總結(jié)。一方面是對自己過往經(jīng)歷的一個總結(jié)和回顧;一方面最近幾年大數(shù)據(jù)是越來越火了,也希望自己的經(jīng)驗?zāi)軒偷侥切?shù)據(jù)有熱情、希望從事數(shù)據(jù)行業(yè)的新人們;還有一方面,也非常重要,是希望借助知乎這個平臺跟廣大同行們做一個交流,互相幫助,共同成長。

          在開寫之前,先做下自我介紹。我在企業(yè)里從事數(shù)據(jù)相關(guān)的工作已經(jīng)有11年了,在這些年里,我做過咨詢顧問、數(shù)據(jù)分析師、售前工程師、開發(fā)工程師、數(shù)據(jù)分析經(jīng)理直至總監(jiān)。在管理崗上,我?guī)н^數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)產(chǎn)品、數(shù)據(jù)倉庫等各種團(tuán)隊,其中帶數(shù)據(jù)分析團(tuán)隊時間是最長的。先后就職于國企、傳統(tǒng)制造業(yè)和互聯(lián)網(wǎng)企業(yè)。總的來說,比較雜。現(xiàn)在想來其實有得有失。缺失的是,在任何一個細(xì)分領(lǐng)域上都沒有做得特別深入,不算是一個合格的專家;得到更多的是,我對整個數(shù)據(jù)的產(chǎn)生、處理、分析直至為企業(yè)提供價值的過程都有過體會和思考,從而也使我能夠站在一個更高的角度上看問題。到底是成為一個專才好還是通才好,我覺得這沒有一個確定的答案。個人覺得T型人才是比較受歡迎的,也就是自己的技能和業(yè)務(wù)面同時要有寬度和深度。當(dāng)然,到底多寬或多深才合適,取決于個人的職業(yè)發(fā)展意向。基于我的經(jīng)驗,我分享的更多是對這個行業(yè)的理解、做事情的思想和方法論,而不會側(cè)重于具體的實現(xiàn)技術(shù)。想學(xué)技術(shù)的同學(xué)請繞行。

          后面我預(yù)計要分享的內(nèi)容包括數(shù)據(jù)分析、產(chǎn)品、倉庫、數(shù)據(jù)團(tuán)隊建設(shè)等等。個人經(jīng)驗最多的是數(shù)據(jù)分析,就從這里開始吧。可能包括以下話題:

          • 什么是數(shù)據(jù)分析?
          • 數(shù)據(jù)分析有哪些分類?
          • 如何設(shè)定分析目標(biāo)?
          • 怎樣才算是一個合格的數(shù)據(jù)分析師?
          • 什么樣的企業(yè)需要數(shù)據(jù)分析師?
          • 怎樣建立一個數(shù)據(jù)分析師團(tuán)隊?
          • 數(shù)據(jù)分析師團(tuán)隊的價值是什么?如何實現(xiàn)?
          • 數(shù)據(jù)分析師團(tuán)隊的崗位設(shè)置及分工合作
          • 一篇好的分析報告有什么樣的標(biāo)準(zhǔn)?
          • 數(shù)據(jù)分析三元論(勢、道、術(shù))

          什么是數(shù)據(jù)分析

          一句話定義,數(shù)據(jù)分析是一個從數(shù)據(jù)中通過分析手段發(fā)現(xiàn)業(yè)務(wù)價值的過程。這個過程的起點是獲取一份數(shù)據(jù),這個過程的終點是發(fā)現(xiàn)業(yè)務(wù)價值。過程可以大致為分?jǐn)?shù)據(jù)獲取——數(shù)據(jù)清洗——數(shù)據(jù)處理——數(shù)據(jù)建模——分析結(jié)果呈現(xiàn)——業(yè)務(wù)價值發(fā)現(xiàn)——業(yè)務(wù)價值實現(xiàn)這幾個階段。

          在具體說明每個階段之前,首先要談下我對數(shù)據(jù)和業(yè)務(wù)價值這兩個概念的理解。

          • 數(shù)據(jù):我認(rèn)為數(shù)據(jù)不是簡單的數(shù)字,換句話說,如果你只告訴我一串?dāng)?shù)字 170、172、180而沒有其他信息,那么這幾個數(shù)字就僅僅是數(shù)字而已,而不是數(shù)據(jù)。數(shù)據(jù)除了數(shù)字本身之外,還必須包含數(shù)字的來源、度量方式、單位、代表的業(yè)務(wù)場景(即數(shù)據(jù)產(chǎn)生的上下文環(huán)境)等等。其中,我認(rèn)為場景是最重要的。仍舊拿上面的例子來說,如果你告訴這是三個地區(qū)的平均身高,那可以說這是一組有意義的數(shù)據(jù)了,至于單位,我會猜到是厘米;而來源和度量方式?jīng)Q定了這個數(shù)據(jù)的可信程度。
          • 業(yè)務(wù)價值:不能服務(wù)于業(yè)務(wù)的數(shù)據(jù)分析是沒有生命力的,不能產(chǎn)生業(yè)務(wù)價值的數(shù)據(jù)分析是徒勞無功的。因此,能否實現(xiàn)業(yè)務(wù)價值決定了這是否是一次成功的數(shù)據(jù)分析。而分析工作只是實現(xiàn)了這個過程的第一步,它通過分析師的視角將價值呈現(xiàn)于業(yè)務(wù)人員面前,分析的結(jié)果只有被業(yè)務(wù)人員理解,并最終通過業(yè)務(wù)人員的努力轉(zhuǎn)化為業(yè)務(wù)實施(在大多數(shù)公司數(shù)據(jù)分析和業(yè)務(wù)運營這兩種不同的角色會分屬不同的部門,增長黑客則是一種新的形式),才可能最終實現(xiàn)價值。

          過程的詳細(xì)說明:

          • 數(shù)據(jù)獲取:這個階段的輸入需要一個分析目標(biāo),哪怕不是那么的明確和清晰。為什么需要一個目標(biāo)?在一個大型企業(yè)中,可以獲取的數(shù)據(jù)往往是海量,如果沒有一個目標(biāo)限制,那數(shù)據(jù)分析往往是無從著手的。這個階段的輸出是一個數(shù)據(jù)子集,它可以是物理上的貨邏輯上的。所謂物理上的,就是把分析中用到的數(shù)據(jù)單獨拷貝到一個地方;而邏輯上就只是定義出可用的數(shù)據(jù)范圍,比如時間周期、維度、指標(biāo)等。這個階段的困難之處在于理解相關(guān)的數(shù)據(jù)源,因為數(shù)據(jù)源文檔不完整或者變更的情況經(jīng)常在業(yè)務(wù)中發(fā)生。數(shù)據(jù)清洗:通常包括異常數(shù)據(jù)的處理、缺失數(shù)據(jù)的處理、數(shù)據(jù)的一致性變換、編碼的替換等
          • 數(shù)據(jù)處理:對數(shù)據(jù)進(jìn)行匯總,或者形式上的變換,以便可以適用于后期的建模
          • 數(shù)據(jù)建模:用統(tǒng)計分析或機(jī)器學(xué)習(xí)算法對數(shù)據(jù)建模,以便描述數(shù)據(jù)或?qū)ξ磥磉M(jìn)行預(yù)測。其實大多數(shù)分析師在這個階段只觀測數(shù)據(jù)的同比、環(huán)比的趨勢上的變化,亦或?qū)χ笜?biāo)在不同維度上進(jìn)行拆分,以觀察維度對指標(biāo)變化的影響。以上三個階段在很多書籍中都有具體的技術(shù)描述,不再贅述。
          • 分析結(jié)果呈現(xiàn):通常認(rèn)為,這個階段的主要任務(wù)是把建模的結(jié)果以圖、表或者更加復(fù)雜的可視化方式呈現(xiàn)出來。但我認(rèn)為不止于此。首先,呈現(xiàn)結(jié)果不是這個階段的目的,目的應(yīng)該是讓業(yè)務(wù)人員對分析結(jié)果有充分的理解。其次,呈現(xiàn)的手段除了可視化,最重要的應(yīng)該是溝通。而溝通是雙向的,可以保證結(jié)果最大程度上被他人理解。業(yè)務(wù)價值發(fā)現(xiàn):通常數(shù)據(jù)分析師會在分析結(jié)果中提出對業(yè)務(wù)的價值,但是這個價值只有被業(yè)務(wù)人員認(rèn)可才有可能實現(xiàn)。所以,此處的“發(fā)現(xiàn)”應(yīng)該是分析師和業(yè)務(wù)人員的“共同認(rèn)知”。
          • 業(yè)務(wù)價值實現(xiàn):業(yè)務(wù)價值發(fā)現(xiàn)和實現(xiàn)經(jīng)常不被包含在數(shù)據(jù)分析過程中。但是,就如同我對數(shù)據(jù)分析的定義,業(yè)務(wù)價值才是數(shù)據(jù)分析的終極目的。因此,我認(rèn)為價值的實現(xiàn)才是整個過程的最后一個階段,這個階段雖然是有業(yè)務(wù)人員控制的,但是仍然需要分析師的深度參與。因為雙方對于分析結(jié)果的理解和價值的發(fā)現(xiàn)經(jīng)常出現(xiàn)偏差,需要在實踐中逐步達(dá)到統(tǒng)一。最后,關(guān)于數(shù)據(jù)分析過程,我認(rèn)為有幾點需要給予非常的重視:

          在開始做分析之前,首先要有分析目標(biāo)!分析目標(biāo)!分析目標(biāo)!重要的事情說三遍。

          • 過程不是單向的,在后一個階段中發(fā)現(xiàn)問題時可以跳回到前一階段
          • 過程不是一次性,而是不斷循環(huán)往復(fù)的。上一次分析過程的終點,可能是下一次分析過程的起點。我們經(jīng)常會在業(yè)務(wù)價值發(fā)現(xiàn)和實現(xiàn)階段發(fā)現(xiàn)新的分析主題,并把它作為下一次分析的起點。
          • 對于任何一次分析來講,不是每個階段都是必需的
          • 整個過程中的大多數(shù)時間都需要分析師和業(yè)務(wù)人員的密切合作

          數(shù)據(jù)分析有哪些分類

          面對的問題不同:戰(zhàn)略、運營

          戰(zhàn)略分析:是為了解決公司戰(zhàn)略方向問題,回答要向哪里去的問題。

          • 此類分析通常比較宏觀,需要分析者有大局觀、有戰(zhàn)略思維;
          • 所用的數(shù)據(jù)除了公司內(nèi)部的數(shù)據(jù),還需要競品數(shù)據(jù)、行業(yè)數(shù)據(jù)。
          • 戰(zhàn)略分析的方法:需要從競品及行業(yè)數(shù)據(jù)中發(fā)現(xiàn)行業(yè)發(fā)展趨勢及競品的戰(zhàn)略定位,同時結(jié)合公司內(nèi)部數(shù)據(jù),可以發(fā)現(xiàn)相對于行業(yè)和競品發(fā)展,內(nèi)部在哪些地方存在不足,以此制定進(jìn)攻和防守策略

          運營分析:不同于戰(zhàn)略分析,運營分析以解決實際運營問題為目標(biāo),比較微觀

          • 需要分析者對公司業(yè)務(wù)模式、運營細(xì)節(jié)有深入的了解;
          • 使用的數(shù)據(jù)以公司內(nèi)部數(shù)據(jù)為主。
          • 此類分析最重要的是,分析結(jié)果要能夠與運營結(jié)合,并能有效落地

          服務(wù)的部門不同:業(yè)務(wù)、數(shù)據(jù)

          • 業(yè)務(wù)分析:此類分析由業(yè)務(wù)部門發(fā)起,提交給分析師執(zhí)行,最終結(jié)果交付給業(yè)務(wù)部門。此類分析一般在最終的價值發(fā)現(xiàn)環(huán)節(jié)效率較高,問題的針對性較強(qiáng)。
          • 數(shù)據(jù)分析:此類分析由數(shù)據(jù)部門發(fā)起,最終結(jié)果視具體情況可能提高給業(yè)務(wù)部門或者管理層。由于此類分析的視角不同于業(yè)務(wù)分析,在最終的價值發(fā)現(xiàn)和實現(xiàn)環(huán)節(jié)需要與業(yè)務(wù)部門的深入溝通。同時,也正是由于視角不同,會經(jīng)常發(fā)現(xiàn)業(yè)務(wù)部門沒有發(fā)現(xiàn)或者忽視的問題。

          分析的范圍不同:行業(yè)、公司、部門、業(yè)務(wù)環(huán)節(jié)

          • 行業(yè)分析:目的是總結(jié)和預(yù)測整個行業(yè)的過去和未來的發(fā)展趨勢,時間窗口一般在1年以上。使用場景較多的是在投資公司中或者很多公司的市場宣傳稿中會出現(xiàn)。行業(yè)分析的對象是商業(yè)模式或者業(yè)務(wù)形態(tài),關(guān)注的是資金、市場格局、用戶需求的變化和各企業(yè)的應(yīng)對。最有價值和最難的是要提前預(yù)測行業(yè)的增長爆發(fā)點和衰退的轉(zhuǎn)折點。
          • 公司分析:目的是結(jié)合行業(yè)分析對公司業(yè)務(wù)發(fā)展做出診斷,給公司發(fā)展提供決策建議。時間窗口一般在一年以內(nèi),在公司戰(zhàn)略決策會發(fā)揮較大的作用。SWOT等方法適合在公司分析中使用。分析者首先要認(rèn)清企業(yè)的商業(yè)模式,要與公司的管理者同步公司的短期和長期目標(biāo),了解企業(yè)的盈利來源和運作方式,通過公司內(nèi)外部數(shù)據(jù)的對比發(fā)現(xiàn)運營中的問題和商機(jī)。在這個過程中,了解市場和競品的動態(tài)是非常重要的。
          • 部門分析:目的是對部門職能范圍內(nèi)的業(yè)務(wù)發(fā)展做出正確的診斷并給出適當(dāng)?shù)慕ㄗh。前提是能充分理解部門在整個公司中的角色和地位、該部門與其他部門的協(xié)作關(guān)系、在工作流程中的上下游關(guān)系。基于以上理解,以配合公司業(yè)務(wù)發(fā)展為目的,以提升部門KPI或某個關(guān)鍵任務(wù)為分析目標(biāo),利用公司和部門運營數(shù)據(jù)去做分析。此類分析中,理解公司業(yè)務(wù)、有產(chǎn)品和業(yè)務(wù)思維很重要,指標(biāo)的分解、對比,數(shù)據(jù)變化的歸因往往是常用的分析方法。
          • 業(yè)務(wù)環(huán)節(jié)分析:這是數(shù)據(jù)分析在業(yè)務(wù)最細(xì)粒度的應(yīng)用。分析者只需要關(guān)注非常具體的某個業(yè)務(wù)環(huán)節(jié),讓大家感興趣的是這個業(yè)務(wù)環(huán)節(jié)數(shù)據(jù)的變化原因和改善方式。此時分析的指標(biāo)經(jīng)常是確定的,目標(biāo)也很直接。但所謂牽一發(fā)動全身,這個環(huán)節(jié)的變化通常是由其他環(huán)節(jié)的變化引起的。所以萬萬不能走入一葉障目不見泰山的誤區(qū)。

          項目的階段不同:咨詢、實施

          • 咨詢分析:以前有過跟咨詢公司合作的經(jīng)歷。在項目開始階段,乙方通常需要花很多時間討論項目立項的必要性、收益等,以此來說服甲方老板,你懂的。但是,我要說的是,即使是公司自行研發(fā)的項目,在立項階段,數(shù)據(jù)分析需要做的是樹立目標(biāo)。通過數(shù)據(jù)分析,可以對業(yè)務(wù)有一個全面的診斷,發(fā)現(xiàn)問題,提出項目需要改善的主要指標(biāo),并預(yù)測出項目上線后的收益。立項是需要管理層批準(zhǔn)的,因此這個階段的分析需要簡明扼要、一針見血,分析結(jié)果的呈現(xiàn)起著至關(guān)重要的作用。
          • 實施分析:項目開始后,數(shù)據(jù)分析需要做的是過程控制。除了項目目標(biāo)涉及的主要指標(biāo)需要持續(xù)關(guān)注之外,還需要關(guān)注過程類指標(biāo)。所謂過程類指標(biāo),是指能夠反映出項目執(zhí)行內(nèi)容的數(shù)據(jù)。因為主要指標(biāo)的表現(xiàn)通常是滯后的,而且是若干因素影響的結(jié)果,過程指標(biāo)是為了明確各影響因素的作用效果。比如項目目標(biāo)是提升使用時長,項目內(nèi)容可能包括提升新用戶和老用戶的使用時長,那么則應(yīng)該把新老用戶的時長作為指標(biāo)單獨監(jiān)控和分析。

          綜上,根據(jù)數(shù)據(jù)分析的使用場景、業(yè)務(wù)階段、服務(wù)人群、范圍及層次不同,可以分為很多種。以上只是列舉出一部分。在每種場景下,數(shù)據(jù)分析的目標(biāo)、關(guān)注的重點和難點都有所不同,分析師要在分析過程中時刻關(guān)注自己有沒有偏離目標(biāo),并對重點和難點有充分的準(zhǔn)備。

          如何設(shè)定分析目標(biāo)

          從我的經(jīng)歷看,數(shù)據(jù)分析的目標(biāo)主要來自兩方:一方是業(yè)務(wù),一方是數(shù)據(jù)部門自身。

          對于一個具體的數(shù)據(jù)分析項目來說,可能以上兩方的因素都會存在,只是占比多少而已。以下詳細(xì)說明這兩種方式的場景、前提及“坑”。

          • 分析目標(biāo)主要來自業(yè)務(wù)方:這種場景通常存在于業(yè)務(wù)方對業(yè)務(wù)發(fā)展有疑問,希望通過數(shù)據(jù)分析提升業(yè)務(wù)。業(yè)務(wù)設(shè)定的目標(biāo)要么是對過去的業(yè)務(wù)發(fā)展做總結(jié)和診斷,希望從中發(fā)現(xiàn)問題;要么是基于業(yè)務(wù)的歷史預(yù)測未來的發(fā)展趨勢。這里經(jīng)常存在的問題是,業(yè)務(wù)方提出目標(biāo)往往是模糊不清的,并且通常用業(yè)務(wù)術(shù)語而非數(shù)據(jù)口徑來定義。因此,這種情況下,分析師要花較多的精力做需求分析。而要做好需求分析,分析師需要具備一定的產(chǎn)品和業(yè)務(wù)思維,要從業(yè)務(wù)視角出發(fā),充分理解業(yè)務(wù)的處境,才能從最根本上理解業(yè)務(wù)的需求。同時,需要對數(shù)據(jù)產(chǎn)生的流程和指標(biāo)計算的口徑對業(yè)務(wù)人員進(jìn)行充分的說明。如此不斷地迭代溝通,往往分析到最后,卻發(fā)現(xiàn)已經(jīng)不是原來的需求了。還有一種情況,業(yè)務(wù)對數(shù)據(jù)了解較多,會在需求中說明需要的數(shù)據(jù)口徑,這種需求會被單純地看做一個數(shù)據(jù)提取需求。即使是這樣,如果希望讓這部分?jǐn)?shù)據(jù)更有價值,分析師也需要就其業(yè)務(wù)背景有深入的討論,然后可以修正該需求。

          • 分析目標(biāo)主要來自數(shù)據(jù)部門自身:這種場景下,數(shù)據(jù)部門在組織上是獨立于業(yè)務(wù)部門的。但是獨立不意味著可以不考慮數(shù)據(jù)分析對業(yè)務(wù)的價值(參見第一章)。如果說實現(xiàn)業(yè)務(wù)價值是分析的根本原因,那么重要數(shù)據(jù)指標(biāo)的變化則是數(shù)據(jù)分析的直接原因。也就是說,如果數(shù)據(jù)部門要能夠獨立提出分析目標(biāo),首先要有相對完善的指標(biāo)監(jiān)控體系。而指標(biāo)體系可以分層,并且建立起各指標(biāo)之間的關(guān)聯(lián)關(guān)系。因此,數(shù)據(jù)部門提出分析目標(biāo)可以更全面、更客觀,而不局限于一隅。但是,這個分析目標(biāo)的設(shè)定對數(shù)據(jù)部門要求更高:不僅要具備完善的指標(biāo)監(jiān)控體系,更要了解業(yè)務(wù)。經(jīng)常出現(xiàn)的情況是,數(shù)據(jù)部門自己費了挺大的勁做出的分析報告,業(yè)務(wù)部門卻無動于衷,其中沒有涉及到業(yè)務(wù)痛點可能是一個重要原因。

          總結(jié)一下,分析目標(biāo)的設(shè)定是數(shù)據(jù)分析最初也是最重要的一步。一個合理的分析目標(biāo)應(yīng)該具備以下特征:

          • 要有業(yè)務(wù)視角,能折射出業(yè)務(wù)痛點
          • 要有數(shù)據(jù)支持
          • 要量化:“為什么產(chǎn)量下降了”和“為什么產(chǎn)量從1萬下降到5千”,顯然后者的目標(biāo)更清晰
          • 要能體現(xiàn)在某個或某幾個指標(biāo)上:還是上面的例子,產(chǎn)量只是一個概念而非指標(biāo),一個可能的產(chǎn)量指標(biāo)是:全廠2018年第一季度中產(chǎn)品型號X的生產(chǎn)數(shù)量。總之,要做到明確而沒有歧義。

          怎樣才算是一個合格的數(shù)據(jù)分析師

          可以從分析師的工作目標(biāo)、工作內(nèi)容和能力要求三個方面回答這個問題。其中工作目標(biāo)和工作內(nèi)容是息息相關(guān)的。要說清楚這個問題,我認(rèn)為除了一些公認(rèn)的標(biāo)準(zhǔn)之外,還有一些標(biāo)準(zhǔn)是因公司和行業(yè)而異的。也就是說,必須把它放在一個具體的公司業(yè)務(wù)框架之中考慮。

          工作目標(biāo)主要由公司的業(yè)務(wù)發(fā)展階段決定

          一般來說,無論是哪個公司,都希望分析師能有效地利用數(shù)據(jù)引導(dǎo)和驅(qū)動業(yè)務(wù)發(fā)展,實現(xiàn)數(shù)據(jù)的價值。但是,公司發(fā)展的情況不同,對數(shù)據(jù)分析師的價值定義也會不同

          • 公司整體處于初創(chuàng)階段,此時分析師的價值在于能通過對行業(yè)和競爭對手的分析,為公司的發(fā)展方向提出適當(dāng)?shù)慕ㄗh;
          • 公司如果處于快速發(fā)展期,此時分析師的價值在于一方面監(jiān)控業(yè)務(wù)取得的成績,關(guān)注增長速度,一方面要健全指標(biāo)體系,發(fā)現(xiàn)被業(yè)績增長所可能掩蓋的問題;
          • 如果公司處于穩(wěn)定期,分析師則需要從效率和成本角度,從業(yè)務(wù)細(xì)節(jié)入手,為精細(xì)化運營提供支持;
          • 如果公司發(fā)展遇到瓶頸,分析師需要分析市場中供給和需求的變化,關(guān)注競爭對手的應(yīng)對策略,為公司業(yè)務(wù)發(fā)展發(fā)現(xiàn)新的增長點。

          工作內(nèi)容主要由公司的數(shù)據(jù)建設(shè)程度決定

          參照第一章,分析師的主要工作內(nèi)容數(shù)據(jù)獲取、數(shù)據(jù)處理、數(shù)據(jù)清洗、數(shù)據(jù)建模、分析結(jié)果呈現(xiàn)、數(shù)據(jù)價值發(fā)現(xiàn)及實現(xiàn)。無論分析的目標(biāo)是什么,大體總要經(jīng)過這幾個階段。由于數(shù)據(jù)建設(shè)的階段不同,分析師在這幾項工作內(nèi)容上所花費的時間也不同。在公司數(shù)據(jù)建設(shè)早期,分析師可能在數(shù)據(jù)獲取、數(shù)據(jù)處理和清洗、指標(biāo)建設(shè)上花費更多的時間;數(shù)據(jù)建設(shè)到達(dá)一定階段之后,分析師的工作更多會在數(shù)據(jù)建模、呈現(xiàn)和數(shù)據(jù)價值實現(xiàn)上。

          分析師的能力要求

          對分析師的能力要求可分為通用能力和技術(shù)兩部分,同時也可以分為業(yè)務(wù)和數(shù)據(jù)兩部分。

          1. 業(yè)務(wù)能力:業(yè)務(wù)要求又可以分為微觀和宏觀兩方面:
          • 業(yè)務(wù)的微觀要求:了解業(yè)務(wù)運營;了解公司發(fā)展方向和發(fā)展過程中面臨的問題
          • 業(yè)務(wù)的宏觀要求:把握行業(yè)的發(fā)展方向,預(yù)測未來行業(yè)模式的變化;能明確指出公司在行業(yè)中的定位和戰(zhàn)略方向
          1. 數(shù)據(jù)通用能力:
          • 熟悉公司的所有基礎(chǔ)數(shù)據(jù)、來源、數(shù)據(jù)之間的關(guān)系;
          • 熟悉公司運營所涉及數(shù)據(jù)、能建立運營指標(biāo)和數(shù)據(jù)之間的相關(guān)或因果關(guān)系;
          • 能根據(jù)數(shù)據(jù)分析結(jié)果給出業(yè)務(wù)改進(jìn)建議
          • 數(shù)據(jù)價值實現(xiàn)能力。價值實現(xiàn)的過程是指數(shù)據(jù)分析結(jié)果->業(yè)務(wù)->業(yè)務(wù)執(zhí)行->反饋結(jié)果->數(shù)據(jù)分析這樣一個不斷迭代的過程。在此過程中,演講(Presentation)能力、溝通能力、影響力、團(tuán)隊協(xié)作能力、學(xué)習(xí)能力、邏輯思維能力、歸納和總結(jié)能力、抽象思維能力等都非常重要
          1. 數(shù)據(jù)技術(shù):
          • 數(shù)據(jù)庫和數(shù)據(jù)倉庫技術(shù)(SQL、Hive等)
          • 數(shù)據(jù)分析算法(統(tǒng)計分析和機(jī)器學(xué)習(xí))和工具(Excel、Python、R等)
          • 數(shù)據(jù)可視化工具的使用(Excel、R、PPT等)

          好的分析師在實際的業(yè)務(wù)操作中至少會做好三點:

          • 大局觀:大處著眼,小處著手,全局和細(xì)節(jié)并重。因為從數(shù)據(jù)角度看,小數(shù)據(jù)往往可以反映出大問題。而沒有大局觀,就不知道該看哪些小數(shù)據(jù)
          • 思維:數(shù)據(jù)思維與業(yè)務(wù)思維并重。業(yè)務(wù)思維容易理解,什么是數(shù)據(jù)思維?比如:對指標(biāo)由粗到細(xì)的拆解、考慮時間維度上的趨勢、注意尋求指標(biāo)之間的相關(guān)關(guān)系、直接影響關(guān)系、因果關(guān)系等。很多人都注重分析師要懂業(yè)務(wù),有業(yè)務(wù)思維,這當(dāng)然沒錯,但不能走向極端。因為在實際中,業(yè)務(wù)是需要不一樣的思維的,可以發(fā)現(xiàn)他們發(fā)現(xiàn)不了的問題,從而為他們在困境中提供解決方案。分析師需要了解業(yè)務(wù)的思維方式,但不能模仿他們。
          • 溝通:要想讓分析師的觀點被業(yè)務(wù)方所接受,溝通的作用是舉足輕重的。首先,分析師要為溝通找到合適的對象和時機(jī)。事先要根據(jù)溝通對象的不同設(shè)計適合的表達(dá)方式、內(nèi)容和過程。溝通的時機(jī)要選在業(yè)務(wù)最需要的時候。很多時候,事后諸葛亮固然不好,但太超前了也不會有好結(jié)果。其次,要有同理心。需要真正站在對方的角度上想問題。再次,需要在溝通中建立互信、發(fā)揮影響力。一個好的分析師,能在溝通中恰到好處地展現(xiàn)自己的專業(yè)能力和經(jīng)驗,適時的讓業(yè)務(wù)方對人產(chǎn)生信任,從而對分析結(jié)果信服。

          什么企業(yè)需要數(shù)據(jù)分析師

          企業(yè)需要數(shù)據(jù)并不等于需要數(shù)據(jù)分析師。

          如果僅是想看數(shù)據(jù),其實有很多企業(yè)可以提供這樣的服務(wù)和工具。比如流量統(tǒng)計工具GA,比如報表工具Tableau。這些工具都可以在不需要分析師的情況下,對業(yè)務(wù)人員做簡單的培訓(xùn)就可以用起來。

          分析師承擔(dān)的是相對復(fù)雜的、個性化的、以分析為目的(而不是查詢)的任務(wù)。

          如果企業(yè)有如下情況之一,那么可能是需要建立一支分析師隊伍了。

          • 決策需要數(shù)據(jù)支持:決策層通常不是只看到數(shù)據(jù)就可以做出決策的,他們需要知道的是數(shù)據(jù)變化的原因、預(yù)測某個決策可能造成哪些指標(biāo)及如何變化的結(jié)果,這是一個相對復(fù)雜的分析任務(wù),不是工具或者非專業(yè)人士可以回答。
          • 業(yè)務(wù)規(guī)模大、復(fù)雜度高:在此情況下,即使只是構(gòu)造單個指標(biāo),也需要經(jīng)過嚴(yán)密的口徑定義、復(fù)雜的計算才能得到,且需要經(jīng)過校驗才能保證數(shù)據(jù)是準(zhǔn)確無誤的,這樣的工作通常由分析師完成。
          • 業(yè)務(wù)發(fā)展變化快:在業(yè)務(wù)穩(wěn)定的情況下,數(shù)據(jù)的計算及業(yè)務(wù)含義不需要經(jīng)常變化。反之,數(shù)據(jù)的定義、計算和業(yè)務(wù)理解則需要不斷地適應(yīng)業(yè)務(wù)的發(fā)展,需要分析師不斷地維護(hù)這些數(shù)據(jù)。
          • 精細(xì)化運營:業(yè)務(wù)在經(jīng)歷開始階段的快速增長,達(dá)到穩(wěn)定階段之后。運營風(fēng)格會由粗放型轉(zhuǎn)換為精細(xì)化。此時,需要對業(yè)務(wù)指標(biāo)進(jìn)行拆分,并分析相關(guān)性及數(shù)據(jù)之間的因果關(guān)系。
          • 數(shù)據(jù)統(tǒng)計口徑混亂、可信度低:有的企業(yè)存在數(shù)據(jù)孤島的情況,每個部門掌控著一部分?jǐn)?shù)據(jù),會造成同一個指標(biāo),由不同部門出結(jié)果不同。此時需要重新梳理指標(biāo)口徑定義、數(shù)據(jù)采集、計算,找出數(shù)據(jù)之間的差異。當(dāng)然,最后要徹底解決問題,則需要解決數(shù)據(jù)孤島的問題
          • 數(shù)據(jù)建設(shè)的初始階段:這時候需要分析師梳理業(yè)務(wù)流程、確認(rèn)需求、建立指標(biāo)體系、定義計算口徑、整合數(shù)據(jù)源等
          • 業(yè)務(wù)需求不清晰:業(yè)務(wù)有需求,但很模糊:比如,我想知道最近某某業(yè)務(wù)的運營效果如何?但是該看哪些指標(biāo)則不清楚。此時需要分析師深入了解業(yè)務(wù)需求的背景和目的,將業(yè)務(wù)需求指標(biāo)化。

          怎樣建立一支分析師團(tuán)隊

          從企業(yè)層面看,如果要建立分析師團(tuán)隊,要弄清楚幾個問題:

          1. 建立分析師的目的是什么?
          2. 分析師屬支持角色,那么他們支持的對象是誰?
          3. 分析師的主要工作內(nèi)容什么?
          4. 分析師的規(guī)模多大較為合適?
          5. 如何評估分析師的績效?

          弄清楚這五個問題之后,就會知道應(yīng)該招聘具備什么經(jīng)驗的人,招聘多少人,以及對水平的要求有多高,如何考核他們等等。

          那么如何思考這五個問題?

          1. 建立分析師團(tuán)隊的目的:雖然成立分析師團(tuán)隊的決定通常是由高層做出的,但是主要目的不一定只是為了做決策支持,也許是自底向上產(chǎn)生的需求推動。有很多情況下,管理層覺得他們需要看數(shù)據(jù),因此招聘了有決策支持經(jīng)驗、具備宏觀思維的分析師,但實際上又安排了分析師去支持具體業(yè)務(wù);或者反過來,管理層希望分析師能支持具體的業(yè)務(wù),但是他們又安排分析師評價整個公司的運營情況,甚至提出戰(zhàn)略方向。這兩種情況都會造成人才的浪費。要知道業(yè)務(wù)分析和決策支持對分析師的要求是不同的。至少,前者需要分析師能關(guān)注到細(xì)節(jié),而后者要求分析師不拘小節(jié),視野要足夠高。
          2. 分析師支持的對象:如果目的明確了,通常支持的對象就清晰了。
          3. 分析師的主要工作內(nèi)容:這同樣主要取決于團(tuán)隊定位,具體的工作內(nèi)容可參照《數(shù)據(jù)分析有哪些分類》
          4. 分析師團(tuán)隊的規(guī)模:規(guī)模取決于多種因素,比如工作內(nèi)容的復(fù)雜程度、業(yè)務(wù)需求的多少和緩急、能招聘到的人員的技能水平等。
          5. 分析師的績效評估:最直接的評估方法是看分析師產(chǎn)出的數(shù)量和質(zhì)量。如果只看產(chǎn)出的數(shù)量是比較容易的,比如可以看完成需求的多少、分析報告的數(shù)量等。但由于分析負(fù)責(zé)的業(yè)務(wù)線不同,這會忽略工作的難度。需要注意的是,分析師很多工作的投入和產(chǎn)出是不成比例的。比如溝通、業(yè)務(wù)梳理等基礎(chǔ)性的工作占據(jù)他們大部分的時間,而這些工作可能只有很少的可見交付物的輸出。除了產(chǎn)出量,還需要看產(chǎn)出的質(zhì)量。最理想的質(zhì)量評估就是看對業(yè)務(wù)的貢獻(xiàn),即提升了多少業(yè)務(wù)價值。但這同樣是比較困難的,因為有時候業(yè)務(wù)價值也很難量化。除了對外的產(chǎn)出,還有一個維度是看對數(shù)據(jù)團(tuán)隊內(nèi)部的支持,因為分析師通常是作為聯(lián)系數(shù)據(jù)團(tuán)隊和業(yè)務(wù)團(tuán)隊的橋梁存在。比如,對數(shù)據(jù)指標(biāo)體系的建設(shè)和數(shù)據(jù)倉庫、數(shù)據(jù)產(chǎn)品的建設(shè)中做出的貢獻(xiàn)。但是同樣,這些貢獻(xiàn)也很難量化。

          如何實現(xiàn)數(shù)據(jù)分析的價值

          在之前的章節(jié)中已經(jīng)提到分析的價值在于業(yè)務(wù)價值,而業(yè)務(wù)價值實現(xiàn)的最后一步是把分析結(jié)論應(yīng)用于業(yè)務(wù)中,并反復(fù)迭代。

          我想從一個例子來說明分析師在整個價值實現(xiàn)鏈條中的位置和作用。假設(shè)我們在考慮如何實現(xiàn)一件工具的價值,這件工具可以是一把鉗子,或者更復(fù)雜點,比如一部電腦。在這個例子中:

          • 數(shù)據(jù)分析是工具
          • 分析師是工具的制造者
          • 業(yè)務(wù)方是工具的使用者
          • 工具價值的實現(xiàn)不僅與工具的制造質(zhì)量及精巧程度有關(guān),還與使用者有關(guān):有人使用電腦設(shè)計航天器,有人只是用它玩游戲。

          也就是說,數(shù)據(jù)分析的價值除了分析師這個因素之外,還受到其他因素的影響。比如:

          • 數(shù)據(jù)分析結(jié)果的交付質(zhì)量、可視化及可理解性(類比:工具本身的質(zhì)量、設(shè)計及易用性)
          • 數(shù)據(jù)分析結(jié)果使用者的素質(zhì)(類比:工具使用者的素質(zhì),對工具的了解程度,工具使用的相關(guān)知識背景)
          • 數(shù)據(jù)分析結(jié)果使用的場景(類比:工具使用的場景是否符合工具設(shè)計者的初衷) 環(huán)境因素,比如不可抗力、趨勢(類比:臺式機(jī)的價值在移動化辦公的趨勢下會變小)

          呃。。。是不是漏了點什么?分析師哪里去了?其實分析師的作用正在于對上述因素形成過程中的影響:

          • 提高數(shù)據(jù)的質(zhì)量、展示水平,讓數(shù)據(jù)結(jié)果變得更容易理解
          • 教育和培訓(xùn)數(shù)據(jù)使用者,往往會達(dá)到事倍功半的效果
          • 從根本上理解數(shù)據(jù)需求,打破砂鍋問到底
          • 最后,對于不可抗拒的因素,分析師能做的就是。。。調(diào)整心態(tài)。反抗不了的話,就學(xué)會接受吧。

          數(shù)據(jù)分析師團(tuán)隊的分工與合作

          個人感覺分析師團(tuán)隊很不好帶,數(shù)據(jù)分析師團(tuán)隊最大的三個痛點是:

          1. 散:在公司級別的團(tuán)隊中表現(xiàn)尤其顯著。由于支持的業(yè)務(wù)多,而各業(yè)務(wù)的發(fā)展目標(biāo)不同,導(dǎo)致無法設(shè)立一個統(tǒng)一的業(yè)務(wù)目標(biāo),只能按人去設(shè)定目標(biāo),管理效率很低。

          2. 亂:正是由于業(yè)務(wù)目標(biāo)散亂,造成分析師之間的工作無法統(tǒng)一和協(xié)同。很多時候都是各自為戰(zhàn),沒有配合,甚至出現(xiàn)目標(biāo)沖突的情況。

          3. 弱:不能影響業(yè)務(wù),不能建立話語權(quán)。這個在上文中已經(jīng)說過,此處不再贅述。

          這里面的關(guān)鍵是解決“散”的問題。很顯然,如果把眼光放在部門級的業(yè)務(wù)上,是無法解決這個問題的。因此,需要把視野擴(kuò)展到全公司。基于公司統(tǒng)一的發(fā)展目標(biāo),建立一個統(tǒng)一的分析框架。正如數(shù)據(jù)分析是服務(wù)業(yè)務(wù)的,分析框架也要基于業(yè)務(wù)模型來建立。業(yè)務(wù)模型的標(biāo)準(zhǔn)是:

          • 業(yè)務(wù)模型要高度抽象化,它是從業(yè)務(wù)模式中抽取出來的,而不是反應(yīng)部門職能。
          • 業(yè)務(wù)模型要能反應(yīng)實際業(yè)務(wù)的運營規(guī)律、要素和目標(biāo)。甚至,這個業(yè)務(wù)模型可以放之行業(yè)而皆準(zhǔn)。

          有了業(yè)務(wù)模型,現(xiàn)在需要建立分析模型。我的經(jīng)驗是對著業(yè)務(wù)模型提問題。首先是公司級的:公司的發(fā)展目標(biāo)是什么?需要哪些要素來完成這個目標(biāo)?各要素之間如何互相促進(jìn)?然后將上述問題分解到部門級。最后可以將問題歸類,可以分為:目標(biāo)分析、運營分析、要素分析等。這些分類好的問題就是分析師分工的基礎(chǔ)。

          傳統(tǒng)的分工方式是分析師按支持業(yè)務(wù)部門分工,或者按支持的業(yè)務(wù)模塊分工。

          這種分工方式的結(jié)果是:

          第一、分析師對業(yè)務(wù)的了解如同盲人摸象,每個人都只能了解到部分業(yè)務(wù),不能也不會從整體考慮業(yè)務(wù)問題,對問題的定位缺乏深度;

          第二、分析師的工作是割裂的,自己的分析結(jié)果不容易被其他分析師采用。

          以電商平臺模式舉例,運用上面的方法:

          1. 建立業(yè)務(wù)分析模型:用戶、商品兩個主要要素。鏈接這兩個要素的是用戶購物體驗。用戶自身會有用戶生命周期,商品自身會有商品生命周期。還可以進(jìn)一步細(xì)化:用戶購物體驗包括查找商品信息、下單、配送、付費、售后等體驗。商品生命周期可以包括采購、倉儲、上下架等。商品要素包括定價、分類、功能、用戶評價等。

          2. 提問:公司的發(fā)展目標(biāo)?假設(shè)公司的發(fā)展目標(biāo)就是追求銷售利潤最大化(實際上很多電商平臺不是通過這個模式來盈利的)。要素?利潤的大部分通常是由高凈值人群和高毛利商品貢獻(xiàn)的。要不斷發(fā)展壯大高凈值人群和提升高毛利商品的銷量。各要素之間如何促進(jìn)?高凈值人群不會只買高毛利商品,平臺也不可能只賣高毛利商品。鏈接這兩者的是用戶體驗。分析師可以根據(jù)分析主題分成兩個大組:一組的分析任務(wù)包括識別高凈值人群、分析高凈值人群的購物體驗、分析高凈值人群的生命周期;二組的分析任務(wù)包括識別高毛利商品、分析用戶對高毛利商品的購物體驗、分析高毛利商品的生命周期。當(dāng)然,還可以把購物體驗單獨作為一組或者在上述基礎(chǔ)上進(jìn)一步細(xì)分。比如高凈值人群分為A、B、C等幾個不同特征的人群,如果其特征差異很顯著,可以基于人群分組做進(jìn)一步劃分。

          這樣分工的好處是:

          第一、分析師是基于分析模型的分組,組內(nèi)目標(biāo)一致,組內(nèi)分析結(jié)果是可以共享和互相借鑒的;

          第二、組內(nèi)大目標(biāo)的設(shè)定可以較為宏觀,促使分析師從整體考慮問題

          第三、組內(nèi)對大目標(biāo)的分解最終會落實到具體業(yè)務(wù)上,不會太虛

          第四、不同分組間的分析師雖然目標(biāo)不同,但是使用的數(shù)據(jù)維度基本一樣,很多的基礎(chǔ)性工作是可以共建的,且分析結(jié)果也可以互相借鑒。

          一篇好的分析報告有什么樣的標(biāo)準(zhǔn)

          寫分析報告應(yīng)該是每個分析師的必做功課之一,不管是簡單的或者復(fù)雜的,正式的或者非正式的。

          什么是分析報告?我定義為有特定的主題、分析過程和結(jié)論的都可以算作分析報告,而不拘泥于表現(xiàn)形式。

          那么怎么才算是一篇好的分析報告?相信每一個分析師都會有自己的標(biāo)準(zhǔn)。比如:對業(yè)務(wù)有意義、數(shù)據(jù)準(zhǔn)確、邏輯嚴(yán)密等。這些都沒有錯,但是報告是給人看的,而每個人的背景和需求不同,那么從報告讀者的角度出發(fā)去衡量報告的好壞會更加客觀。

          既然要從讀者出發(fā),那么首先就要對讀者分類。從我的經(jīng)驗出發(fā),我們可以把報告的讀者按職級不同簡單分為決策層、執(zhí)行層;按對業(yè)務(wù)的了解程度不同分為了解和不了解兩類。那么讀者可以細(xì)分為四類:

          我將從選題、數(shù)據(jù)選擇、分析過程、結(jié)論、報告結(jié)構(gòu)、可視化這幾個方面去說明對不同類別的讀者,一篇好的分析報告的標(biāo)準(zhǔn)是什么。

          • 對于A類讀者:由于他們對業(yè)務(wù)了解,視野又有一定的高度,所以選題應(yīng)該以相對宏觀且能反應(yīng)業(yè)務(wù)痛點的主題。比如對公司或一級部門KPI目標(biāo)完成度的剖析、相對于競品主要業(yè)務(wù)指標(biāo)的表現(xiàn)分析。數(shù)據(jù)應(yīng)該選擇較大的、粒度較粗的指標(biāo)數(shù)據(jù),不能用那種多個維度交叉且口徑定義很復(fù)雜的指標(biāo)。分析過程應(yīng)簡單明了,邏輯推理盡可能把數(shù)據(jù)變化和業(yè)務(wù)解讀結(jié)合起來,同時一定需要關(guān)注時間維度上的變化。結(jié)論應(yīng)清晰明了,包括對業(yè)務(wù)方向性的診斷和預(yù)判。在發(fā)布報告時,結(jié)論前置較為合適,對業(yè)務(wù)背景的描述不需要太多。可視化方面,以趨勢性的圖表為主。

          • 對于B類讀者:一般是經(jīng)理及以下的運營人員。選題方面應(yīng)側(cè)重具體的運營問題,范圍限定在二級或三級部門的職責(zé)范圍內(nèi)。選擇某個業(yè)務(wù)線環(huán)節(jié)及上下游的微觀數(shù)據(jù),分析過程中要將統(tǒng)計方法或機(jī)器學(xué)習(xí)方法與業(yè)務(wù)規(guī)則結(jié)合,發(fā)現(xiàn)各指標(biāo)之間的因果關(guān)系。報告結(jié)構(gòu)的重心在于分析過程和結(jié)論,可視化方面要注重細(xì)節(jié)數(shù)據(jù)的呈現(xiàn)。

          • 對于C類讀者:選題偏重業(yè)務(wù)診斷和監(jiān)控,選擇宏觀的、KPI或目標(biāo)相關(guān)的重點指標(biāo),可以包含行業(yè)的、競爭對手的相關(guān)數(shù)據(jù)。分析方法以對比和預(yù)測為主。結(jié)論以對業(yè)務(wù)方向的定性總結(jié)為好。報告結(jié)構(gòu)應(yīng)在業(yè)務(wù)背景介紹、選題的依據(jù)、結(jié)論建議等多花些筆墨,過程可以簡略。報告呈現(xiàn)以精簡為好。

          • 對于D類讀者:通常是新人或者新業(yè)務(wù)。選題偏重業(yè)務(wù)發(fā)展細(xì)節(jié)中的痛點或瓶頸。數(shù)據(jù)選擇微觀的但較為簡單的指標(biāo),分析過程中著重在于指標(biāo)的歷史趨勢、相關(guān)指標(biāo)之間的對比和變化,結(jié)論側(cè)重于發(fā)現(xiàn)和定義業(yè)務(wù)問題。報告結(jié)構(gòu)側(cè)重于業(yè)務(wù)背景的描述、數(shù)據(jù)選擇和指標(biāo)定義。可視化需要在業(yè)務(wù)邏輯的展示上多花些功夫。

          總結(jié)下,我認(rèn)為報告選題、數(shù)據(jù)選擇、分析過程、結(jié)論、報告結(jié)構(gòu)、可視化是影響一篇報告質(zhì)量的主要因素。但是分析報告如同一件藝術(shù)品,沒有放之四海而皆準(zhǔn)的標(biāo)準(zhǔn),只有是否迎合和滿足的受眾的需求。因此,分析師必須清楚誰會看你的報告、你的讀者希望從你的報告中得到什么、讀者的背景(包括業(yè)務(wù)和數(shù)據(jù)方面的知識)是怎樣的、讀者對你和數(shù)據(jù)的信任度如何。如果分析師要寫出一篇好的分析報告,需要了解的不只是數(shù)據(jù)和業(yè)務(wù)。

          數(shù)據(jù)分析三元論:勢、道、術(shù)

          有個成語叫“大勢所趨”,順應(yīng)趨勢、迎合潮流的事情做起來總是事半功倍的。

          在做數(shù)據(jù)分析之前,我們要問一問:在這個時代、行業(yè)、公司做數(shù)據(jù)分析是大勢所趨嗎?

          要回答這個問題,首先要搞清楚哪些因素構(gòu)成了數(shù)據(jù)分析的“勢”。我列舉如下幾個:

          • 行業(yè):我以為只有那些能夠產(chǎn)生大量數(shù)據(jù)、且市場需求和業(yè)務(wù)模式變化較快、競爭較為充分的行業(yè)更適合做數(shù)據(jù)分析。大量數(shù)據(jù)是基礎(chǔ)和原材料;市場需求和競爭壓力是內(nèi)在的驅(qū)動力。比如To C的電商行業(yè),數(shù)據(jù)量已經(jīng)到了一定量級,而人的需求往往是變化較快的,且這個行業(yè)沒有形成事實上的壟斷。雖然阿里、京東的電商平臺已經(jīng)占據(jù)了很大的市場份額,但是他們之間仍然存在競爭,而且像嚴(yán)選、考拉、網(wǎng)紅電商等垂直電商也還有生存空間。再比如電信和金融行業(yè),也能滿足以上幾個條件。但是有些行業(yè),看起來業(yè)務(wù)規(guī)模大,但實際上不適合去做數(shù)據(jù)分析。比如家裝、餐飲,這兩個行業(yè)雖然古老,但除了某些巨頭之外,信息化做的相對較差,數(shù)據(jù)采集都是問題,更談不上做數(shù)據(jù)分析了。再比如能源行業(yè),也能夠產(chǎn)生大量的數(shù)據(jù),但是因為市場需求相對穩(wěn)定,且基本形成了國家壟斷,沒有做數(shù)據(jù)分析的內(nèi)在需求。
          • 公司的數(shù)據(jù)環(huán)境:數(shù)據(jù)環(huán)境包括信息化水平、數(shù)據(jù)文化、老板對數(shù)據(jù)的重視程度等。這幾個因素是很好理解的。信息化水平?jīng)Q定了數(shù)據(jù)的量和質(zhì)量,消除數(shù)據(jù)不一致、清洗臟數(shù)據(jù)要花多少時間和精力,做過的人都知道。。。數(shù)據(jù)文化包括數(shù)據(jù)相關(guān)的流程、規(guī)章、制度,公司內(nèi)部對數(shù)據(jù)認(rèn)知和利用的程度等。最后,我向來認(rèn)為數(shù)據(jù)是一把手工程,由于數(shù)據(jù)從采集到價值產(chǎn)出,都是涉及多個部門的利益,沒有老板的支持,做好數(shù)據(jù)是天方夜譚。

          所謂“道”,主要指分析體系和框架、目的和價值。

          而這些主要受公司的業(yè)務(wù)模式和業(yè)務(wù)需求的影響。說白了,業(yè)務(wù)模式越簡單、越清晰,數(shù)據(jù)分析越容易出成果。因為簡單的業(yè)務(wù)模式能顯著減少數(shù)據(jù)分析師學(xué)習(xí)業(yè)務(wù)的成本。分析體系和框架也會簡單明了,在分析時需要考慮的影響因素就越少。而價值鏈短業(yè)務(wù)模式更容易讓分析主題直接與業(yè)務(wù)收益掛鉤,更容易讓數(shù)據(jù)分析成果變現(xiàn)。而分析需求越穩(wěn)定,就可以給分析師更多的時間深入研究下去,不斷迭代,最終產(chǎn)出更大的價值。分析需求越清晰,花在需求討論中的時間就越少,最終分析成果被轉(zhuǎn)化的可能性就越大。

          術(shù)

          所謂“術(shù)”,是指數(shù)據(jù)分析的方法和過程,其中分析思維和分析技術(shù)對分析結(jié)果的影響。

          正如我在開篇所述,數(shù)據(jù)分析所涉及技術(shù)體系非常龐大,而且學(xué)習(xí)資料也很多,不在本專欄范圍之內(nèi)。我重點想說說我經(jīng)驗中的一些分析技巧(包括思維和方法):

          • 分析主題的定性與定量:設(shè)計分析主題中的重要一步,是要確定分析的目的是定性或是定量。如果是定性,通常只要考慮有關(guān)或無關(guān),正面影響或負(fù)面影響。定量分析是很受業(yè)務(wù)方歡迎的,分析也更加復(fù)雜和困難,通常要通過機(jī)器學(xué)習(xí)模型解決。

          • 發(fā)現(xiàn)分析主題的兩個切入點:指標(biāo)監(jiān)控與業(yè)務(wù)問題。在《如何設(shè)定分析目標(biāo)》一節(jié)講過,數(shù)據(jù)部門更適合從指標(biāo)監(jiān)控中發(fā)現(xiàn)問題,業(yè)務(wù)部門更適合從業(yè)務(wù)中發(fā)現(xiàn)問題。但對于一個成熟的數(shù)據(jù)部門,把指標(biāo)監(jiān)控和業(yè)務(wù)監(jiān)控深度結(jié)合,對于發(fā)現(xiàn)分析主題更有利。

          • 數(shù)學(xué)建模:我對數(shù)學(xué)建模技術(shù)了解并不深。但是如果能把業(yè)務(wù)問題轉(zhuǎn)化為一個數(shù)學(xué)模型,對于確定分析思路會很有幫助。

          • 指標(biāo)創(chuàng)新:指標(biāo)其實是數(shù)據(jù)分析師分析業(yè)務(wù)問題的武器。因為無論你用什么分析方法,總要用到一些數(shù)據(jù),而這些數(shù)據(jù)的計算方法、范圍會很大程度上影響分析結(jié)果。且不說任何一個建模過程中的特征選擇都非常重要,即使只是對業(yè)務(wù)的簡單監(jiān)控,一個好的指標(biāo)往往能準(zhǔn)確無誤地反映出問題。對于互聯(lián)網(wǎng),PV、UV、時長、留存、點擊率、退出率這些是大家很常用的。用來監(jiān)控整體業(yè)務(wù)是沒有問題的,但是對于某個小的業(yè)務(wù)板塊就不太夠了。比如,作為內(nèi)容平臺,我想衡量一次曝光的用戶體驗如何,應(yīng)該用什么指標(biāo)?有人會建議用點擊率,但是點擊率會受到標(biāo)題黨的影響,此時高的點擊率并不代表好的用戶體驗。比較好的選擇是把點擊率、閱讀時長、閱讀進(jìn)度等合成一個指標(biāo)。

          • 整體與個體:大處著眼,小處著手。無論是數(shù)據(jù)還是業(yè)務(wù),都不是孤立存在的,系統(tǒng)性思維對于分析師非常重要。所以在看到一個小問題的時候,要知道它絕對不會影響這一小塊業(yè)務(wù);而看到大的目標(biāo)出現(xiàn)問題的時候,要能意識到可能是一些小的業(yè)務(wù)環(huán)節(jié)出了岔子。在動手層面,對于數(shù)據(jù)分析來說,微觀分析更容易獲取實驗數(shù)據(jù),也更容易找到因果關(guān)系。所以要不斷地對問題分解和細(xì)化。

          • 分析維度的引入:在低維空間上解決不了,在高維空間上就不是個事(想到三體了嗎)。比如SVM,低維空間上無法做到線性可分的數(shù)據(jù)樣本,在高維空間上就可以。所以如果你在某個分析問題中費了牛勁也找不到答案,也許正是因為你忽略了某個重要的因素。當(dāng)然也不是維度越多越好,因為維度越多,解釋起來就越困難,不要忘了,結(jié)果是給人看的。

          • 大膽假設(shè),小心求證:試想求解一個方程式,我把某個解代入方程驗證是否正確,要比我從空間中求解容易得多。同理,由于在現(xiàn)實世界中可能影響業(yè)務(wù)的因素太多,選擇其中最有可能的因素去驗證無疑是一條捷徑。這個假設(shè)怎么去做?首先要對業(yè)務(wù)有足夠的敏感度。是的,業(yè)務(wù)老鳥就是比新手能更快地“嗅”出問題的根源;其次要對數(shù)據(jù)有足夠的敏感度,數(shù)據(jù)之間都是有關(guān)系的,某個相關(guān)的指標(biāo)變化也許就能告訴我們答案。究竟這個假設(shè)是不是問題的答案,最終取決于數(shù)據(jù)驗證。“小心”的意思是,一定要保證在驗證過程中不受其他因素的干擾,AB測試無疑是個很好的方法。還有,在求證過程中要保持邏輯的嚴(yán)密。

          參考資料

          [1]

          知乎專欄:突破數(shù)據(jù)分析: https://zhuanlan.zhihu.com/c_170929249

          瀏覽 30
          點贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  成人网站污污 | 欧美日韩高 | 欧美美女操B视频 | 国产成人丁香五月 | 一区视频在线 |