確認(rèn)數(shù)據(jù)需求的流程
配合產(chǎn)品、運(yùn)營等業(yè)務(wù)方臨時(shí)數(shù)據(jù)需求,是數(shù)據(jù)分析師部分工作職責(zé)。例如,"數(shù)分同學(xué),我想看下目前活躍率情況,辛苦拉下數(shù)據(jù)"。部分沒有經(jīng)驗(yàn)的同學(xué)可能一頓操作猛如虎,將結(jié)果給到業(yè)務(wù),業(yè)務(wù)說這不是我想要的數(shù)據(jù),除此之外對你的專業(yè)能力可能也有懷疑。那數(shù)據(jù)分析師應(yīng)該怎么確認(rèn)需求。本文按照幾個(gè)步驟進(jìn)行梳理。

確認(rèn)數(shù)據(jù)分析目的
以開篇案例為例,當(dāng)業(yè)務(wù)想了解目前活躍率情況,我們應(yīng)該詢問需要該數(shù)據(jù)目的,這樣才能對癥下藥。業(yè)務(wù)說"目前我這個(gè)業(yè)務(wù)線活躍率降低,需要提升活躍率"。由于這個(gè)活躍率比較寬泛,我們還需要進(jìn)一步確認(rèn)XX時(shí)間段、XX群體活躍率。
確認(rèn)數(shù)據(jù)口徑
不同業(yè)務(wù)線對活躍率定義不同,需要確認(rèn)指標(biāo)口徑和計(jì)算邏輯,拿在線教育行業(yè)上課活躍率來說,上課活躍率 =某一段時(shí)間內(nèi)上課學(xué)生數(shù)/總學(xué)生數(shù)。上課學(xué)生數(shù)是指完課學(xué)生還是參課學(xué)生,總學(xué)生是指截止目前總學(xué)生數(shù)還是Learing學(xué)生數(shù)(總學(xué)生中刨除已經(jīng)結(jié)課和退費(fèi)的學(xué)生),都需要提前確認(rèn)。
確認(rèn)數(shù)據(jù)庫是否有字段
在上一步確認(rèn)好數(shù)據(jù)口徑之后,我們整理好需要獲取的字段,如果數(shù)據(jù)庫有該字段,可以直接取數(shù)校驗(yàn)數(shù)據(jù)準(zhǔn)確性,如果數(shù)據(jù)庫沒有該字段,則需進(jìn)行埋點(diǎn),再校驗(yàn)數(shù)據(jù)準(zhǔn)確性。
數(shù)據(jù)庫取數(shù)
分析好需求后直接寫 SQL 代碼。要注意兩點(diǎn),第一是確保 SQL 數(shù)據(jù)準(zhǔn)確性,第二是 SQL 查詢性能優(yōu)化。
數(shù)據(jù)分析
進(jìn)行描述性分析,對比前一周活躍率下降XX百分點(diǎn),是否在正常波動(dòng)范圍內(nèi); 進(jìn)行多維度分析,拆分新老用戶、系統(tǒng)版本、來源渠道、所在地區(qū)等因素,和以往數(shù)據(jù)對比,計(jì)算影響系數(shù)((各維度本周量-各維度上周量)/(本周總量-上周總量)),系數(shù)越大,對指標(biāo)影響越大; 看該指標(biāo)涉及到的部門。和運(yùn)營、產(chǎn)品溝通最近是否有新的運(yùn)營策略或新上線XX功能,導(dǎo)致活躍率降低; 近期外部競品公司是否有新動(dòng)作; 根據(jù)分析結(jié)果,給出改進(jìn)建議以及之后如何避免。
數(shù)據(jù)可視化
該指標(biāo)如果是需要長期監(jiān)控,可以使用第三方平臺(tái)如 Tableau、Power BI 或公司自研數(shù)據(jù)分析平臺(tái)進(jìn)行可視化展示,業(yè)務(wù)可自定義進(jìn)行下鉆分析。
追蹤落地情況
數(shù)據(jù)分析師常常自嘲為"取數(shù)機(jī)"、"表哥"或"表姐",分析出來的數(shù)據(jù)無法落地,所以我們做出來的數(shù)據(jù)不能直接交付出去就直接完事了,需要得到業(yè)務(wù)反饋,從數(shù)據(jù)角度能夠給出其他一些業(yè)務(wù)洞察,做復(fù)盤。
以上是數(shù)據(jù)分析師確認(rèn)數(shù)據(jù)需求的常規(guī)流程。
