歸因分析:淘寶直播數(shù)據(jù)分析
導(dǎo)讀:近年來,直播帶貨成為一種新的流行業(yè)態(tài)。主播在直播間與線上消費(fèi)者實(shí)時(shí)互動(dòng),這極大的提高了信息交流的效率。在這種實(shí)時(shí)性極強(qiáng)的場(chǎng)景,主播對(duì)直播間實(shí)時(shí)信息的使用有可顯著影響直播間的帶貨情況。


在線直播過程中能夠?qū)崟r(shí)的調(diào)整直播策略,提升直播質(zhì)量,提升C端用戶體驗(yàn)。
下播后,能夠及時(shí)的復(fù)盤本場(chǎng)整體表現(xiàn),直播能力、帶貨能力、互動(dòng)能力、粉絲粘性、流量運(yùn)營(yíng)等是否滿足預(yù)期,下次開播需要做哪些策略調(diào)整與準(zhǔn)備。
希望有數(shù)據(jù)可以幫助了解自己的粉絲群體,以便于更好的做粉絲運(yùn)營(yíng)。
希望有數(shù)據(jù)可以輔助主播更好的成長(zhǎng),比如自己在行業(yè)中排名如何,競(jìng)對(duì)有哪些優(yōu)點(diǎn)可以學(xué)習(xí),自己哪些短板需要改進(jìn)等(知己知彼百戰(zhàn)不殆)
提供實(shí)時(shí)直播場(chǎng)次報(bào)告,通過不同維度、不同展現(xiàn)形式讓主播能夠在直播過程中實(shí)時(shí)查看全面的核心場(chǎng)次數(shù)據(jù),并且同時(shí)支持PC和APP端查看。
提供下播報(bào)告,提供整個(gè)場(chǎng)次完整的數(shù)據(jù)內(nèi)容,相比實(shí)時(shí)場(chǎng)次報(bào)告更是多了智能決策能力、流量運(yùn)營(yíng)匯總等能力
提供數(shù)據(jù)機(jī)器人,以對(duì)話的方式,方便主播及時(shí)查看直播診斷、行業(yè)排名等數(shù)據(jù),給出成長(zhǎng)建議,幫助主播成長(zhǎng)
提供文本挖掘的能力,對(duì)于直播中評(píng)論文本進(jìn)行挖掘聚類,為主播提供及時(shí)的C端用戶心聲(體現(xiàn)在場(chǎng)次報(bào)告中)
決策智能能力,識(shí)別直播過程中的關(guān)鍵時(shí)間點(diǎn),基于此做多模態(tài)歸因分析,將多模態(tài)識(shí)別結(jié)果及直播快照在離線場(chǎng)次報(bào)告的趨勢(shì)圖模塊進(jìn)行展示。
針對(duì)頭部主播,提供主播大屏,方便運(yùn)營(yíng)團(tuán)隊(duì)人員實(shí)時(shí)查看直播核心數(shù)據(jù),特別是在促銷和大促時(shí),便于團(tuán)隊(duì)多人協(xié)作、及時(shí)作出合理決策。
提供場(chǎng)次對(duì)比能力,允許主播快速多維對(duì)比歷史多場(chǎng)表現(xiàn),總結(jié)直播經(jīng)驗(yàn),提升復(fù)盤效率。

訪問主要包括觀看次數(shù)、瀏覽次數(shù)、在線人數(shù)、觀看時(shí)長(zhǎng)等指標(biāo)
轉(zhuǎn)化主要包括新增粉絲數(shù)、商品引導(dǎo)PV\UV、點(diǎn)擊率等指標(biāo)
成交主要包括引導(dǎo)成交筆數(shù)、人數(shù)、金額,預(yù)售下定金額、尾款金額等指標(biāo)
目前我們做的是每5分鐘打一個(gè)點(diǎn),數(shù)據(jù)實(shí)時(shí)更新,讓主播可以直觀的看到直播過程中數(shù)據(jù)的趨勢(shì)變化,以輔助其做出合理的決策;
該模塊中集成了多模態(tài)識(shí)別歸因能力,根據(jù)相關(guān)指標(biāo)趨勢(shì)的波峰波谷時(shí)間點(diǎn)通過算法模型計(jì)算出異常點(diǎn)位,然后配合直播快照、商品上下架、互動(dòng)數(shù)據(jù)及多模態(tài)能力識(shí)別出在某個(gè)異常點(diǎn)是因?yàn)槭裁丛驅(qū)е碌脑撝笜?biāo)異常,同時(shí)將直播回放定位到該時(shí)間點(diǎn)點(diǎn)位,大大提升主播發(fā)現(xiàn)復(fù)盤改進(jìn)提升的效率。


實(shí)時(shí)流量運(yùn)營(yíng)主要是進(jìn)入到直播間的流量來源趨勢(shì)圖,目前包含關(guān)注、推薦、廣告、店鋪、搜索等13種流量來源,主播可以根據(jù)每種流量來源的趨勢(shì)數(shù)據(jù)進(jìn)行實(shí)時(shí)流量運(yùn)營(yíng)及決策
分渠道流量運(yùn)營(yíng)主播可以判斷場(chǎng)次整體的流量分布是否符合預(yù)期,有問題可以快速發(fā)現(xiàn)








我們重點(diǎn)針對(duì)Lindorm和ADB進(jìn)行了調(diào)研、驗(yàn)證和對(duì)比,由于產(chǎn)品特性(多維查詢、實(shí)時(shí)性、靈活性要求比較高)最終選擇了ADB進(jìn)行支持。
由于數(shù)據(jù)助理是直接服務(wù)與淘寶主播,所以對(duì)于穩(wěn)定性要求非常高,為了保障產(chǎn)品的高可用,我們做了核心鏈路【計(jì)算、存儲(chǔ)、服務(wù)】的雙鏈路保障。
通過霸下進(jìn)行攔截惡意攻擊流量,降低數(shù)據(jù)2/3的惡意無效數(shù)據(jù)訪問,大大降低了存儲(chǔ)及服務(wù)的資源消耗。
在其他直播業(yè)務(wù)有復(fù)用需求后,我們也及時(shí)的升級(jí)了數(shù)據(jù)鏈路,提取實(shí)時(shí)數(shù)據(jù)中間層,DWS數(shù)據(jù)同時(shí)寫入ADB、Lindorm、TT以支持不同直播業(yè)務(wù)場(chǎng)景的需求,做到了一份數(shù)據(jù)、一個(gè)口徑、多場(chǎng)景復(fù)用。

數(shù)據(jù)接入層:主要來源于直播業(yè)務(wù)數(shù)據(jù)、集團(tuán)公共層、達(dá)摩院智能數(shù)據(jù)
數(shù)據(jù)中間層:分為DWD、DWS層、維表、又包含實(shí)時(shí)數(shù)據(jù)建設(shè)和離線數(shù)據(jù)建設(shè),以下重點(diǎn)將實(shí)時(shí)部分、離線數(shù)據(jù)建設(shè)和實(shí)時(shí)是保持一致的
DWD層重點(diǎn)建設(shè)直播間明細(xì)層數(shù)據(jù),其中包含直播間曝光、點(diǎn)擊、觀看、互動(dòng)(評(píng)論、點(diǎn)贊、分享、關(guān)注等)、商品引導(dǎo)、商品成交、商品預(yù)售、直播間文本語義識(shí)別、多模歸因、關(guān)鍵點(diǎn)識(shí)別等數(shù)據(jù)
DWS層我們主要做了直播間、直播間+商品、直播間+渠道、直播間+來源、直播間+粉絲等直播間相關(guān)維度的匯總及趨勢(shì)數(shù)據(jù)、同時(shí)還包含直播間的多模數(shù)據(jù)
維表:包含了直播業(yè)務(wù)鏈路中的各種維度數(shù)據(jù),比如直播間、主播、商品、用戶、商家、商品類目、渠道、來源等等
業(yè)務(wù)應(yīng)用:這里主要是中間層數(shù)據(jù)服務(wù)的對(duì)象,包括達(dá)摩院直播賽道【數(shù)據(jù)助理、數(shù)字人、直播一體機(jī)、主播助理】、直播中控臺(tái)、生意參謀、產(chǎn)品360等等








相比于對(duì)照組,實(shí)驗(yàn)組預(yù)售商品的主要點(diǎn)擊時(shí)間區(qū)間沒有顯著延長(zhǎng),故不支持假設(shè)1;
相比于對(duì)照組,實(shí)驗(yàn)組預(yù)售商品的銷售效率顯著提高,故支持假設(shè)2。

相比于對(duì)照組,實(shí)驗(yàn)組中用戶對(duì)預(yù)售的討論比例更高;
相比于對(duì)照組,實(shí)驗(yàn)組中用戶提到缺貨信息比例更低;
相比于對(duì)照組,實(shí)驗(yàn)組中用戶問題比例更低。





清華大學(xué)經(jīng)管學(xué)院電子商務(wù)實(shí)驗(yàn)室:王伶俐 博士生、陳國(guó)青 教授、郭迅華 教授
休斯頓大學(xué):何玉梅 博士后、Yili (Kevin) Hong 教授、Nina Huang 副教授

推薦閱讀
歡迎長(zhǎng)按掃碼關(guān)注「數(shù)據(jù)管道」
