數(shù)據(jù)如何賦能產(chǎn)品—Magic Number

一、背景?
? ? 產(chǎn)品除了活躍的數(shù)據(jù), 留存的數(shù)據(jù)也是至關(guān)重要的, 優(yōu)化好了留存, 也就提升了活躍, 所以數(shù)據(jù)分析師天天會被產(chǎn)品問到的一個問題就是: 我們到底應(yīng)該怎么去提升我們的留存, 非常煩, 你們有沒有這樣的感觸?
? ? 互聯(lián)網(wǎng)思維中的一條就是用戶至上, 留住用戶才有故事。
? ? 那么我們怎么通過數(shù)據(jù)去幫助產(chǎn)品去發(fā)現(xiàn)留存的關(guān)鍵行為呢, 去解決我們煩心的問題呢?
? ? 我們的分析目標(biāo): 影響留存的相關(guān)的關(guān)鍵行為有哪些?這些行為和留存哪一個相關(guān)性是最大的?這些關(guān)鍵行為和留存是否存在因果關(guān)系?
? ??
二、分析思路?
? ? 分析思路和方法:
? ??

首先是關(guān)鍵行為的提取,?這一步就是利用sql 從數(shù)據(jù)倉庫中提取你想要的與留存相關(guān)的數(shù)據(jù)行為, 這一步是最麻煩也是最費(fèi)時間的
? ??
? ? 2.?利用統(tǒng)計學(xué)的相關(guān)性的計算方法, 可以計算第一步計算的每一個行為與留存的相關(guān)性,?相關(guān)性的系數(shù)越大就代表這個行為跟留存是越相關(guān)的, 就代表它可能就越影響留存, 比如刷抖音的次數(shù)跟留存的相關(guān)系數(shù)是 0.6, 刷抖音的時長和留存的相關(guān)系數(shù)是0.8, 就可以說明刷抖音的時間
? ??
? ? 3. 然而數(shù)據(jù)分析中的相關(guān)關(guān)系不一定是因果關(guān)系, 比如很多人喜歡張杰跟他唱歌好聽是相關(guān)的, 我們就不能一定說, 他唱歌好聽是大家喜歡他的原因, 可能真正原因是他的顏值哈哈, ?所以類似的, 我們的這些關(guān)鍵行為也不一定是決定留存的原因, 可能只是具有相關(guān)性, 所以我們就要去推斷 a 是b 的原因, 利用的方法是granger test因果檢驗的方法。
? ? 4. 當(dāng)我們已經(jīng)判斷了XX 行為就是留存的原因, 比如你一周刷抖音的時間是你下一周是否會留存的原因, 那么接下來就是去發(fā)現(xiàn)到底刷抖音多長時間是留存的magic number, 這個magic number 非常神奇, 就是比如你一周刷抖音288分鐘, 你下周留存的概率會大大增加, 這個"一周* 刷 * 288分鐘" 就是互聯(lián)網(wǎng)中最經(jīng)典的magic number.
? ? 抓住了magic number, 也就抓住了一個產(chǎn)品的留存靈魂。
? ??
三、關(guān)鍵行為特征?

? ? 拿某直播app 作為例子, 與留存的相關(guān)的行為可以分為 登錄行為, 觀看行為, 彈幕行為, 付費(fèi)行為, 然后在每一個大的行為分類進(jìn)行小的指標(biāo)的刻畫, 比如去描述登錄的行為我們就可以用 30天登錄天數(shù), 7天登錄天數(shù), 還可以用比率型指標(biāo), 像最近30天的登錄天數(shù)和過去30天的登錄的天數(shù)的比值, 這個反應(yīng)了用戶活躍度的變化。

四、相關(guān)性分析?
? ? 上一步已經(jīng)提取完了所有跟留存相關(guān)的行為特征, 這一步就要進(jìn)行計算留存和這些特征的相關(guān)性。

留存相關(guān)最大的四大因素:
?30天或者7天登錄天數(shù)(cor: 0.66)
?30天觀看品類個數(shù)(cor: 0.44)
?30天觀看主播數(shù) (cor: 0.37)
?30天日均觀看時長(cor: 0.26)
五、因果分析?
? ??

? ? 因為我們只是找出了跟留存相關(guān)的行為特征, 但我們不知道這些行為特征是否是留存的原因, 所以就要通過granger test 因果推斷的方法去驗證這些行為特征是否是留存的原因。
? ? 原理:兩個經(jīng)濟(jì)變量X、Y之間的格蘭杰因果關(guān)系定義為:若在包含了變量X、Y的過去信息的條件下,對變量Y的預(yù)測效果要優(yōu)于只單獨(dú)由Y的過去信息對Y進(jìn)行的預(yù)測效果,即變量X有助于解釋變量Y的將來變化,則認(rèn)為變量X是引致變量Y的格蘭杰原因。
? ? 原假設(shè)和是否拒絕: X 和 Y 是不存在因果關(guān)系, 當(dāng)經(jīng)過格蘭杰因果檢驗后計算出來的 p 值大于0.05 則接受原假設(shè), 否則拒絕原假設(shè)

主要結(jié)論:?

六、Magic Number?
? ??發(fā)現(xiàn)了影響留存了原因以后, 我們就要尋找這些行為是達(dá)到一個怎么樣的值以后, 會大大影響留存的概率, 所以我們計算了30天登錄天數(shù), 7天登錄天數(shù), 月日均觀看時長, 30天觀看主播數(shù),?30天觀看品類數(shù)和留存的關(guān)系 下面是畫出來的圖.?
? ? 拿30天登錄天數(shù)作為例子, 橫軸就是?30天內(nèi)不同登錄天數(shù), 縱軸就是留存率, 當(dāng)橫軸為7的時候, 留存率趨于穩(wěn)定, 這時候就達(dá)到較穩(wěn)定的狀態(tài)也被稱作 aha moment.

我們可以發(fā)現(xiàn)幾個神奇的magic number?
月登錄4天
周登錄三天
月觀看7個主播數(shù)
月觀看4個品類數(shù)
月日均觀看時長4分鐘
◆?◆?◆ ?◆?◆
麟哥新書已經(jīng)在當(dāng)當(dāng)上架了,點(diǎn)擊下方小程序即可進(jìn)入當(dāng)當(dāng)購買頁面:
數(shù)據(jù)森麟公眾號的交流群已經(jīng)建立,許多小伙伴已經(jīng)加入其中,感謝大家的支持。大家可以在群里交流關(guān)于數(shù)據(jù)分析&數(shù)據(jù)挖掘的相關(guān)內(nèi)容,還沒有加入的小伙伴可以掃描下方管理員二維碼,進(jìn)群前一定要關(guān)注公眾號奧,關(guān)注后讓管理員幫忙拉進(jìn)群,期待大家的加入。
管理員二維碼:
點(diǎn)擊閱讀原文,即可參與當(dāng)當(dāng)購書活動

