淘寶APP用戶(hù)行為數(shù)據(jù)分析
轉(zhuǎn)自 :https://zhuanlan.zhihu.com/p/183899535
如有侵權(quán),請(qǐng)聯(lián)系浪尖刪除。langjianliaodashuju
一. 提出問(wèn)題和應(yīng)用模型
1.本次分析的目的是想通過(guò)對(duì)淘寶用戶(hù)行為進(jìn)行數(shù)據(jù)分析,為以下問(wèn)題提供解釋和改進(jìn)建議:
(1)分析用戶(hù)使用APP過(guò)程中的常見(jiàn)電商分析指標(biāo),確定各個(gè)環(huán)節(jié)的流失率。
(2)利用假設(shè)檢驗(yàn)思想分析流失原因,找到需要改進(jìn)的環(huán)節(jié)。
(3)研究用戶(hù)在不同時(shí)間尺度下的行為規(guī)律,分析不同尺度下的轉(zhuǎn)化率。
(4)找到用戶(hù)對(duì)不同種類(lèi)商品的偏好和針對(duì)不同商品的營(yíng)銷(xiāo)策略。
(5)將用戶(hù)群按照價(jià)值劃分,并針對(duì)不同的用戶(hù)群提出營(yíng)銷(xiāo)建議。
2.應(yīng)用分析模型
(1)基于AARRR漏斗模型分析用戶(hù)行為
本文通過(guò)常用的電商數(shù)據(jù)分析指標(biāo),采用AARRR漏斗模型拆解用戶(hù)進(jìn)入APP后的每一步行為。AARRR模型是根據(jù)用戶(hù)使用產(chǎn)品全流程的不同階段進(jìn)行劃分的,針對(duì)每一環(huán)節(jié)的用戶(hù)流失情況分析出不同環(huán)節(jié)的優(yōu)化優(yōu)先級(jí),主要通過(guò)以下個(gè)各階段來(lái)進(jìn)行分析:

(2)基于RFM模型找出有價(jià)值的用戶(hù)
由于不同用戶(hù)對(duì)公司帶來(lái)的收益差別很大,而且根據(jù)二八定律(20%的有價(jià)值用戶(hù)能帶來(lái)80%的收益),因此需要對(duì)用戶(hù)進(jìn)行價(jià)值評(píng)價(jià),找到最有價(jià)值的用戶(hù)群,并針對(duì)這部分用戶(hù)進(jìn)行差異化營(yíng)銷(xiāo)。這里參考RFM 模型對(duì)用戶(hù)進(jìn)行評(píng)價(jià):
R-Recency(最近一次購(gòu)買(mǎi)時(shí)間)
R指用戶(hù)上一次消費(fèi)的時(shí)間,上一次購(gòu)物時(shí)間距今最近的顧客通常在近期響應(yīng)營(yíng)銷(xiāo)活動(dòng)的可能性也最大,對(duì)于APP而言,很久沒(méi)有購(gòu)物行為可能意味著用戶(hù)放棄了APP的使用,重新喚起用戶(hù)也需要更多的成本。
F-Frequency(消費(fèi)頻率)
F指用戶(hù)在某段時(shí)間內(nèi)的購(gòu)物次數(shù),消費(fèi)頻率越高意味著這部分用戶(hù)對(duì)產(chǎn)品的滿(mǎn)意度最高,用戶(hù)粘性最好,忠誠(chéng)度也最高。
M-Money(消費(fèi)金額)
M指用戶(hù)在某段時(shí)間內(nèi)的購(gòu)物金額,這也是為公司帶來(lái)價(jià)值的最直接體現(xiàn),而消費(fèi)金額較高的用戶(hù)在用戶(hù)總體中人數(shù)較少,卻能創(chuàng)造出更多價(jià)值,是需要重點(diǎn)爭(zhēng)取的對(duì)象。
這三個(gè)維度互相關(guān)聯(lián),反映了每個(gè)用戶(hù)的現(xiàn)在價(jià)值和潛在價(jià)值,將每個(gè)維度分成R-5,F-5個(gè)區(qū)間進(jìn)行評(píng)分,通過(guò)計(jì)算分?jǐn)?shù)對(duì)用戶(hù)進(jìn)行分類(lèi),可以有針對(duì)性地對(duì)不同類(lèi)型用戶(hù)采用不同的營(yíng)銷(xiāo)策略。
二. 理解數(shù)據(jù)
1. 數(shù)據(jù)來(lái)源
阿里云天池:tianchi.aliyun.com/data
數(shù)據(jù)集包含了2017年11月25日0:00至2017年12月4日0:00之間(共9天),淘寶APP移動(dòng)端用戶(hù)行為數(shù)據(jù)。由于總記錄為1億條,數(shù)量過(guò)大,此處只處理200萬(wàn)條數(shù)據(jù)作為代表,這部分?jǐn)?shù)據(jù)中包含19544名用戶(hù)(按user_id劃分)的行為記錄。
2.各字段含義
因?yàn)閿?shù)據(jù)量太大,直接用excel打不開(kāi),這里通過(guò)python輸出數(shù)據(jù)的前5行,查看大體格式。
import pandas as pd
data=pd.read_csv('UserBehavior.csv')
print(data.head())輸出結(jié)果如下圖所示:

這里也可以看出此文件是沒(méi)有字段名的,因此導(dǎo)入數(shù)據(jù)庫(kù)時(shí)需要自己創(chuàng)建表頭信息。

3.數(shù)據(jù)導(dǎo)入
(1)新建數(shù)據(jù)庫(kù)userbehavior;(在navicat中完成)
(2)因?yàn)樵磾?shù)據(jù)沒(méi)有字段名,所以要先創(chuàng)建表頭信息,設(shè)置主鍵
create table user (
id int not null,
item int not null,
behavior varchar(10) not null,
category int not null,
times int not null,
constraint id_behave primary key(id,item,times));三.?dāng)?shù)據(jù)清洗
1.列名重命名
建表時(shí)已經(jīng)將原有列名簡(jiǎn)化,id表示用戶(hù)ID,item表示商品編號(hào),behavior 表示用戶(hù)行為,category表示商品類(lèi)別,times表示時(shí)間信息。使用rename函數(shù)也能改。
2.一致化處理
時(shí)間數(shù)據(jù)中的日期和小時(shí)存在于一列中,為了方便研究每天和一天內(nèi)每小時(shí)用戶(hù)的行為變化,將其按date和time拆分成兩列。
將時(shí)間戳轉(zhuǎn)換為日期類(lèi)型
set sql_safe_updates=0;
alter table user add column datetime timestamp(0) null;
update user set datetime = from_unixtime(times);
將其按date和time拆分成兩列
alter table user add column date char(10) null;--增加date一列
update user set date = substring(datetime from 1 for 10);--取出年-月-天
alter table user add column time char(10) null;--增加time一列
update user set time = substring(datetime from 12 for 2);--取出小時(shí)3.異常值處理
刪去11-25至12-03日以外的數(shù)據(jù)
delete from user where datetime<'2017-11-25 00:00:00' or datetime>'2017-12-04 00:00:00';四. AARRR模型分析
利用AARRR模型,分析用戶(hù)行為和留存、流失情況,此處數(shù)據(jù)主要涉及用戶(hù)刺激和購(gòu)買(mǎi)轉(zhuǎn)化的環(huán)節(jié),即用戶(hù)從瀏覽到最終購(gòu)買(mǎi)整個(gè)過(guò)程。
1.日新增用戶(hù)統(tǒng)計(jì)首先根據(jù)id分組,按照date組內(nèi)排名,確定每個(gè)用戶(hù)第一次登錄的時(shí)間,篩選出的排名為1的數(shù)據(jù)即作為用戶(hù)第一次登錄的數(shù)據(jù)。再根據(jù)date分組,統(tǒng)計(jì)每日第一次登錄的用戶(hù)數(shù)即為新增用戶(hù)數(shù)。
將每個(gè)用戶(hù)的登錄時(shí)間排名
select *, row_number() over (partition by id order by date) as user_rank from user
統(tǒng)計(jì)每日新增用戶(hù)數(shù)DNU
select date,count(id) as DNU from
(select *, row_number() over (partition by id order by date) as user_rank from user) as A
where A.user_rank=1 group by date order by date asc;

分析:新增用戶(hù)在11月25日為13927人,處于最高水平,后逐日遞減。推測(cè)11月25日前后可能存在促銷(xiāo)活動(dòng)或拉新活動(dòng)。
2.用戶(hù)留存率分析
第N日留存率=新增日之后的第N日再次登錄的用戶(hù)數(shù)/第一天新增總用戶(hù)數(shù)。
依次算出每日留存人數(shù)
select date,count(distinct id) as 留存人數(shù),
count(distinct id)/(select count(distinct id) from user where date='2017-11-25') as 留存率 from user
where id in (select distinct id from user where date='2017-11-25')
group by date order by date asc;
分析:由上表可知,11-25之后的8日內(nèi)留存率均在75%以上,且12月2日-3日的留存率超過(guò)98%,說(shuō)明客戶(hù)較為穩(wěn)定,瀏覽意愿極為強(qiáng)烈。說(shuō)明客戶(hù)較為穩(wěn)定,瀏覽意愿極為強(qiáng)烈。可能是前期的拉新活動(dòng)效果較好,每日打卡領(lǐng)金幣調(diào)動(dòng)了用戶(hù)的積極性,為沖刺雙十二做準(zhǔn)備。
3.不同時(shí)間尺度下用戶(hù)行為模式分析
創(chuàng)建用戶(hù)行為視圖(按天)
create view user_behavior as
SELECT date,
SUM(CASE WHEN behavior='pv' THEN 1 ELSE 0 END)AS '瀏覽數(shù)',
SUM(CASE WHEN behavior='fav' THEN 1 ELSE 0 END)AS '收藏?cái)?shù)',
SUM(CASE WHEN behavior='cart' THEN 1 ELSE 0 END)AS '購(gòu)物車(chē)',
SUM(CASE WHEN behavior='buy' THEN 1 ELSE 0 END)AS '付費(fèi)數(shù)'
FROM user
GROUP BY date
ORDER BY date

分析:這9天中,11月25日至12月1日用戶(hù)瀏覽量變化幅度小,范圍在18萬(wàn)到20萬(wàn)之間,12月2日-3日有較大幅度增加,對(duì)比同樣是周末的11月25日-26日,pv無(wú)明顯上漲,因此認(rèn)為12月2-3日的上漲可能與周末的雙十二預(yù)熱營(yíng)銷(xiāo)活動(dòng)效果有關(guān)。
創(chuàng)建用戶(hù)每小時(shí)的行為視圖(按小時(shí))
create view time_behavior as SELECT time,
SUM(CASE WHEN behavior='pv' THEN 1 ELSE 0 END)AS '瀏覽數(shù)',
SUM(CASE WHEN behavior='fav' THEN 1 ELSE 0 END)AS '收藏?cái)?shù)',
SUM(CASE WHEN behavior='cart' THEN 1 ELSE 0 END)AS '購(gòu)物車(chē)',
SUM(CASE WHEN behavior='buy' THEN 1 ELSE 0 END)AS '付費(fèi)數(shù)'
FROM user
GROUP BY time
ORDER BY time
分析:
(1)1-6點(diǎn)使用淘寶的人數(shù)處于低峰,可能是因?yàn)榇藭r(shí)大部分用戶(hù)都處于睡眠狀態(tài)有關(guān);6 -10點(diǎn)使用人數(shù)逐漸增多,10-18點(diǎn)使用量趨于穩(wěn)定狀態(tài);18-21點(diǎn)用戶(hù)行為逐漸活躍,可能與用戶(hù)下班后有時(shí)間使用淘寶購(gòu)物有關(guān),晚間21-23點(diǎn)達(dá)到高峰值,這個(gè)時(shí)間段是大部分人群的睡前時(shí)間,和人們喜歡在睡前購(gòu)物的心理有關(guān)。夜間23-1點(diǎn)(次日)可能是部分人群進(jìn)入睡眠,導(dǎo)致使用人數(shù)下降。
(2)晚間22-23點(diǎn)為加購(gòu)峰值,商家可以此時(shí)在購(gòu)物車(chē)頁(yè)面加大活動(dòng)力度或發(fā)紅包補(bǔ)貼,刺激用戶(hù)消費(fèi)欲望,促進(jìn)購(gòu)買(mǎi)轉(zhuǎn)轉(zhuǎn)化。
4.用戶(hù)流失分析
計(jì)算用戶(hù)總數(shù)
select count(distinct id) as 用戶(hù)總數(shù) from user;
計(jì)算跳失率:跳失率=只點(diǎn)擊一次瀏覽的用戶(hù)數(shù)量/總用戶(hù)訪(fǎng)問(wèn)量
select count(*) as 只瀏覽一次就離開(kāi)的人數(shù) from
(select id from user group by id having count(behavior)=1) as A
分析:統(tǒng)計(jì)時(shí)間為9天,只瀏覽一次就離開(kāi)的人數(shù)為1,總用戶(hù)訪(fǎng)問(wèn)量為9969,跳失率=1/9969=0.01%,占比幾乎可以忽略不計(jì),說(shuō)明淘寶擁有足夠的吸引力讓用戶(hù)停留在APP中。
用戶(hù)行為數(shù)漏斗計(jì)算
select behavior,count(*) as 行為次數(shù) from user group by behavior;

分析:由于收藏和加入購(gòu)物車(chē)都為瀏覽和購(gòu)買(mǎi)階段之間確定購(gòu)買(mǎi)意向的用戶(hù)行為,且不分先后順序,因此將其算作一個(gè)階段,可以看到從瀏覽到有購(gòu)買(mǎi)只有buy/pv=2.25%的轉(zhuǎn)化率,流失率很高。下面用假設(shè)檢驗(yàn)分析方法的思路來(lái)驗(yàn)證轉(zhuǎn)化率低的原因。
5.假設(shè)檢驗(yàn)分析方法
為了進(jìn)一步找出轉(zhuǎn)化率低的原因所在,這里提出兩個(gè)假設(shè):
假設(shè)一:用戶(hù)瀏覽商品時(shí)未使用收藏加購(gòu)功能,導(dǎo)致產(chǎn)生購(gòu)買(mǎi)意愿時(shí)增加了搜尋成本,從而使購(gòu)買(mǎi)意愿下降。
假設(shè)二:商品熱搜產(chǎn)品與熱銷(xiāo)產(chǎn)品不匹配造成的轉(zhuǎn)化率低。

5.1驗(yàn)證假設(shè)一:未把商品收藏或加入購(gòu)物車(chē)增加購(gòu)買(mǎi)麻煩,降低購(gòu)買(mǎi)意愿
建立購(gòu)買(mǎi)流程視圖
create view 購(gòu)買(mǎi)流程as
select id,item,category,
sum(case when behavior='pv' then 1 else 0 end) as pv,
sum(case when behavior'fav' then 1 else 0 end) as fav,
sum(case when behavior='cart' then 1 else 0 end) as cart,
sum(case when behavior='buy' then 1 else 0 end) as buy
from user
group by id,item,category;--分別按照id,item,category分組
不同購(gòu)買(mǎi)流程分析
本數(shù)據(jù)集用戶(hù)行為類(lèi)型包括點(diǎn)擊pv、收藏fav、加入購(gòu)物車(chē)cart、購(gòu)買(mǎi)buy。由之前分析可知,用戶(hù)購(gòu)買(mǎi)流程可分為:
點(diǎn)擊后直接購(gòu)買(mǎi):pv-buy
select count(1) as 瀏覽人數(shù) from 購(gòu)買(mǎi)流程 where pv>0;
select count(1) as 瀏覽后直接購(gòu)買(mǎi)人數(shù) from 購(gòu)買(mǎi)流程
where pv>0 and fav=0 and cart=0 and buy>0 ;
點(diǎn)擊、收藏后購(gòu)買(mǎi):pv-fav-buy
select count(1) as 瀏覽后收藏人數(shù) from 購(gòu)買(mǎi)流程 where pv>0 and fav>0;
select count(1) as 瀏覽后收藏再購(gòu)買(mǎi)人數(shù) from 購(gòu)買(mǎi)流程 where pv>0 and fav>0 and cart=0 and buy>0;
點(diǎn)擊、加購(gòu)后購(gòu)買(mǎi):pv-cart-buy
select count(1) as 瀏覽后加購(gòu)再購(gòu)買(mǎi)人數(shù) from 購(gòu)買(mǎi)流程 where pv>0 and cart>0 ;
select count(1) as 瀏覽后加購(gòu)再購(gòu)買(mǎi)人數(shù) from 購(gòu)買(mǎi)流程 where pv>0 and fav=0 and cart>0 and buy>0;
點(diǎn)擊、收藏并加購(gòu)后購(gòu)買(mǎi):pv-fav、cart-buy
select count(1) as 瀏覽收藏加購(gòu)人數(shù) from 購(gòu)買(mǎi)流程 where pv>0 and cart>0 and fav>0 ;
select count(1) as 瀏覽收藏加購(gòu)再購(gòu)買(mǎi)人數(shù) from 購(gòu)買(mǎi)流程 where pv>0 and fav>0 and cart>0 and buy>0;




分析:通過(guò)上述流程轉(zhuǎn)化分析,發(fā)現(xiàn)在pv—fav—buy、pv—cart—buy以及pv——fav、cart—buy中的購(gòu)買(mǎi)轉(zhuǎn)化率明顯大于pv—buy中的購(gòu)買(mǎi)轉(zhuǎn)化率。這是因?yàn)槲窗焉唐肥詹鼗蚣尤胭?gòu)物車(chē),用戶(hù)想要購(gòu)買(mǎi)時(shí)就需要重新搜尋,增加了搜尋成本和麻煩,從而使得用戶(hù)購(gòu)買(mǎi)意愿下降。假設(shè)一成立。這種情況下可以通過(guò)以下方法鼓勵(lì)用戶(hù)使用購(gòu)物車(chē)和收藏功能:
(1)收藏商品再下單可以領(lǐng)取優(yōu)惠券;
(2)將商品加入購(gòu)物車(chē)可以不定時(shí)享受折扣。
5.2驗(yàn)證假設(shè)二:熱搜-熱銷(xiāo)商品匹配度低
統(tǒng)計(jì)所有商品的購(gòu)買(mǎi)次數(shù),同時(shí)找到購(gòu)買(mǎi)次數(shù)、瀏覽次數(shù)、收藏次數(shù)和加入購(gòu)物車(chē)次數(shù)最多的商品。取銷(xiāo)售排名前50的為熱銷(xiāo)商品,取瀏覽+加購(gòu)+收藏排名前50的為熱搜商品,觀察商品id重合情況。
提取排名前50的熱銷(xiāo)商品
select * from (select item,count(1) as 熱銷(xiāo)商品,
row_number()over(order by count(1) desc )as 熱銷(xiāo)排名 from user
where behavior='buy' group by item)as A where A.熱銷(xiāo)排名<51;
提取排名前50的熱銷(xiāo)商品
select * from (SELECT item, COUNT(1) AS 熱搜商品 ,
row_number() over(order by COUNT(1) desc) as 熱搜排名 FROM user
WHERE behavior='pv' or behavior='fav' or behavior='cart' GROUP BY item) as A where A.熱搜排名<51;
熱銷(xiāo)商品與熱搜商品匹配度分析
select A.item,A.熱銷(xiāo)商品,A.熱銷(xiāo)排名,B.熱搜商品,B.熱搜排名 from
(select * from (select item,count(1) as 熱銷(xiāo)商品,row_number()over(order by count(1) desc )as 熱銷(xiāo)排名 from user where behavior='buy' group by item)as A where A.熱銷(xiāo)排名<51) as A
inner join
(select * from (SELECT item, COUNT(1) AS 熱搜商品 ,row_number() over(order by COUNT(1) desc) as 熱搜排名 FROM user WHERE behavior='pv' or behavior='fav' or behavior='cart' GROUP BY item) as A where A.熱搜排名<51) as B
on A.item=B.item
分析:
(1)由此可看出,在銷(xiāo)量最高的前50名商品中,熱搜商品只有5種,匹配率為10%,說(shuō)明熱銷(xiāo)產(chǎn)品和熱搜產(chǎn)品的匹配度不高。假設(shè)二成立。
(2)匹配度低可能有以下兩種情況:a.推薦算法效果不佳,詳情頁(yè)的信息流展示可能不太合理,導(dǎo)致首頁(yè)推薦的大部分商品可能未精準(zhǔn)匹配用戶(hù)需求,大多數(shù)人只是點(diǎn)擊后就離開(kāi),并沒(méi)有購(gòu)買(mǎi)意愿。針對(duì)這種情況建議淘寶APP優(yōu)化推薦算法,做到精準(zhǔn)運(yùn)營(yíng)。b.熱搜商品優(yōu)惠力度不夠。可能商家為了吸引用戶(hù)點(diǎn)擊在商品展示頁(yè)投放的價(jià)格具有較強(qiáng)吸引力,但商品詳情頁(yè)的實(shí)際價(jià)格可能遠(yuǎn)高于展示價(jià)格,從而降低了用戶(hù)的購(gòu)買(mǎi)意愿。這時(shí)建議商家將熱搜排名靠前而熱銷(xiāo)排名靠后的商品加大優(yōu)惠力度,實(shí)行團(tuán)購(gòu)打折等手段提升購(gòu)買(mǎi)轉(zhuǎn)化率。
6.商品復(fù)購(gòu)分析
按被購(gòu)買(mǎi)次數(shù)劃分商品
SELECT A.`被購(gòu)買(mǎi)次數(shù)`,COUNT(item) as '商品數(shù)' from
(SELECT item, COUNT(id) AS '被購(gòu)買(mǎi)次數(shù)' FROM user WHERE behavior='buy' GROUP BY item) as A
GROUP BY A.`被購(gòu)買(mǎi)次數(shù)`
order by A.`被購(gòu)買(mǎi)次數(shù)` asc;
分析:在本次統(tǒng)計(jì)的數(shù)據(jù)中,復(fù)購(gòu)次數(shù)集中在1-4次,呈長(zhǎng)尾分布,該階段用戶(hù)消費(fèi)欲望不大。其中只購(gòu)買(mǎi)一次的產(chǎn)品有27611種,購(gòu)買(mǎi)兩次的產(chǎn)品有3418種,本次分析的商品中用戶(hù)購(gòu)買(mǎi)的共有32485種商品,19544名用戶(hù)中,被購(gòu)買(mǎi)次數(shù)最多的商品僅為35次,沒(méi)有出現(xiàn)購(gòu)買(mǎi)用戶(hù)數(shù)量非常集中的商品,而被購(gòu)買(mǎi)一次的商品占到27611/32485=85%,說(shuō)明商品售賣(mài)主要依靠長(zhǎng)尾商品的累積效應(yīng),而非爆款商品的帶動(dòng)。建議多開(kāi)展?fàn)I銷(xiāo)活動(dòng),比如淘寶的達(dá)成金主的條件限制,鼓勵(lì)用戶(hù)復(fù)購(gòu)。對(duì)于用戶(hù)消費(fèi)習(xí)慣的分析,通過(guò)了解用戶(hù)消費(fèi)的集中時(shí)段集中實(shí)施各種營(yíng)銷(xiāo)活動(dòng),提高投入產(chǎn)出比。
7.轉(zhuǎn)化率分析
不用時(shí)間尺度下的轉(zhuǎn)化率
每日付費(fèi)轉(zhuǎn)化率
select date,瀏覽數(shù),付費(fèi)數(shù),付費(fèi)數(shù)/瀏覽數(shù) as '轉(zhuǎn)化率' from user_behavior

分析:11.25-12.03的9天內(nèi),淘寶APP的付費(fèi)轉(zhuǎn)化率再2%-2.6%之間,其中,在11.26-11.27日轉(zhuǎn)化率呈現(xiàn)較大幅度增長(zhǎng),于11.27達(dá)到最高值2.53%,11.27-11.28發(fā)生小幅度下降,11.28-11.29呈小幅升高,11.29以后呈下降趨勢(shì)。
每小時(shí)付費(fèi)轉(zhuǎn)化率
select time,瀏覽數(shù),付費(fèi)數(shù),付費(fèi)數(shù)/瀏覽數(shù) as 轉(zhuǎn)化率 from time_behavior;

分析:由上圖可以看出,一天內(nèi)夜間3:00轉(zhuǎn)化率最低且瀏覽量也很低,可能是大部分人處于睡眠狀態(tài),上午10:00-11:00轉(zhuǎn)化率最高,其次下午15-17點(diǎn)的轉(zhuǎn)化率也較高,之后呈逐漸下降趨勢(shì)。雖然APP使用量和瀏覽量在晚間21:00-23:00達(dá)到高峰,但此階段的付費(fèi)轉(zhuǎn)化率并不高,建議商家可以在這個(gè)時(shí)間段將優(yōu)惠力度加大,例如發(fā)放一些優(yōu)惠券等,提升用戶(hù)的購(gòu)買(mǎi)欲望,促進(jìn)購(gòu)買(mǎi)轉(zhuǎn)化。
不同類(lèi)別商品的付費(fèi)轉(zhuǎn)化率
SELECT category,
SUM(CASE WHEN behavior='pv' THEN 1 ELSE 0 END)AS '瀏覽數(shù)',
SUM(CASE WHEN behavior='fav' THEN 1 ELSE 0 END)AS '收藏?cái)?shù)',
SUM(CASE WHEN behavior='cart' THEN 1 ELSE 0 END)AS '購(gòu)物車(chē)',
SUM(CASE WHEN behavior='buy' THEN 1 ELSE 0 END)AS '付費(fèi)數(shù)'
FROM user
GROUP BY category
order by 瀏覽數(shù) desc

分析:由上圖可以看出,商品商品類(lèi)別為2735466和2885642的兩類(lèi)商品的轉(zhuǎn)化率最高,分別為3.27%和3.26%,類(lèi)別為154040的商品轉(zhuǎn)化率最低,為0.31%,對(duì)于商品瀏覽量高,而轉(zhuǎn)化率非常低的,建議商家對(duì)商品購(gòu)買(mǎi)流程使用轉(zhuǎn)化漏斗進(jìn)行分析并進(jìn)行改善。
五、基于RFM理論找出有價(jià)值的用戶(hù)
M-消費(fèi)金額,由于數(shù)據(jù)源中沒(méi)有相關(guān)的金額數(shù)據(jù),不計(jì)入評(píng)分。
R-最近購(gòu)買(mǎi)時(shí)間
用戶(hù)數(shù)據(jù)的時(shí)間范圍為9天,最近購(gòu)買(mǎi)時(shí)間的區(qū)間為0-9,將其分為5檔,0-1,1-2,3-4,5-6,7-8分別對(duì)應(yīng)評(píng)分1到5。
創(chuàng)建用戶(hù)購(gòu)買(mǎi)時(shí)間到12-04日的距離視圖
CREATE VIEW pay_B AS
SELECT id, DATEDIFF('2017-12-04',MAX(date)) AS B FROM user WHERE behavior='buy' GROUP BY id;
創(chuàng)建R得分視圖
create view RR as
SELECT id,
(CASE WHEN B BETWEEN 7 AND 8 THEN 1
WHEN B BETWEEN 5 AND 6 THEN 2
WHEN B BETWEEN 3 AND 4 THEN 3
WHEN B BETWEEN 1 AND 2 THEN 4
WHEN B BETWEEN 0 AND 1 THEN 5
ELSE null END) AS R
FROM pay_B ORDER BY R DESC
F-消費(fèi)頻率
查看用戶(hù)購(gòu)買(mǎi)次數(shù)
SELECT id,count(id)as '次數(shù)' from user where behavior='buy' group by id order by 次數(shù) desc;
分析:付費(fèi)用戶(hù)中消費(fèi)次數(shù)從低到高為1-72次,將其分為5檔,1-15,16-30,31-45,46-60,61-72分別對(duì)應(yīng)評(píng)分0到4。
創(chuàng)建用戶(hù)購(gòu)買(mǎi)次數(shù)視圖
CREATE VIEW pay_F AS SELECT id, COUNT(*) AS A FROM user WHERE behavior='buy' GROUP BY id;創(chuàng)建F得分視圖
create view FF as
SELECT id, (CASE WHEN A BETWEEN 1 AND 15 THEN 1
WHEN A BETWEEN 16 AND 30 THEN 2
WHEN A BETWEEN 31 AND 45 THEN 3
WHEN A BETWEEN 46 AND 57 THEN 4
WHEN A BETWEEN 58 AND 72 THEN 5 ELSE 0 END) as F
FROM pay_F ORDER BY F DESC;
創(chuàng)建RFM得分視圖
create view RR_FF as SELECT RR.id,RR.R,FF.F from RR left join FF on RR.id=FF.id
計(jì)算R、F平均值
select avg(R) as R平均值,avg(F) as F平均值 from RR_FF;
按得分與平均分的關(guān)系進(jìn)行用戶(hù)分類(lèi)
select 用戶(hù)分類(lèi),count(用戶(hù)ID) as 人數(shù)
from (select 用戶(hù)ID,
(case when R >3.5544 and F >1.3249 then "重要價(jià)值客戶(hù)"
when R >3.5544 and F <1.3249 then "重要發(fā)展客戶(hù)"
when R <3.5544 and F >1.3249 then "重要保持客戶(hù)"
when R <3.5544 and F <1.3249 then "重要挽留客戶(hù)"
else 0 end) as 用戶(hù)分類(lèi)
from RR_FF) as a group by 用戶(hù)分類(lèi);
分析:
(1)重要價(jià)值客戶(hù)是指R,F得分都在平均分以上的用戶(hù),此類(lèi)用戶(hù)的購(gòu)買(mǎi)力和粘性較高,且近期極有可能再次購(gòu)買(mǎi);重要發(fā)展客戶(hù)是指R得分較高,而F得分較低的用戶(hù),此類(lèi)用戶(hù)近期買(mǎi)過(guò)但粘性不高;重要保持客戶(hù)是指F得分較高,但R值較低的用戶(hù),此類(lèi)用戶(hù)粘性較好但近期購(gòu)買(mǎi)行為較少;重要挽留客戶(hù)是指R,F(xiàn)得分都在平均分以下,粘性不高且近期很少購(gòu)買(mǎi),此類(lèi)用戶(hù)如果不進(jìn)行挽留將會(huì)成為流失用戶(hù)。
(2)根據(jù)用戶(hù)分類(lèi)結(jié)果,用戶(hù)最主要集中在重要發(fā)展客戶(hù)和重要挽留客戶(hù),應(yīng)針對(duì)不用的客戶(hù)實(shí)行不同的運(yùn)營(yíng)策略。
六. 結(jié)論與建議
本文分析了淘寶APP用戶(hù)行為數(shù)據(jù)共200萬(wàn)條,刪去991條異常數(shù)據(jù)后,從五個(gè)不同角度提出業(yè)務(wù)問(wèn)題,使用AARRR模型和RFM模型分析數(shù)據(jù)給出如下結(jié)論和建議。
1.一天內(nèi)用戶(hù)最活躍的時(shí)間段是21-23點(diǎn),尤其是22點(diǎn)-23點(diǎn)的這一小時(shí)。
建議:把握該黃金時(shí)段,集中進(jìn)行營(yíng)銷(xiāo)活動(dòng)提高用戶(hù)購(gòu)買(mǎi)轉(zhuǎn)化率,例如平臺(tái)帶貨直播、分會(huì)場(chǎng)促銷(xiāo)、限時(shí)搶購(gòu)等。且更多選擇熱搜熱銷(xiāo)的商品類(lèi)目和商品,迎合用戶(hù)需求。
2. 用戶(hù)這9日內(nèi)的留存率均在75%以上,且12月2日-3日的留存率超過(guò)98%,說(shuō)明客戶(hù)較為穩(wěn)定,瀏覽意愿極為強(qiáng)烈。這可能是因?yàn)榇嬖谛掠脩?hù)打卡活動(dòng)等,調(diào)動(dòng)了用戶(hù)的登錄積極性。
建議:多舉辦老用戶(hù)拉活階梯式獎(jiǎng)勵(lì)、新用戶(hù)瀏覽集積分等活動(dòng),培養(yǎng)用戶(hù)登錄習(xí)慣,調(diào)動(dòng)瀏覽熱情。發(fā)放新用戶(hù)滿(mǎn)減優(yōu)惠券、首單直減等活動(dòng),提高新用戶(hù)的購(gòu)買(mǎi)轉(zhuǎn)化率。
3. 用戶(hù)在點(diǎn)擊→收藏→購(gòu)買(mǎi)、點(diǎn)擊→加入購(gòu)物車(chē)→購(gòu)買(mǎi)、點(diǎn)擊→收藏和加購(gòu)→購(gòu)買(mǎi)這三個(gè)流程的購(gòu)買(mǎi)轉(zhuǎn)化率都明顯大于點(diǎn)擊→購(gòu)買(mǎi)中的購(gòu)買(mǎi)轉(zhuǎn)化率。這可能是因?yàn)槭詹鼗蚣淤?gòu)能提供購(gòu)買(mǎi)便捷,提高用戶(hù)購(gòu)買(mǎi)意愿。
建議:增加跨店滿(mǎn)減、收藏加購(gòu)送商品贈(zèng)品、送福利等活動(dòng),引導(dǎo)用戶(hù)收藏加購(gòu)行為,從而提高用戶(hù)購(gòu)買(mǎi)轉(zhuǎn)化率。
4.商品熱搜和熱銷(xiāo)并不匹配,大部分商品可能未精準(zhǔn)匹配用戶(hù)需求或優(yōu)惠力度不夠,并沒(méi)有促使用戶(hù)進(jìn)行購(gòu)買(mǎi)。
建議:
(1)優(yōu)化推薦算法,優(yōu)先推薦熱搜、熱銷(xiāo)排名靠前的商品,降低用戶(hù)搜尋成本。
(2)優(yōu)化搜索功能,根據(jù)用戶(hù)畫(huà)像更精準(zhǔn)推薦商品,使熱搜和熱銷(xiāo)更為匹配。
(3)加大熱搜商品的優(yōu)惠力度,提高熱搜商品的購(gòu)買(mǎi)轉(zhuǎn)化率。
(4)針對(duì)瀏覽量高而購(gòu)買(mǎi)轉(zhuǎn)化率低的商品,應(yīng)改善商品頁(yè)、詳情頁(yè)以及評(píng)論區(qū)管理。
5. 用戶(hù)最主要集中在重要發(fā)展客戶(hù)和重要挽留客戶(hù)。
建議:針對(duì)不用客戶(hù)實(shí)行不同運(yùn)營(yíng)策略。
(1)對(duì)于占比最大的重要發(fā)展客戶(hù),消費(fèi)頻率低但最近一次消費(fèi)時(shí)間間隔短,可以通過(guò)發(fā)放滿(mǎn)減優(yōu)惠券等方法提高消費(fèi)頻率;
(2)對(duì)于占比第二大的重要挽留客戶(hù),消費(fèi)頻率低且最近一次消費(fèi)間隔長(zhǎng),面臨用戶(hù)流失風(fēng)險(xiǎn),可以通過(guò)電話(huà)郵件等形式主動(dòng)聯(lián)系客戶(hù),調(diào)查問(wèn)題所在,并有針對(duì)地進(jìn)行挽回;
(3)對(duì)于占比較大的重要價(jià)值客戶(hù),應(yīng)提供專(zhuān)屬的VIP服務(wù),通過(guò)服務(wù)質(zhì)量進(jìn)一步調(diào)高其粘性;
(4)對(duì)于占比較低的重要保持客戶(hù),消費(fèi)頻次高但最近一次消費(fèi)時(shí)間間隔長(zhǎng),可以通過(guò)短信郵件等方式提醒上新、邀請(qǐng)參加老用戶(hù)反饋活動(dòng)等提高復(fù)購(gòu)率。
