你要的用戶(hù)畫(huà)像實(shí)踐來(lái)了!

有讀者聯(lián)系我希望做一期和用戶(hù)畫(huà)像有關(guān)的文章,那么這一期我們就來(lái)簡(jiǎn)單的聊一聊用戶(hù)畫(huà)像...
知乎原文鏈接:https://zhuanlan.zhihu.com/p/339848708
0.身邊的用戶(hù)畫(huà)像
首先我們來(lái)感性的認(rèn)識(shí)一下用戶(hù)畫(huà)像
用戶(hù)畫(huà)像的核心是為用戶(hù)打標(biāo)簽,即——將用戶(hù)的每個(gè)具體信息抽象成標(biāo)簽,利用這些標(biāo)簽將用戶(hù)形象具體化,從而為用戶(hù)提供有針對(duì)性的服務(wù)。
我們身邊就有用戶(hù)畫(huà)像應(yīng)用比較好的例子
比如我前幾天在某網(wǎng)站上看到一個(gè)女生相親的擇偶標(biāo)準(zhǔn),印象比較深刻

如果我們是某相親網(wǎng)站的工作人員,需要給這個(gè)女生進(jìn)行男嘉賓的匹配,那么她理想的男嘉賓就是一個(gè)群體,通過(guò)一個(gè)個(gè)的標(biāo)簽來(lái)描述這個(gè)群體。
男性,未婚,年齡33-28歲,身高176-188,皮膚白體型偏瘦,年收入在12萬(wàn)元以上,在武漢生活并且購(gòu)房,擁有本科以及上的學(xué)歷,家中獨(dú)子沒(méi)有兄弟姐妹,不喜歡打牌。
1.用戶(hù)畫(huà)像體系相關(guān)概念
如何一句話(huà)說(shuō)清楚什么是用戶(hù)畫(huà)像?
用戶(hù)畫(huà)像是通過(guò)分析用戶(hù)的基礎(chǔ)信息、特征偏好、社會(huì)屬性等各維度的數(shù)據(jù),刻畫(huà)出用戶(hù)的信息全貌,從中挖掘用戶(hù)價(jià)值,從而提供個(gè)性化推薦、精準(zhǔn)營(yíng)銷(xiāo)等服務(wù)。
1.1標(biāo)簽類(lèi)型
我們一般將用戶(hù)標(biāo)簽分為3類(lèi)
統(tǒng)計(jì)類(lèi)標(biāo)簽
這類(lèi)標(biāo)簽是最為基礎(chǔ)也最為常見(jiàn)的標(biāo)簽類(lèi)型,例如:對(duì)于某個(gè)用戶(hù)來(lái)說(shuō),其姓名、性別、年齡、地市、活躍時(shí)長(zhǎng)等,這類(lèi)數(shù)據(jù)可以從用戶(hù)注冊(cè)數(shù)據(jù)、用戶(hù)消費(fèi)數(shù)據(jù)中得出,該類(lèi)數(shù)據(jù)構(gòu)成了用戶(hù)畫(huà)像的基礎(chǔ)。
規(guī)則類(lèi)標(biāo)簽
基于用戶(hù)的行為以及規(guī)則,在實(shí)際開(kāi)發(fā)畫(huà)像的過(guò)程中,由于運(yùn)營(yíng)人員對(duì)業(yè)務(wù)更為熟悉,而數(shù)據(jù)人員對(duì)數(shù)據(jù)的結(jié)構(gòu)、分布、特征更為熟悉,因此規(guī)則類(lèi)標(biāo)簽的規(guī)則由運(yùn)營(yíng)人員和數(shù)據(jù)人員共同協(xié)商確定
學(xué)習(xí)挖掘類(lèi)標(biāo)簽
通過(guò)機(jī)器學(xué)習(xí)挖掘產(chǎn)生,根據(jù)用戶(hù)的行為和規(guī)則進(jìn)行預(yù)測(cè)和判斷。比如某個(gè)用戶(hù)檢查購(gòu)買(mǎi)衛(wèi)生巾,我們可以通過(guò)這個(gè)行為來(lái)推出用戶(hù)性別為女性
1.2畫(huà)像價(jià)值
在用戶(hù)量大業(yè)務(wù)復(fù)雜的公司,都會(huì)花很高的成本構(gòu)建用戶(hù)畫(huà)像體系,在各個(gè)業(yè)務(wù)線(xiàn)上采集數(shù)據(jù)做分析,不斷深入的了解用戶(hù)才能提供更加精準(zhǔn)的服務(wù)和多樣化的運(yùn)營(yíng)策略。

用戶(hù)引流
通過(guò)現(xiàn)有用戶(hù)的畫(huà)像分析,在相關(guān)DMP廣告平臺(tái)做投放,重點(diǎn)推薦其平臺(tái)上具有相關(guān)類(lèi)似標(biāo)簽的用戶(hù),為產(chǎn)品做用戶(hù)引流,這里用的是相似用戶(hù)快速擴(kuò)量的概念。
新用戶(hù)冷啟動(dòng)
快速分析新注冊(cè)用戶(hù)可能偏向的屬性和興趣偏好,實(shí)現(xiàn)服務(wù)快速精準(zhǔn)推薦,例如用戶(hù)注冊(cè)地所在區(qū)域,可以通過(guò)該區(qū)域用戶(hù)的通用標(biāo)簽推測(cè)該新用戶(hù)的特征。
精準(zhǔn)或個(gè)性化服務(wù)
這里就是根據(jù)豐富的用戶(hù)畫(huà)像分析,理解用戶(hù)并提供精準(zhǔn)服務(wù)或個(gè)性化服務(wù)。提供好的服務(wù)自然能做到用戶(hù)的深度沉淀。
多場(chǎng)景識(shí)別
這里場(chǎng)景相對(duì)偏復(fù)雜,通過(guò)一個(gè)案例描述,例如在某個(gè)平臺(tái)用手機(jī)號(hào)A注冊(cè),之后該手機(jī)號(hào)A丟失,換用手機(jī)號(hào)B之后,通過(guò)相關(guān)行為去理解用戶(hù)是否手機(jī)號(hào)A的用戶(hù),也可以根據(jù)同個(gè)手機(jī)序列識(shí)別不同用戶(hù)或者多個(gè)手機(jī)序列識(shí)別相同用戶(hù)。
沉默用戶(hù)喚醒
基于精細(xì)化的標(biāo)簽和多個(gè)場(chǎng)景數(shù)據(jù),對(duì)用戶(hù)的沉默程度做快速識(shí)別,基于畫(huà)像分析制定運(yùn)營(yíng)策略進(jìn)行激活召回減少用戶(hù)流失。
2.用戶(hù)畫(huà)像實(shí)踐項(xiàng)目
你是某電商公司的數(shù)據(jù)分析師,你的運(yùn)營(yíng)同事找到你,最近平臺(tái)某家電類(lèi)目的訂單數(shù)量,瀏覽量有所下降,平臺(tái)想做一些促銷(xiāo)活動(dòng),給用戶(hù)發(fā)優(yōu)惠劵,希望你能對(duì)本次活動(dòng)提出一些建議
促銷(xiāo)活動(dòng)需要哪幾個(gè)部分的信息呢?
促銷(xiāo)活動(dòng)的受眾群體 促銷(xiāo)活動(dòng)的上線(xiàn)時(shí)間 促銷(xiāo)活動(dòng)所覆蓋的產(chǎn)品 ...
確定問(wèn)題后,我們從用戶(hù)的基本屬性,行為屬性以及偏好屬性入手
2.1從數(shù)據(jù)庫(kù)中提取數(shù)據(jù)
數(shù)據(jù)來(lái)源某電商平臺(tái)2020年8月12日-2020年8月19日某家電類(lèi)目脫敏訂單數(shù)據(jù)
Datawhale公眾號(hào)后臺(tái)回復(fù) 電商數(shù)據(jù) 可獲取數(shù)據(jù)。
data.head()

2.2用戶(hù)性別和年齡分布
labels = ['男','女']
values = [male_user, female_user]
trace = [go.Pie(labels=labels, values=values)]
layout = go.Layout(
title = dict(text='用戶(hù)的性別分布',x=0.5)
)
fig = go.Figure(data = trace, layout = layout)
fig

x = ['18歲以下', '18~25歲', '25~35歲', '35~45歲', '45~55歲', '55歲以上']
y = user_age_df['user_age_count']
trace = go.Bar(
x = x,
y = y,
text=y,
textposition='outside')
layout = go.Layout(
title = dict(text='用戶(hù)年齡分布',x=0.5),
)
fig = go.Figure(data=trace,layout=layout)
fig

從數(shù)據(jù)來(lái)看,用戶(hù)消費(fèi)沒(méi)有明顯的性別偏好,男性用戶(hù)稍微多一點(diǎn),用戶(hù)的年齡集中在25-35歲之間,25歲以下以及45歲以上的用戶(hù)數(shù)較少。
25歲以下的用戶(hù)多為在校學(xué)生,對(duì)于家電類(lèi)目的購(gòu)買(mǎi)需求低
45歲以上的用戶(hù)多為中年人員,家電類(lèi)目需求低,同時(shí)手機(jī)網(wǎng)購(gòu)的比例低
2.3用戶(hù)地域分布
y = user_region_df['province_name'][::-1] # 切片方法,讓列表反向。兩個(gè)冒號(hào)分隔為{起始位置:終止位置:步長(zhǎng)}
x = user_region_df['region_count'][::-1] # 其中步長(zhǎng)為正,從左往右取,步長(zhǎng)為負(fù),從右往左取
trace = go.Bar(
x = x,
y = y,
text=x,
textposition='outside',
orientation = 'h')
layout = go.Layout(
title = dict(text='用戶(hù)的地域分布',x=0.5)
)
fig = go.Figure(data=trace,layout=layout)
fig

y = user_city_df['ulp_addr_city'][::-1]
x = user_city_df['city_count'][::-1]
trace = go.Bar(
x = x,
y = y,
text=x,
textposition='outside',
orientation = 'h')
layout = go.Layout(
title = dict(text='用戶(hù)的城市分布',x=0.5)
)
fig = go.Figure(data=trace,layout=layout)
fig

用戶(hù)在城市分布上具有一定的集中性,大多集中在一線(xiàn)和新一線(xiàn)城市,因?yàn)橐痪€(xiàn)城市對(duì)年輕人有很強(qiáng)的吸引力,因此城市分布和用戶(hù)的年齡分布也相符合
2.4用戶(hù)的婚育狀況
labels = ['已婚', '未婚']
values = [married_user, unmarried_user]
trace = [go.Pie(labels=labels, values=values)]
layout = go.Layout(
title = dict(text='用戶(hù)的性別分布',x=0.5)
)
fig = go.Figure(data = trace, layout = layout)
fig

labels = ['高', '較高', '較低', '低']
values = [very_high, high, low, very_low]
trace = [go.Pie(labels=labels, values=values)]
layout = go.Layout(
title = dict(text='用戶(hù)的小孩情況',x=0.5)
)
fig = go.Figure(data = trace, layout = layout)
fig

從圖中的數(shù)據(jù)來(lái)看,近70%的小家電用戶(hù)都是已婚,超過(guò)60%的用戶(hù)有小孩的可能性高
2.5用戶(hù)的學(xué)歷和職業(yè)分布
y = user_edu_df['edu']
x = x = ['初中及以下', '高中(中專(zhuān))', '大學(xué)(專(zhuān)科及本科)', '研究生(碩士及以上)']
trace = go.Bar(
x = x,
y = y,
text=y,
textposition='outside')
layout = go.Layout(
title = dict(text='用戶(hù)的學(xué)歷分布',x=0.5)
)
fig = go.Figure(data=trace,layout=layout)
fig

x = ['金融從業(yè)者', '醫(yī)務(wù)人員', '公務(wù)員/事業(yè)單位', '白領(lǐng)/一般職員', '工人/服務(wù)業(yè)人員', '教師', '互聯(lián)網(wǎng)從業(yè)人員', '學(xué)生']
y = user_profession_df['profession']
trace = go.Bar(
x = x,
y = y,
text=y,
textposition='outside')
layout = go.Layout(
title = dict(text='用戶(hù)的學(xué)歷分布',x=0.5)
)
fig = go.Figure(data=trace,layout=layout)
fig

通過(guò)用戶(hù)的基礎(chǔ)屬性的研判來(lái)看,小家電的典型用戶(hù)為:
男性,年齡在28-30歲左右,已婚且有孩子
他在一線(xiàn)城市居中,本科學(xué)歷,在一家互聯(lián)網(wǎng)公司任職,有比較穩(wěn)定的收入
因?yàn)檫€剛進(jìn)入婚姻,因此有一定的生活品質(zhì)追求,同時(shí)比較關(guān)注家庭生活
因此,我們給運(yùn)營(yíng)同事的建議是,文案不用過(guò)于個(gè)性,促銷(xiāo)的商品要重點(diǎn)突出家庭品質(zhì)生活屬性,同時(shí)強(qiáng)調(diào)家電的健康與安全
2.6用戶(hù)購(gòu)買(mǎi)商品分布
y = user_order_cate_df['item_third_cate_name'][::-1]
x = user_order_cate_df['cate_count'][::-1]
trace = go.Bar(
x = x,
y = y,
text=x,
textposition='outside',
orientation = 'h')
layout = go.Layout(
title = dict(text='用戶(hù)購(gòu)買(mǎi)商品分布',x=0.5)
)
fig = go.Figure(data=trace,layout=layout)
fig

用戶(hù)購(gòu)買(mǎi)商品的類(lèi)目是用戶(hù)的行為數(shù)據(jù),從圖中的數(shù)據(jù)來(lái)看,最受歡迎的電器是電風(fēng)扇,考慮到這個(gè)數(shù)據(jù)采集的時(shí)間是8月12日,用戶(hù)購(gòu)買(mǎi)電風(fēng)扇的需求得到了釋放,在即將進(jìn)入秋天,因此應(yīng)該對(duì)其它商品 比如凈水器,加濕器等商品進(jìn)行促銷(xiāo)
x = ['星期一', '星期二', '星期三', '星期四', '星期五', '星期六', '星期日']
y = user_order_week_df_2['week_count']
trace = go.Scatter(
x = x,
y = y,
mode = 'lines', # 折線(xiàn)圖
line = dict(
width = 2
) )
layout = go.Layout(
title = dict(text='用戶(hù)購(gòu)買(mǎi)的日期分布',x=0.5))
fig = go.Figure(data=trace,layout=layout)
fig

x = [str(x) for x in range(0, 24)]
y = user_order_hms_df['hms_count']
trace = go.Scatter(
x = x,
y = y,
mode = 'lines', # 折線(xiàn)圖
line = dict(
width = 2
) )
layout = go.Layout(
title = dict(text='用戶(hù)購(gòu)買(mǎi)的時(shí)間分布',x=0.5),
xaxis=dict(
tickmode='linear'))
fig = go.Figure(data=trace,layout=layout)
fig

從日期和時(shí)間維度來(lái)看,訂單成交的高峰在周二和周六,從每天的時(shí)間來(lái)看,早上10點(diǎn)-11點(diǎn),晚上20點(diǎn)-22點(diǎn)有較大的成交量。
推測(cè)形成的原因,每周的周二和周六用戶(hù)更喜歡訪(fǎng)問(wèn)電商網(wǎng)站,并在早上10點(diǎn)左右下單,或者晚上10準(zhǔn)備上床休息時(shí)下單。
2.7用戶(hù)敏感度分析
x = ['不敏感', '輕度敏感', '中度敏感', '高度敏感', '極度敏感']
y = user_order_sens_promotion_df['sens_promotion_count']
trace = go.Bar(
x = x,
y = y,
text=y,
textposition='outside')
layout = go.Layout(
title = dict(text='用戶(hù)價(jià)格敏感度分布',x=0.5)
)
fig = go.Figure(data=trace,layout=layout)
fig

x = ['不敏感', '輕度敏感', '中度敏感', '高度敏感', '極度敏感']
y = user_order_sens_comment_df['sens_comment_count']
trace = go.Bar(
x = x,
y = y,
text=y,
textposition='outside')
layout = go.Layout(
title = dict(text='用戶(hù)頻率敏感度分布',x=0.5)
)
fig = go.Figure(data=trace,layout=layout)
fig

通過(guò)用戶(hù)敏感度分析來(lái)看,用戶(hù)對(duì)價(jià)格較為敏感,同時(shí)對(duì)評(píng)論極度敏感,因此促銷(xiāo)活動(dòng)的商品需要選擇有較好口碑的商品,才能提升活動(dòng)的轉(zhuǎn)化率
因此我們給運(yùn)營(yíng)同事的建議是:
促銷(xiāo)活動(dòng)的文案最好采用中性風(fēng)格,促銷(xiāo)的商品要重點(diǎn)突出家庭品質(zhì)生活屬性,同時(shí)強(qiáng)調(diào)家電的健康與安全 促銷(xiāo)的商品以夏末秋初需求旺盛的商品,如凈水器,飲水機(jī),加濕器等產(chǎn)品入手 促銷(xiāo)廣告投放的時(shí)間,最好選擇在每周的周二和周六這2個(gè)時(shí)間段,同時(shí)在早上9點(diǎn)和晚上9點(diǎn)提高廣告的頻率 促銷(xiāo)的商品需要選擇評(píng)論口碑較好的產(chǎn)品,可以在廣告中對(duì)商品的口碑進(jìn)行介紹
3.實(shí)踐思考
運(yùn)營(yíng)的同事聽(tīng)了你的建議,決定找了一些口碑較好的凈水器進(jìn)行定向促銷(xiāo),但是由于活動(dòng)資金的限制,只能選擇幾個(gè)特定型號(hào)的產(chǎn)品進(jìn)行推廣,因此同事希望你在產(chǎn)品的品牌和價(jià)格的選擇上給出一些建議。
可以將你的意見(jiàn)或者分析思路寫(xiě)在留言區(qū)。
