如何做用戶畫像分析?

我們經(jīng)常在淘寶網(wǎng)購物,作為淘寶方,他們想知道用戶是什么樣的,年齡、性別、城市、收入、購物品牌偏好、購物類型、平時(shí)的活躍程度等,這樣的一個(gè)用戶描述就是用戶畫像分析。
在實(shí)際工作中,用戶畫像分析是一個(gè)重要的數(shù)據(jù)分析手段,幫助產(chǎn)品策劃人員對(duì)產(chǎn)品功能進(jìn)行迭代,幫助產(chǎn)品運(yùn)營人員做用戶增長。
作為產(chǎn)品策劃人員,需要策劃一個(gè)好的功能,獲得用戶最大的可見價(jià)值與隱形價(jià)值、必須價(jià)值與增值價(jià)值,那么了解用戶并做用戶畫像分析,是數(shù)據(jù)分析師幫助產(chǎn)品策劃做更好的產(chǎn)品設(shè)計(jì)重要的一個(gè)環(huán)節(jié)。
作為產(chǎn)品運(yùn)營人員,比如針對(duì)用戶的拉新、挽留、付費(fèi)、裂變等的運(yùn)營,用戶畫像分析可以幫助產(chǎn)品運(yùn)營人員去找到他們的潛在用戶,從而用各種運(yùn)營手段去觸達(dá)。因?yàn)椋?dāng)我們知道群體特征時(shí),也基本可以判定潛在用戶也是類似的一群人,這樣才可以精準(zhǔn)地尋找新用戶,提高ROI。
總的來說,用戶畫像分析就是基于大量的數(shù)據(jù),建立用戶的屬性標(biāo)簽體系,同時(shí)利用這種屬性標(biāo)簽體系去描述用戶。

用戶畫像分析的作用
用戶畫像分析的作用主要有以下幾個(gè)方面(見圖1)。

圖1
(1)廣告投放
在做用戶增長時(shí),我們需要在一些外部渠道投放廣告,吸引可能的潛在用戶,比如,B站在抖音上投放廣告。
我們在選擇平臺(tái)進(jìn)行投放時(shí),有了用戶畫像分析,就可以精準(zhǔn)地進(jìn)行廣告投放,比如,抖音中主要的用戶年齡為是18~24歲,那么廣告投放時(shí)就可以針對(duì)這部分用戶群體,提高投放的ROI(見圖2)。假如我們沒有進(jìn)行用戶畫像分析,那么可能會(huì)出現(xiàn)投了很多次廣告,結(jié)果沒有人點(diǎn)擊的情況。

圖2
(2)精準(zhǔn)營銷
假如某個(gè)電商平臺(tái)需要做一個(gè)活動(dòng),給不同層次的用戶發(fā)放不同的券,就需要利用用戶畫像分析對(duì)用戶進(jìn)行劃分,比如,劃分成不同付費(fèi)次數(shù)的用戶,然后根據(jù)不同付費(fèi)次數(shù)發(fā)放不同的優(yōu)惠券。給付費(fèi)次數(shù)在1~10次的用戶發(fā)放10元優(yōu)惠券,依此類推(見圖3)。

圖3
(3)個(gè)性化推薦
個(gè)性化推薦即精確的內(nèi)容分發(fā),比如,我們在音樂類APP中會(huì)看到每日推薦,這是因?yàn)檫\(yùn)營人員在做點(diǎn)擊率預(yù)估模型(預(yù)測給你推薦的歌曲會(huì)不會(huì)被點(diǎn)擊)時(shí),會(huì)考慮用戶畫像屬性,這樣才有可能推薦用戶喜歡的類型。比如,根據(jù)你是“90后”,喜歡傷感的音樂,喜歡周杰倫這些屬性,推薦類似的歌曲給你,這就是基于用戶畫像推薦。
(4)風(fēng)控檢測
風(fēng)控檢測主要是金融或者銀行業(yè)涉及得比較多,常見的問題是銀行怎么決定是否放貸給申請(qǐng)人。普遍的解決方法是搭建一個(gè)風(fēng)控預(yù)測模型,預(yù)測申請(qǐng)人是否有可能不還貸款。模型的背后就有用戶畫像分析的功勞。用戶的收入水平、教育水平、職業(yè)、是否有家庭、是否有房子,以及過去的誠信記錄,這些畫像數(shù)據(jù)都關(guān)系到模型預(yù)測是否準(zhǔn)確(見圖4)。


圖4
(5)產(chǎn)品設(shè)計(jì)
互聯(lián)網(wǎng)的產(chǎn)品價(jià)值離不開用戶、需求、場景這三大元素,所以在做產(chǎn)品設(shè)計(jì)時(shí),要知道用戶到底是怎樣的一群人,他們的具體情況是什么,他們有什么特別需求,這樣才可以設(shè)計(jì)出對(duì)應(yīng)解決他們需求和痛點(diǎn)的產(chǎn)品功能。
在產(chǎn)品功能迭代時(shí),我們需要分析用戶畫像行為數(shù)據(jù),發(fā)現(xiàn)用戶的流失情況。典型的場景是用漏斗模型分析轉(zhuǎn)化情況,就是基于用戶的行為數(shù)據(jù)發(fā)現(xiàn)流失嚴(yán)重的頁面,從而優(yōu)化對(duì)應(yīng)的頁面。
比如,我們發(fā)現(xiàn)從下載到點(diǎn)擊付款的轉(zhuǎn)化率特別低,這可能是付款按鈕做得有問題,可以有針對(duì)性地優(yōu)化按鈕的位置等。
同時(shí),還可以分析這部分轉(zhuǎn)化率主要是在哪部分用戶群體中低,假如發(fā)現(xiàn)高齡用戶的轉(zhuǎn)化率要比中青年的轉(zhuǎn)化率低很多,則有可能是因?yàn)樽煮w的設(shè)置及按鈕位置不顯眼等,或者操作不方便。
(6)數(shù)據(jù)分析
在進(jìn)行描述性數(shù)據(jù)分析時(shí),經(jīng)常需要用戶畫像的數(shù)據(jù),比如,描述抖音中某美食類博主的用戶群體特征,可以關(guān)注他們觀看其他抖音視頻的情況,關(guān)注其他博主的情況等(見圖5)。

圖5
簡單來說,用戶畫像分析可以幫助數(shù)據(jù)分析師更加清晰地刻畫用戶。

如何搭建用戶畫像
用戶畫像架構(gòu)如圖6所示。

圖6
(1)數(shù)據(jù)層
進(jìn)行用戶畫像分析的基礎(chǔ)是獲取完整的數(shù)據(jù),互聯(lián)網(wǎng)數(shù)據(jù)主要是利用打點(diǎn),也就是通常所說的數(shù)據(jù)埋點(diǎn)上報(bào)的。整個(gè)過程是數(shù)據(jù)分析師根據(jù)業(yè)務(wù)需要提交數(shù)據(jù)上報(bào)的需求,然后由開發(fā)人員埋點(diǎn),獲得數(shù)據(jù)(見圖7)。

圖7
除了上報(bào)的數(shù)據(jù),還有從數(shù)據(jù)庫中同步的數(shù)據(jù),一般會(huì)存到Hive表中,按照數(shù)據(jù)倉庫的規(guī)范,根據(jù)主題來放置。其他數(shù)據(jù),比如調(diào)研的數(shù)據(jù),以Excel格式存在,就需要把Excel 數(shù)據(jù)導(dǎo)入Hive 表中。
(2)挖掘?qū)?/span>
有了基礎(chǔ)數(shù)據(jù)以后,就進(jìn)入挖掘?qū)樱诰驅(qū)又饕鰞杉虑椋粋€(gè)是數(shù)據(jù)倉庫的構(gòu)建,另一個(gè)是標(biāo)簽的預(yù)測,前者是后者的基礎(chǔ)。
一般來說,我們會(huì)根據(jù)數(shù)據(jù)層的數(shù)據(jù)表,對(duì)這些數(shù)據(jù)表的數(shù)據(jù)進(jìn)行清洗、匯總,然后按照數(shù)據(jù)倉庫的分層思想,比如按照數(shù)據(jù)原始層、數(shù)據(jù)清洗層、數(shù)據(jù)匯總層、數(shù)據(jù)應(yīng)用層等進(jìn)行表的設(shè)計(jì)(見圖8)。

圖8
數(shù)據(jù)原始層中的數(shù)據(jù)就是上報(bào)的數(shù)據(jù),沒有經(jīng)過數(shù)據(jù)清洗處理,是最外層的用戶明細(xì)數(shù)據(jù)。
數(shù)據(jù)清洗層主要是數(shù)據(jù)原始層的數(shù)據(jù)經(jīng)過簡單清洗之后的數(shù)據(jù),已去除“臟”數(shù)據(jù)等明顯異常的數(shù)據(jù)。
數(shù)據(jù)匯總層的數(shù)據(jù)主要是根據(jù)數(shù)據(jù)分析的需求,針對(duì)想要的業(yè)務(wù)指標(biāo)(比如,用戶一天的聽歌時(shí)長、歌曲數(shù)、歌手?jǐn)?shù)等),按照用戶的維度,把用戶行為進(jìn)行聚合,得到用戶的輕量指標(biāo)的聚合表。
數(shù)據(jù)匯總層的作用主要是可以快速匯總數(shù)據(jù),比如,一天的聽歌總數(shù)、聽歌總時(shí)長、聽歌時(shí)長高于1小時(shí)的用戶數(shù)、收藏歌曲數(shù)多于100的用戶數(shù)等的計(jì)算。
數(shù)據(jù)應(yīng)用層主要面向業(yè)務(wù)方的需求進(jìn)行加工,可能是在數(shù)據(jù)匯總的基礎(chǔ)上加工成對(duì)應(yīng)報(bào)表的指標(biāo)需求,比如,每天聽歌的人數(shù)、次數(shù)、時(shí)長;搜索的人數(shù)、次數(shù)、歌曲數(shù)等。
按照規(guī)范的數(shù)據(jù)倉庫把表格設(shè)計(jì)完成后,就可以得到一部分用戶的年齡、性別、地域的基礎(chǔ)屬性數(shù)據(jù),以及用戶瀏覽、付費(fèi)、活躍等行為數(shù)據(jù)。
有些用戶的數(shù)據(jù)無法獲取,以QQ音樂為例,我們一般無法獲取用戶的聽歌偏好屬性的數(shù)據(jù),需要通過機(jī)器學(xué)習(xí)模型對(duì)用戶的偏好進(jìn)行預(yù)測(見圖9)。機(jī)器學(xué)習(xí)的模型預(yù)測都是基于數(shù)據(jù)倉庫的數(shù)據(jù),完整的數(shù)據(jù)倉庫數(shù)據(jù)是模型特征構(gòu)建的基礎(chǔ)。

圖9
(3)服務(wù)層
有了數(shù)據(jù)層和挖掘?qū)右院螅脩舢嬒耋w系基本形成,那么就到了用戶畫像賦能的階段。最基礎(chǔ)的應(yīng)用就是利用用戶畫像寬表的數(shù)據(jù),對(duì)用戶行為進(jìn)行洞察歸因,挖掘行為和屬性特征的規(guī)律。
另外,比較大型的應(yīng)用就是搭建用戶畫像平臺(tái),其本質(zhì)是用戶畫像表的集成。
用戶提取:我們可以利用用戶畫像平臺(tái),快速提取用戶數(shù)據(jù),比如,提取18~24歲的女性群體,且聽過周杰倫歌曲的用戶。
分群對(duì)比:可以利用用戶畫像平臺(tái)進(jìn)行分群對(duì)比。比如,比較音樂類APP中VIP用戶和非VIP用戶在行為活躍和年齡、性別、地域、注冊時(shí)間、聽歌偏好上的差異。
功能畫像分析:可以利用用戶畫像平臺(tái)快速進(jìn)行某個(gè)功能的用戶畫像描述分析,比如,音樂類APP中的每日推薦功能,我們想要知道使用每日推薦的用戶是哪些用戶群體,以及使用每日推薦不同時(shí)長的用戶特征分別是怎樣的。
本文節(jié)選自《數(shù)據(jù)分析方法論和業(yè)務(wù)實(shí)戰(zhàn)(全彩)》,歡迎閱讀此書了解更多相關(guān)內(nèi)容。

數(shù)據(jù)分析的精髓在于能夠利用合理的數(shù)據(jù)分析方法來解決實(shí)際的業(yè)務(wù)問題,本書介紹了數(shù)據(jù)分析常見的思維和方法,并且呈現(xiàn)了這些分析方法在實(shí)際案例中的應(yīng)用。
同時(shí)也利用本書解答了大家對(duì)于想要從事數(shù)據(jù)分析行業(yè)的一些擔(dān)憂和困惑。
閱讀本書,你會(huì)對(duì)數(shù)據(jù)分析的工作內(nèi)容有更清晰、完整的了解,同時(shí)對(duì)常見的業(yè)務(wù)問題處理的方法和經(jīng)驗(yàn)有質(zhì)的提升。
陳友洋,畢業(yè)于香港中文大學(xué)和中山大學(xué),騰訊前數(shù)據(jù)科學(xué)家,數(shù)據(jù)分析類公眾號(hào)“漁好學(xué)”主理人,分享多篇數(shù)據(jù)相關(guān)的干貨文章。在知乎(知乎賬號(hào):漁好學(xué))上分享的數(shù)據(jù)分析相關(guān)文章的全網(wǎng)閱讀量超2 000 000次,廣受好評(píng)。在數(shù)據(jù)分析、數(shù)據(jù)體系搭建、數(shù)據(jù)科學(xué)方面具有多年經(jīng)驗(yàn),積累了豐富的數(shù)據(jù)分析項(xiàng)目經(jīng)驗(yàn)。
本書涵蓋了數(shù)據(jù)分析的系統(tǒng)知識(shí)和業(yè)務(wù)實(shí)踐,不僅涵蓋了數(shù)據(jù)分析的基本工具、思維和方法論,還包括具體的業(yè)務(wù)問題應(yīng)用,是市面上難得的理論與實(shí)際相結(jié)合的作品。本書內(nèi)容囊括了作者多年工作沉淀的豐富經(jīng)驗(yàn),體現(xiàn)了作者在數(shù)據(jù)分析方面的深厚造詣,無論是對(duì)于入門者,還是互聯(lián)網(wǎng)從業(yè)者,都是一本難得的“武功”秘籍。
——趙猛,騰訊算法工程師
作者從實(shí)操角度切入,將數(shù)據(jù)分析經(jīng)典方法論與業(yè)務(wù)工作融會(huì)貫通,真實(shí)案例為引,以創(chuàng)新模式拓寬數(shù)據(jù)分析應(yīng)用的陽光大道,引人入勝、百看不厭。
——?jiǎng)⑼跸瑁袊苿?dòng)資深項(xiàng)目經(jīng)理
數(shù)據(jù)分析是一門藝術(shù),既需要業(yè)務(wù)知識(shí),也需要數(shù)據(jù)分析方法。本書從數(shù)據(jù)分析在行業(yè)內(nèi)的應(yīng)用出發(fā),全面地介紹了漏斗分析、相關(guān)分析、RFM用戶分群、5W2H等多種常用的數(shù)據(jù)分析方法,從方法到實(shí)踐,由表及里,由淺入深,是一本不可多得的好書。
——李渝方,“數(shù)據(jù)萬花筒”公眾號(hào)主編 《數(shù)據(jù)分析之道——用數(shù)據(jù)思維指導(dǎo)業(yè)務(wù)實(shí)戰(zhàn)》作者,阿里巴巴前數(shù)據(jù)分析師

掃碼了解本書詳情!
如果喜歡本文 歡迎 在看丨留言丨分享至朋友圈 三連 精選留言獲贊最多的兩位 將獲得本號(hào)免費(fèi)贈(zèng)書 熱文推薦
