<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          數(shù)據(jù)中臺(tái):基于標(biāo)簽體系的360°用戶畫像

          共 6994字,需瀏覽 14分鐘

           ·

          2020-07-27 19:15

          導(dǎo)讀:通過(guò)標(biāo)簽體系,建立數(shù)據(jù)中臺(tái),打通用戶數(shù)據(jù)。


          作者:石秀峰
          來(lái)源:談數(shù)據(jù)(ID:learning-bigdata)




          01 從“標(biāo)簽”說(shuō)起

          標(biāo)簽是用來(lái)標(biāo)志您的產(chǎn)品目標(biāo)和分類或內(nèi)容,像是您給您的目標(biāo)確定的關(guān)鍵字詞,便于您自己和他人查找和定位自己目標(biāo)的工具。目前標(biāo)簽廣泛的使用到我們的工作和生活中,常見標(biāo)簽有三類:實(shí)物標(biāo)簽、網(wǎng)絡(luò)標(biāo)簽和電子標(biāo)簽。

          • 實(shí)物標(biāo)簽是用于標(biāo)明物品的品名、重量、體積、用途等信息的簡(jiǎn)要標(biāo)牌,例如:商品標(biāo)簽、圖書標(biāo)簽、車檢標(biāo)簽、文件標(biāo)簽、服裝吊牌、車票、登機(jī)牌都是實(shí)物標(biāo)簽。
          • 網(wǎng)絡(luò)標(biāo)簽(Tag)是一種互聯(lián)網(wǎng)內(nèi)容組織方式,是相關(guān)性很強(qiáng)的關(guān)鍵字,它幫助人們輕松的描述和分類內(nèi)容,以便于檢索和分享,Tag是web 2.0的重要元素。
          • 電子標(biāo)簽又稱RFID射頻標(biāo)簽,是一種識(shí)別效率高和準(zhǔn)確性好的識(shí)別工具,通過(guò)射頻信號(hào)自動(dòng)識(shí)別目標(biāo)對(duì)象并獲取相關(guān)數(shù)據(jù),識(shí)別工作無(wú)須人工干預(yù),可工作于各種惡劣環(huán)境。


          而我們這里用戶畫像使用的標(biāo)簽是網(wǎng)絡(luò)標(biāo)簽的一種深化應(yīng)用方式,是某一種用戶特征的符號(hào)表示,是我們觀察、認(rèn)識(shí)和描述用戶的一個(gè)角度,用戶標(biāo)簽是基于用戶的特征數(shù)據(jù)、行為數(shù)據(jù)和消費(fèi)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)計(jì)算得到的,包含了用戶的各個(gè)維度。

          而所謂的用戶畫像就是可以用用戶標(biāo)簽的集合來(lái)表示的,作為一種勾畫目標(biāo)用戶、聯(lián)系用戶訴求與設(shè)計(jì)方向的有效工具。

          用戶畫像,即用戶信息標(biāo)簽化,就是企業(yè)通過(guò)收集與分析消費(fèi)者社會(huì)屬性、生活習(xí)慣、消費(fèi)行為等主要信息的數(shù)據(jù)之后,完美地抽象出一個(gè)用戶的商業(yè)全貌作是企業(yè)應(yīng)用大數(shù)據(jù)技術(shù)的基本方式。

          用戶畫像為企業(yè)提供了足夠的信息基礎(chǔ),能夠幫助企業(yè)快速找到精準(zhǔn)用戶群體以及用戶需求等更為廣泛的反饋信息。



          02 用戶標(biāo)簽的分類

          1. 按照標(biāo)簽的變化頻率,可分為靜態(tài)標(biāo)簽和動(dòng)態(tài)標(biāo)簽。

          靜態(tài)標(biāo)簽是指用戶與生俱來(lái)的屬性信息,或者是很少發(fā)生變化的信息,比如用戶的姓名、性別、出生日期,又例如用戶學(xué)歷、職業(yè)等,雖然有可能發(fā)生變動(dòng),但這個(gè)變動(dòng)頻率是相對(duì)比較低或者很少發(fā)生變化的。

          動(dòng)態(tài)標(biāo)簽是指非常經(jīng)常發(fā)生變動(dòng)的、非常不穩(wěn)定的特征和行為,例如“一段時(shí)間內(nèi)經(jīng)常去的商場(chǎng)、購(gòu)買的商品品類”這類的標(biāo)簽的變動(dòng)可能是按天,甚至是按小時(shí)計(jì)算的。

          2. 按照標(biāo)簽的指代和評(píng)估指標(biāo)的不同,可分為定性標(biāo)簽和定量標(biāo)簽。

          定性標(biāo)簽指不能直接量化而需通過(guò)其他途徑實(shí)現(xiàn)量化的標(biāo)簽,其標(biāo)簽的值是用文字來(lái)描述的,例如“用戶愛好的運(yùn)動(dòng)”為“跑步、游泳”,“用戶的在職狀態(tài)”為“未婚”等。定量標(biāo)簽指可以準(zhǔn)確數(shù)量定義、精確衡量并能設(shè)定量化指標(biāo)的標(biāo)簽,其標(biāo)簽的值是常用數(shù)值或數(shù)值范圍來(lái)描述的。

          定量標(biāo)簽并不能直觀的說(shuō)明用戶的某種特性,但是我們可以通過(guò)對(duì)大量用戶的數(shù)值進(jìn)行統(tǒng)計(jì)比較后,得到某些信息。例如“用戶的年齡結(jié)構(gòu)”為“20-25歲”、“單次購(gòu)買平均金額”為“300元”,“購(gòu)買的總金額”為“20萬(wàn)元”……,當(dāng)我們獲得以上信息是否就可以將該用戶劃分為高價(jià)值客戶呢?

          3. 按照標(biāo)簽的來(lái)源渠道和生成方式不同,可以分為基礎(chǔ)標(biāo)簽、業(yè)務(wù)標(biāo)簽、智能標(biāo)簽。

          • 基礎(chǔ)標(biāo)簽主要是指對(duì)用戶基礎(chǔ)特征的描述,比如:姓名、性別、年齡、身高、體重等。
          • 業(yè)務(wù)標(biāo)簽是在基礎(chǔ)標(biāo)簽之上依據(jù)相關(guān)業(yè)務(wù)的業(yè)務(wù)經(jīng)驗(yàn)并結(jié)合統(tǒng)計(jì)方法生成的標(biāo)簽,比如:用戶忠誠(chéng)度、用戶購(gòu)買力等標(biāo)簽就是根據(jù)用戶的登錄次數(shù)、在線時(shí)間、單位時(shí)間活躍次數(shù)、購(gòu)買次數(shù)、單次購(gòu)買金額、總購(gòu)買金額等指標(biāo)計(jì)算出來(lái)的。業(yè)務(wù)標(biāo)簽可以將經(jīng)營(yíng)固化為知識(shí),為更多的人使用。
          • 智能標(biāo)簽是利用人工智能技術(shù)基于機(jī)器學(xué)習(xí)算法,通過(guò)大量的數(shù)據(jù)計(jì)算而實(shí)現(xiàn)的自動(dòng)化、推薦式的進(jìn)行打標(biāo)簽,比如今日頭條的推薦引擎就是通過(guò)智能標(biāo)簽體系給用戶推送其感興趣的內(nèi)容的。

          4. 按照標(biāo)簽體系分級(jí)分層的方式,可以分為一級(jí)標(biāo)簽、二級(jí)標(biāo)簽、三級(jí)標(biāo)簽等,每一個(gè)層級(jí)的標(biāo)簽相當(dāng)于一個(gè)業(yè)務(wù)維度的切面。在標(biāo)簽應(yīng)用中按照不同的業(yè)務(wù)場(chǎng)景進(jìn)行標(biāo)簽組合,形成相應(yīng)用戶畫像。


          5. 按照數(shù)據(jù)提取和處理的維度,可以將標(biāo)簽分為事實(shí)標(biāo)簽,模型標(biāo)簽,預(yù)測(cè)標(biāo)簽。這種用戶標(biāo)簽的分類方式更多是面向技術(shù)人員使用,幫助他們?cè)O(shè)計(jì)合理的數(shù)據(jù)處理單元。

          事實(shí)標(biāo)簽:既定事實(shí),直接從原始數(shù)據(jù)中提取,描述用戶的自然屬性、產(chǎn)品屬性、消費(fèi)屬性等,事實(shí)標(biāo)簽其本身不需要模型與算法,實(shí)現(xiàn)簡(jiǎn)單,但規(guī)模需要不斷基于業(yè)務(wù)補(bǔ)充與豐富,比如:姓名、購(gòu)買的產(chǎn)品品類、所在小區(qū)等。

          模型標(biāo)簽:對(duì)用戶屬性及行為等屬性的抽象和聚類,通過(guò)剖析用戶的基礎(chǔ)數(shù)據(jù)為用戶貼上相應(yīng)的總結(jié)概括性標(biāo)簽及指數(shù),標(biāo)簽代表用戶的興趣、偏好、需求等,指數(shù)代表用戶的興趣程度、需求程度、購(gòu)買概率等。

          預(yù)測(cè)標(biāo)簽:參考已有事實(shí)數(shù)據(jù),基于用戶的屬性、行為、位置和特征,通過(guò)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)以及神經(jīng)網(wǎng)絡(luò)等算法進(jìn)行用戶行為預(yù)測(cè),針對(duì)這些行為預(yù)測(cè)配合營(yíng)銷策略、規(guī)則進(jìn)行打標(biāo)簽,實(shí)現(xiàn)營(yíng)銷適時(shí)、適機(jī)、適景推送給用戶。例如試用了某產(chǎn)品A后預(yù)測(cè)可能還想買產(chǎn)品B并推送購(gòu)買鏈接給該用戶。



          03 用戶畫像的應(yīng)用場(chǎng)景

          用戶畫像,即用戶信息標(biāo)簽化,是企業(yè)通過(guò)收集與分析消費(fèi)者基本屬性、社會(huì)屬性、生活習(xí)慣、行為特征等主要信息的數(shù)據(jù)之后,抽象出用戶的商業(yè)全貌。大數(shù)據(jù)的發(fā)展讓各行各業(yè)都日益聚焦于怎樣利用大數(shù)據(jù)了解用戶需求,實(shí)現(xiàn)精準(zhǔn)營(yíng)銷,進(jìn)而深入挖掘潛在的商業(yè)價(jià)值。

          不同的企業(yè)做用戶畫像有不同的戰(zhàn)略目的,廣告公司做用戶畫像是為精準(zhǔn)廣告服務(wù),電商做用戶畫像是為用戶購(gòu)買更多商品,內(nèi)容平臺(tái)做用戶畫像是推薦用戶更感興趣的內(nèi)容提升流量再變現(xiàn)。

          企業(yè)對(duì)用戶的了解越多,就越容易為用戶提供所需產(chǎn)品和服務(wù),從而提升用戶的粘性,提升企業(yè)盈利能力。


          1. 了解用戶

          不得不承認(rèn)大數(shù)據(jù)正在改變著各行各業(yè),以前了解用戶主要是通過(guò)用戶調(diào)研和訪談的形式,形式單一、數(shù)據(jù)收集不全、真假難辨。尤其是在產(chǎn)品用戶量擴(kuò)大后,調(diào)研的效用降低,以不能滿足企業(yè)發(fā)展的要求。

          利用大數(shù)據(jù)技術(shù),基于標(biāo)簽體系構(gòu)建用戶的360°畫像,從用戶的各個(gè)維度進(jìn)行分析,了解用戶是誰(shuí),他們有什么特征,他們的興趣偏好,而這些信息的研究是企業(yè)制定營(yíng)銷策略、服務(wù)策略,提升用戶滿意度的重要依據(jù)。

          2. 精準(zhǔn)營(yíng)銷

          要做到精準(zhǔn)營(yíng)銷,數(shù)據(jù)是最不可缺的存在。以數(shù)據(jù)為基礎(chǔ),建立用戶畫像,利用標(biāo)簽,讓系統(tǒng)進(jìn)行智能分組,獲得不同類型的目標(biāo)用戶群,針對(duì)每一個(gè)群體策劃并推送針對(duì)性的營(yíng)銷。精準(zhǔn)化營(yíng)銷具有極強(qiáng)的針對(duì)性,是企業(yè)和用戶之間點(diǎn)對(duì)點(diǎn)的交互。它不但可以讓營(yíng)銷變得更加高效,也能為企業(yè)節(jié)約成本。

          3. 產(chǎn)品創(chuàng)新

          在用戶需求為導(dǎo)向的產(chǎn)品研發(fā)中,企業(yè)通過(guò)獲取到的大量目標(biāo)用戶數(shù)據(jù),進(jìn)行分析、處理、組合,初步搭建用戶畫像,做出用戶喜好、功能需求統(tǒng)計(jì),從而設(shè)計(jì)制造更加符合用戶核心需求的新產(chǎn)品,為用戶提供更加良好的體驗(yàn)和服務(wù)。

          4. 渠道優(yōu)化

          當(dāng)前的零售企業(yè)的銷售渠道有多種,比如:自營(yíng)門店、經(jīng)銷商代理、電商平臺(tái)、電商APP等,每個(gè)渠道的用戶群體的消費(fèi)能力、興趣偏好可能是不一樣的,通過(guò)用戶畫像可以讓合適的產(chǎn)品投放在合適的渠道投放,從而增加銷售量,這是目前零售行業(yè)慣用的方法。

          5. 個(gè)性推薦

          眾所周知,今日頭條是個(gè)個(gè)性化的新聞推薦引擎,在今日頭條CEO張一鳴看來(lái),算法是《今日頭條》這款興趣推薦搜索引擎應(yīng)用的核心,這也是與傳統(tǒng)媒體最本質(zhì)的區(qū)別。

          今日頭條之所以能夠非常懂用戶,精準(zhǔn)推薦出用戶所喜好的新聞,完全得益于算法,而正是精準(zhǔn)推薦,使得每天有大量用戶在今日頭條上閱讀自己感興趣的文章。


          04 用戶畫像的體系架構(gòu)

          按照應(yīng)用系統(tǒng)分層設(shè)計(jì)的原則,基于標(biāo)簽體系的用戶畫像的體系結(jié)構(gòu)可以分為:數(shù)據(jù)源層、數(shù)據(jù)采集層、數(shù)據(jù)建模層、數(shù)據(jù)應(yīng)用層,行業(yè)應(yīng)用層等。


          1. 數(shù)據(jù)源層

          用戶標(biāo)簽體系建設(shè)的需要從不同的來(lái)源匯集數(shù)據(jù),例如,企業(yè)的核心系統(tǒng)(不同的行業(yè)其核心系統(tǒng)不同,對(duì)制造業(yè)來(lái)說(shuō)核心系統(tǒng)有ERP、MES、PLM等),營(yíng)銷系統(tǒng)(CRM),互聯(lián)網(wǎng)數(shù)據(jù)(電商平臺(tái)以及微信、微博、論壇等社交平臺(tái)獲取的數(shù)據(jù)),以及從第三方專業(yè)機(jī)構(gòu)獲取的數(shù)據(jù)(各地的數(shù)據(jù)交易中心購(gòu)買的數(shù)據(jù))。

          2. 數(shù)據(jù)采集層

          與傳統(tǒng)數(shù)據(jù)項(xiàng)目的數(shù)據(jù)采集不同,基于標(biāo)簽體系的用戶畫像的數(shù)據(jù)來(lái)源廣泛、數(shù)據(jù)量巨大,數(shù)據(jù)類型豐富(包括:結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)),有線上的用戶行為數(shù)據(jù),也有應(yīng)用系統(tǒng)日志數(shù)據(jù),有互聯(lián)網(wǎng)爬蟲數(shù)據(jù),也有API接口的第三方數(shù)據(jù)包。

          用戶畫像數(shù)據(jù)采集需要通過(guò)網(wǎng)絡(luò)爬蟲或網(wǎng)站公開API等方式從網(wǎng)站上獲取數(shù)據(jù)信息,并且可以將非結(jié)構(gòu)化數(shù)據(jù)從網(wǎng)頁(yè)中抽取出來(lái),將其存儲(chǔ)為統(tǒng)一的本地?cái)?shù)據(jù)文件,并支持以結(jié)構(gòu)化的方式存儲(chǔ)。同時(shí)支持圖片、音頻、視頻等文件或附件的采集,附件與正文可以自動(dòng)關(guān)聯(lián)。

          3. 數(shù)據(jù)建模

          基于標(biāo)簽體系的用戶畫像建模主要是針對(duì)用戶畫像的建模和產(chǎn)品的建模。產(chǎn)品畫像建模包括了數(shù)據(jù)清洗、文本建模、類別識(shí)別、品牌識(shí)別、屬性識(shí)別、產(chǎn)品畫像等;用戶畫像建模包括了數(shù)據(jù)清洗、用戶全渠道ID識(shí)別、信息整合、分析建模和用戶畫像。

          通過(guò)統(tǒng)一產(chǎn)品類目和屬性體系和統(tǒng)一的用戶畫像標(biāo)簽體系的建設(shè),為用戶標(biāo)簽的應(yīng)用提供支撐。

          4. 數(shù)據(jù)應(yīng)用

          即基于標(biāo)簽體系的應(yīng)用,包括分析類應(yīng)用(如用戶分析、產(chǎn)品分析)、服務(wù)類應(yīng)用(如服務(wù)及產(chǎn)品創(chuàng)新)、營(yíng)銷類應(yīng)用(精準(zhǔn)營(yíng)銷)、數(shù)據(jù)接口API等。

          5. 行業(yè)應(yīng)用

          基于標(biāo)簽體系的用戶畫像在各行業(yè)的所應(yīng)用和探索,將為行業(yè)的發(fā)展和創(chuàng)新帶來(lái)更多可能。


          05 用戶畫像的建設(shè)步驟


          1.?數(shù)據(jù)采集

          用戶畫像是根據(jù)用戶的人口信息、社交關(guān)系、偏好習(xí)慣和消費(fèi)行為等信息而抽象出來(lái)的標(biāo)簽化畫像,用戶畫像數(shù)據(jù)來(lái)源多樣,采集方式也不同:

          • 線下采集的信息,比如通過(guò)訪談、調(diào)研等方式采集的數(shù)據(jù);
          • 線上采集的信息,比如:消費(fèi)記錄、瀏覽日志、收藏記錄等;
          • 從第三方接口接入的信息,比如微信接口可以獲取用戶微信的昵稱、性別、地域,QQ接口可以獲取用戶QQ的昵稱、性別、年齡、生日、星座、地域等信息;
          • 還有通過(guò)爬蟲獲取的數(shù)據(jù),比如微博、評(píng)論、論壇等社交媒體的內(nèi)容;
          • 通過(guò)機(jī)器學(xué)習(xí)來(lái)訓(xùn)練得到信息,比如通過(guò)預(yù)置機(jī)器學(xué)習(xí)算法;
          • 利用網(wǎng)絡(luò)爬蟲不斷抓取數(shù)據(jù)進(jìn)行大量計(jì)算得出來(lái)的數(shù)據(jù),比如情感偏好、購(gòu)物偏好等。

          2. 數(shù)據(jù)清洗

          大家都知道大數(shù)據(jù)有一個(gè)特征Value(價(jià)值密度低),在標(biāo)簽體系的建設(shè)是在大數(shù)據(jù)環(huán)境下進(jìn)行的,大數(shù)據(jù)的低價(jià)值密度性決定著在采集回來(lái)的數(shù)據(jù)中存在著大量的噪聲數(shù)據(jù)、臟數(shù)據(jù),比如:缺失值、重復(fù)、數(shù)值異常等。

          要實(shí)現(xiàn)精準(zhǔn)的用戶畫像就需要對(duì)這些噪聲數(shù)據(jù)、臟數(shù)據(jù)進(jìn)行處理,這個(gè)過(guò)程我們叫做數(shù)據(jù)清洗。

          常見的數(shù)據(jù)清洗方法:

          缺失值處理,對(duì)于缺失數(shù)據(jù)的處理方法有三種,一是刪除缺失數(shù)據(jù)(數(shù)據(jù)采集不易,一般不輕易刪除數(shù)據(jù));二是補(bǔ)齊缺失數(shù)據(jù),常用方法有:均值插補(bǔ)、中位數(shù)插補(bǔ)、最大值插補(bǔ)、最小值插補(bǔ)、固定值插補(bǔ)、最近鄰插補(bǔ)、熱卡填補(bǔ)法等;三是不處理缺失數(shù)據(jù)

          重復(fù)數(shù)據(jù)處理(刪除重復(fù)的數(shù)據(jù))。

          異常數(shù)據(jù)處理,對(duì)于異常數(shù)據(jù)的處理常用的方式是一定的規(guī)則先找到異常數(shù)據(jù),查找異常數(shù)據(jù)常用的方法包括:統(tǒng)計(jì)分析、分類聚類、箱型圖分析、模型檢測(cè)、密度分析、距離分析等。在找到異常數(shù)據(jù)后,根據(jù)業(yè)務(wù)情況確定是刪除、修正或補(bǔ)齊異常數(shù)據(jù)值。

          3. 數(shù)據(jù)標(biāo)準(zhǔn)化

          在做用戶畫像分析之前,需要先將數(shù)據(jù)標(biāo)準(zhǔn)化,利用標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行數(shù)據(jù)分析。數(shù)據(jù)標(biāo)準(zhǔn)化處理主要包括數(shù)據(jù)同趨化處理無(wú)量綱化處理兩個(gè)方面。

          數(shù)據(jù)同趨化處理主要解決不同性質(zhì)數(shù)據(jù)問(wèn)題,對(duì)不同性質(zhì)指標(biāo)直接加總不能正確反映不同作用力的綜合結(jié)果,須先考慮改變逆指標(biāo)數(shù)據(jù)性質(zhì),使所有指標(biāo)對(duì)測(cè)評(píng)方案的作用力同趨化,再加總才能得出正確結(jié)果。數(shù)據(jù)無(wú)量綱化處理主要解決數(shù)據(jù)的可比性。

          數(shù)據(jù)標(biāo)準(zhǔn)化的方法有很多種,常用的有“最小—最大標(biāo)準(zhǔn)化”、“Z-score標(biāo)準(zhǔn)化”和“按小數(shù)定標(biāo)標(biāo)準(zhǔn)化”等。經(jīng)過(guò)上述標(biāo)準(zhǔn)化處理,原始數(shù)據(jù)均轉(zhuǎn)換為無(wú)量綱化指標(biāo)測(cè)評(píng)值,即各指標(biāo)值都處于同一個(gè)數(shù)量級(jí)別上,可以進(jìn)行綜合測(cè)評(píng)分析。

          用戶畫像的建立需要有整合多源數(shù)據(jù)的能力,比如一個(gè)用戶可能使用多個(gè)設(shè)備,擁有多個(gè)賬號(hào),則須把多個(gè)身份ID組合,建立統(tǒng)一的標(biāo)準(zhǔn),形成完整標(biāo)識(shí)實(shí)體的用戶畫像。以上描述的這個(gè)場(chǎng)景被稱為OneID體系——統(tǒng)一身份認(rèn)證,即對(duì)于同一個(gè)人,使用不同設(shè)備或系統(tǒng)只有唯一身份。

          4. 數(shù)據(jù)建模

          數(shù)據(jù)建模就是根據(jù)用戶行為,構(gòu)建模型產(chǎn)出標(biāo)簽、權(quán)重。一個(gè)事件模型包括:時(shí)間、地點(diǎn)、人物三個(gè)要素。每一次用戶行為本質(zhì)上是一次隨機(jī)事件,可以詳細(xì)描述為:什么用戶,在什么時(shí)間,什么地點(diǎn),做了什么事。

          用戶動(dòng)態(tài)建模公式:用戶標(biāo)識(shí)?+時(shí)間?+?行為類型?+?接觸點(diǎn)(網(wǎng)址+內(nèi)容),表示某用戶在什么時(shí)間、地點(diǎn)、做了什么事,所以會(huì)打上某標(biāo)簽。用戶標(biāo)簽的權(quán)重可能隨時(shí)間的增加而衰減,因此定義時(shí)間為衰減因子r,行為類型,同時(shí)該標(biāo)簽對(duì)該用戶的重要程度也決定了用戶標(biāo)簽的權(quán)重,進(jìn)一步轉(zhuǎn)換為公式:

          用戶標(biāo)簽權(quán)重 = 行為類型權(quán)重 × 時(shí)間衰減 × 用戶行為次數(shù) × TF-IDF計(jì)算標(biāo)簽權(quán)重


          • 行為類型權(quán)重:用戶瀏覽、搜索、收藏、下單、購(gòu)買等不同行為對(duì)用戶而言有著不同的重要性(偏序關(guān)系),該權(quán)重值一般由運(yùn)營(yíng)人員或業(yè)務(wù)來(lái)決定;
          • 時(shí)間衰減:用戶某些行為受時(shí)間影響不斷減弱,行為時(shí)間距現(xiàn)在越遠(yuǎn),該行為對(duì)用戶當(dāng)前來(lái)說(shuō)的意義越小,采用牛頓冷卻定律;
          • 行為次數(shù):用戶標(biāo)簽權(quán)重按天統(tǒng)計(jì),用戶某天與該標(biāo)簽產(chǎn)生的行為次數(shù)越多,該標(biāo)簽對(duì)用戶的影響越大。

          公式:t=初始溫度×exp(-冷卻系數(shù)×間隔的時(shí)間),實(shí)際應(yīng)用中,初始溫度為1就行,間隔的時(shí)間為今天與產(chǎn)生行為那天的天數(shù),或者小時(shí)數(shù)都行,根據(jù)業(yè)務(wù)進(jìn)行調(diào)整,冷卻系數(shù)的業(yè)務(wù)來(lái)決定,或者通過(guò)數(shù)據(jù)分析而來(lái)。

          TF-IDF計(jì)算標(biāo)簽權(quán)重:tf為某標(biāo)簽在該用戶出現(xiàn)頻率,idf為某標(biāo)簽在全部標(biāo)簽中的稀缺程度。

          5.?標(biāo)簽挖掘

          標(biāo)簽挖掘,即對(duì)用戶標(biāo)簽體系中的用戶數(shù)據(jù)進(jìn)行挖掘,形成用戶標(biāo)簽,這個(gè)過(guò)程也叫標(biāo)簽生產(chǎn)。標(biāo)簽的生產(chǎn)方式主要有以下兩種:

          1. 基于規(guī)則定義的標(biāo)簽生產(chǎn)方式,即根據(jù)固定的規(guī)則,通過(guò)數(shù)據(jù)查詢的結(jié)果生產(chǎn)標(biāo)簽,重點(diǎn)在于如何制定規(guī)則。
          2. 基于主題模型的標(biāo)簽生產(chǎn)方式,主題模型最開始運(yùn)用于內(nèi)容領(lǐng)域,目的是找到用戶的偏好,在用戶標(biāo)簽中我們可以參照分類算法將用戶進(jìn)行分類、聚類,使用關(guān)鍵詞的算法挖掘用戶的偏好,從而生產(chǎn)標(biāo)簽。

          在整體用戶標(biāo)簽生產(chǎn)過(guò)程中,通過(guò)用戶關(guān)系數(shù)據(jù)(用戶關(guān)系數(shù)據(jù)體現(xiàn)了用戶之間的客觀重要程度)、用戶內(nèi)容數(shù)據(jù)(用戶發(fā)布的信息,微博、微信、評(píng)論等)、用戶行為數(shù)據(jù)(用戶的瀏覽、搜索、收藏、下單、加入購(gòu)物車、購(gòu)買等行為)挖掘出用戶的標(biāo)簽及其基礎(chǔ)權(quán)重;接下來(lái)通過(guò)多個(gè)維度的定向挖掘進(jìn)行標(biāo)簽的校正和增加標(biāo)簽的覆蓋。

          最后,將挖掘出來(lái)的用戶標(biāo)簽及權(quán)重輸出至用戶標(biāo)簽庫(kù),供上層業(yè)務(wù)調(diào)用。標(biāo)簽挖掘常用到數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)的相關(guān)算法有:支持向量機(jī)、線性回歸、樸素貝葉斯、神經(jīng)網(wǎng)絡(luò)、決策樹、分類、聚類、關(guān)聯(lián)等。

          6. 數(shù)據(jù)可視化

          數(shù)據(jù)可視化是基于標(biāo)簽體系的用戶畫像的重要應(yīng)用, 通過(guò)詳實(shí)、準(zhǔn)確對(duì)用戶的各類標(biāo)簽數(shù)據(jù)進(jìn)行匯集和分析,并以圖片、表格等可視化手段幫助企業(yè)全面了解用戶的基礎(chǔ)信息,用戶關(guān)系情況,用戶經(jīng)濟(jì)情況、用戶偏好情況、健康情況、飲食情況等信息。

          同時(shí),利用數(shù)據(jù)標(biāo)簽體系的用戶畫像可視化技術(shù),通過(guò)對(duì)用戶關(guān)系數(shù)據(jù)、用戶內(nèi)容數(shù)據(jù)、用戶行為等數(shù)據(jù)進(jìn)行可視化展示,能夠幫助企業(yè)管理人員、業(yè)務(wù)人員全面了解用戶,了解用戶是誰(shuí),他們有什么特征,他們的興趣偏好等,從而為智能推薦、精準(zhǔn)營(yíng)銷、產(chǎn)品和服務(wù)創(chuàng)新、渠道優(yōu)化等業(yè)務(wù)提供支撐。


          06 總結(jié)

          用戶畫像的目的是為了精準(zhǔn)地定位你的目標(biāo)群體以及他們的特征,用戶畫像不是簡(jiǎn)單的用戶分類,而是一個(gè)具體的用戶形象。用戶畫像可以幫助我們了解到最重要的80%用戶需求是什么,以及哪些是用戶其實(shí)沒(méi)那么在意的20%的需求。

          用戶畫像可以為各方面的工作展開提供方向,大到營(yíng)銷戰(zhàn)略的制定,小到如何回復(fù)一個(gè)用戶的留言。構(gòu)建基于標(biāo)簽體系的用戶畫像是為了解決實(shí)際的業(yè)務(wù)問(wèn)題,需要帶著業(yè)務(wù)目標(biāo)進(jìn)行用戶畫像,為了畫像而畫像的炫技派或者get不到任何價(jià)值的粗放式畫像都是不可取的。

          參考文獻(xiàn):
          數(shù)據(jù)標(biāo)準(zhǔn)化:
          https://baike.baidu.com/item/數(shù)據(jù)標(biāo)準(zhǔn)化/4132085
          標(biāo)簽體系應(yīng)用及設(shè)計(jì)思路:
          http://www.woshipm.com/pd/1768531.html
          微博用戶畫像之用戶標(biāo)簽:
          https://cloud.tencent.com/developer/article/1041922
          用戶畫像:
          https://www.zhihu.com/question/19853605/answer/951491041


          劃重點(diǎn)?


          干貨直達(dá)?


          更多精彩?

          在公眾號(hào)對(duì)話框輸入以下關(guān)鍵詞
          查看更多優(yōu)質(zhì)內(nèi)容!

          PPT?|?讀書?|?書單?|?硬核?|?干貨?|?講明白
          大數(shù)據(jù)?|?云計(jì)算?|?數(shù)據(jù)庫(kù)?|?Python?|?可視化?|?神操作
          AI?|?人工智能?|?機(jī)器學(xué)習(xí)?|?深度學(xué)習(xí)?|?NLP
          5G?|?中臺(tái)?|?用戶畫像?|?1024?|?大神?|?數(shù)學(xué)?|?數(shù)字孿生

          據(jù)統(tǒng)計(jì),99%的大咖都完成了這個(gè)神操作
          ?


          瀏覽 215
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产无码激情 | www黄色网址 | 天天躁日日躁狠狠躁 | 亚洲乱伦图片小说 | 欧美在线精 |