數(shù)據(jù)中臺(tái):基于標(biāo)簽體系的360°用戶畫像

導(dǎo)讀:通過(guò)標(biāo)簽體系,建立數(shù)據(jù)中臺(tái),打通用戶數(shù)據(jù)。

實(shí)物標(biāo)簽是用于標(biāo)明物品的品名、重量、體積、用途等信息的簡(jiǎn)要標(biāo)牌,例如:商品標(biāo)簽、圖書標(biāo)簽、車檢標(biāo)簽、文件標(biāo)簽、服裝吊牌、車票、登機(jī)牌都是實(shí)物標(biāo)簽。 網(wǎng)絡(luò)標(biāo)簽(Tag)是一種互聯(lián)網(wǎng)內(nèi)容組織方式,是相關(guān)性很強(qiáng)的關(guān)鍵字,它幫助人們輕松的描述和分類內(nèi)容,以便于檢索和分享,Tag是web 2.0的重要元素。 電子標(biāo)簽又稱RFID射頻標(biāo)簽,是一種識(shí)別效率高和準(zhǔn)確性好的識(shí)別工具,通過(guò)射頻信號(hào)自動(dòng)識(shí)別目標(biāo)對(duì)象并獲取相關(guān)數(shù)據(jù),識(shí)別工作無(wú)須人工干預(yù),可工作于各種惡劣環(huán)境。


基礎(chǔ)標(biāo)簽主要是指對(duì)用戶基礎(chǔ)特征的描述,比如:姓名、性別、年齡、身高、體重等。 業(yè)務(wù)標(biāo)簽是在基礎(chǔ)標(biāo)簽之上依據(jù)相關(guān)業(yè)務(wù)的業(yè)務(wù)經(jīng)驗(yàn)并結(jié)合統(tǒng)計(jì)方法生成的標(biāo)簽,比如:用戶忠誠(chéng)度、用戶購(gòu)買力等標(biāo)簽就是根據(jù)用戶的登錄次數(shù)、在線時(shí)間、單位時(shí)間活躍次數(shù)、購(gòu)買次數(shù)、單次購(gòu)買金額、總購(gòu)買金額等指標(biāo)計(jì)算出來(lái)的。業(yè)務(wù)標(biāo)簽可以將經(jīng)營(yíng)固化為知識(shí),為更多的人使用。 智能標(biāo)簽是利用人工智能技術(shù)基于機(jī)器學(xué)習(xí)算法,通過(guò)大量的數(shù)據(jù)計(jì)算而實(shí)現(xiàn)的自動(dòng)化、推薦式的進(jìn)行打標(biāo)簽,比如今日頭條的推薦引擎就是通過(guò)智能標(biāo)簽體系給用戶推送其感興趣的內(nèi)容的。





有線下采集的信息,比如通過(guò)訪談、調(diào)研等方式采集的數(shù)據(jù); 有線上采集的信息,比如:消費(fèi)記錄、瀏覽日志、收藏記錄等; 有從第三方接口接入的信息,比如微信接口可以獲取用戶微信的昵稱、性別、地域,QQ接口可以獲取用戶QQ的昵稱、性別、年齡、生日、星座、地域等信息; 還有通過(guò)爬蟲獲取的數(shù)據(jù),比如微博、評(píng)論、論壇等社交媒體的內(nèi)容; 通過(guò)機(jī)器學(xué)習(xí)來(lái)訓(xùn)練得到信息,比如通過(guò)預(yù)置機(jī)器學(xué)習(xí)算法; 利用網(wǎng)絡(luò)爬蟲不斷抓取數(shù)據(jù)進(jìn)行大量計(jì)算得出來(lái)的數(shù)據(jù),比如情感偏好、購(gòu)物偏好等。

行為類型權(quán)重:用戶瀏覽、搜索、收藏、下單、購(gòu)買等不同行為對(duì)用戶而言有著不同的重要性(偏序關(guān)系),該權(quán)重值一般由運(yùn)營(yíng)人員或業(yè)務(wù)來(lái)決定; 時(shí)間衰減:用戶某些行為受時(shí)間影響不斷減弱,行為時(shí)間距現(xiàn)在越遠(yuǎn),該行為對(duì)用戶當(dāng)前來(lái)說(shuō)的意義越小,采用牛頓冷卻定律; 行為次數(shù):用戶標(biāo)簽權(quán)重按天統(tǒng)計(jì),用戶某天與該標(biāo)簽產(chǎn)生的行為次數(shù)越多,該標(biāo)簽對(duì)用戶的影響越大。
基于規(guī)則定義的標(biāo)簽生產(chǎn)方式,即根據(jù)固定的規(guī)則,通過(guò)數(shù)據(jù)查詢的結(jié)果生產(chǎn)標(biāo)簽,重點(diǎn)在于如何制定規(guī)則。 基于主題模型的標(biāo)簽生產(chǎn)方式,主題模型最開始運(yùn)用于內(nèi)容領(lǐng)域,目的是找到用戶的偏好,在用戶標(biāo)簽中我們可以參照分類算法將用戶進(jìn)行分類、聚類,使用關(guān)鍵詞的算法挖掘用戶的偏好,從而生產(chǎn)標(biāo)簽。


評(píng)論
圖片
表情
