在线的欧美成网站,青草青青青在线免费观看视频,中文字幕一区二区三,永久免费三级片,国产美女全裸网站,国产骚逼精品视频,亚洲天堂第一页,97爽无码人妻aⅴ精品牛牛

一、什么是用戶畫像

用戶畫像是指根據用戶的屬性、用戶偏好、生活習慣、用戶行為等信息而抽象出來的標簽化用戶模型。通俗說就是給用戶打標簽，而標簽是通過對用戶信息分析而來的高度精煉的特征標識。通過打標簽可以利用一些高度概括、容易理解的特征來描述用戶，可以讓人更容易理解用戶，并且可以方便計算機處理。

用戶畫像是對現實世界中用戶的建模，用戶畫像應該包含目標，方式，組織，標準，驗證這5個方面。

目標：指的是描述人，認識人，了解人，理解人。

方式：又分為非形式化手段，如使用文字、語言、圖像、視頻等方式描述人；形式化手段，即使用數據的方式來刻畫人物的畫像。

組織：指的是結構化、非結構化的組織形式。

標準：指的是使用常識、共識、知識體系的漸進過程來刻畫人物，認識了解用戶。

驗證：依據側重說明了用戶畫像應該來源事實、經得起推理和檢驗。

在產品早期和發(fā)展期，會較多地借助用戶畫像，幫助產品人員理解用戶的需求，想象用戶使用的場景，產品設計從為所有人做產品變成為三四個人做產品，間接的降低復雜度。

用戶畫像使用的標簽是網絡標簽的一種深化應用方式，是某一種用戶特征的符號表示，是我們觀察、認識和描述用戶的一個角度，用戶標簽是基于用戶的特征數據、行為數據和消費數據進行統計計算得到的，包含了用戶的各個維度。而所謂的用戶畫像就是可以用用戶標簽的集合來表示的，作為一種勾畫目標用戶、聯系用戶訴求與設計方向的有效工具。

用戶畫像，即用戶信息標簽化，就是企業(yè)通過收集與分析消費者社會屬性、生活習慣、消費行為等主要信息的數據之后，完美地抽象出一個用戶的商業(yè)全貌作是企業(yè)應用大數據技術的基本方式。用戶畫像為企業(yè)提供了足夠的信息基礎，能夠幫助企業(yè)快速找到精準用戶群體以及用戶需求等更為廣泛的反饋信息。

二、用戶標簽的分類

1、按照標簽的變化頻率，可分為靜態(tài)標簽和動態(tài)標簽。

靜態(tài)標簽是指用戶與生俱來的屬性信息，或者是很少發(fā)生變化的信息，比如用戶的姓名、性別、出身日期，又例如用戶學歷、職業(yè)等，雖然有可能發(fā)生變動，但這個變動頻率是相對比較低或者很少發(fā)生變化的。動態(tài)標簽是指非常經常發(fā)生變動的、非常不穩(wěn)定的特征和行為，例如“一段時間內經常去的商場、購買的商品品類”這類的標簽的變動可能是按天，甚至是按小時計算的。

2、按照標簽的指代和評估指標的不同，可分為定性標簽和定量標簽。

定性標簽指不能直接量化而需通過其他途徑實現量化的標簽，其標簽的值是用文字來描述的，例如“用戶愛好的運動”為“跑步、游泳”，“用戶的在職狀態(tài)”為“未婚”等。定量標簽指可以準確數量定義、精確衡量并能設定量化指標的標簽，其標簽的值是常用數值或數值范圍來描述的。定量標簽并不能直觀的說明用戶的某種特性，但是我們可以通過對大量用戶的數值進行統計比較后，得到某些信息。例如“用戶的年齡結構”為“20-25歲”、“單次購買平均金額”為“300元”，“購買的總金額”為“20萬元”……，當我們獲得以上信息是否就可以將該用戶劃分為高價值客戶呢？

3、按照標簽的來源渠道和生成方式不同，可以分為基礎標簽、業(yè)務標簽、智能標簽。

基礎標簽主要是指對用戶基礎特征的描述，比如：姓名、性別、年齡、身高、體重等。業(yè)務標簽是在基礎標簽之上依據相關業(yè)務的業(yè)務經驗并結合統計方法生成的標簽，比如：用戶忠誠度、用戶購買力等標簽就是根據用戶的登錄次數、在線時間、單位時間活躍次數、購買次數、單次購買金額、總購買金額等指標計算出來的。業(yè)務標簽可以將經營固化為知識，為更多的人使用。智能標簽是利用人工智能技術基于機器學習算法，通過大量的數據計算而實現的自動化、推薦式的進行打標簽，比如今日頭條的推薦引擎就是通過智能標簽體系給用戶推送其感興趣的內容的。

4、按照標簽體系分級分層的方式，可以分為一級標簽、二級標簽、三級標簽等，每一個層級的標簽相當于一個業(yè)務維度的切面。在標簽應用中按照不同的業(yè)務場景進行標簽組合，形成相應用戶畫像。

5、按照數據提取和處理的維度，可以將標簽分為事實標簽，模型標簽，預測標簽。這種用戶標簽的分類方式更多是面向技術人員使用，幫助他們設計合理的數據處理單元。

事實標簽。既定事實，直接從原始數據中提取，描述用戶的自然屬性、產品屬性、消費屬性等，事實標簽其本身不需要模型與算法，實現簡單，但規(guī)模需要不斷基于業(yè)務補充與豐富，比如：姓名、購買的產品品類、所在小區(qū)等。

模型標簽。對用戶屬性及行為等屬性的抽象和聚類，通過剖析用戶的基礎數據為用戶貼上相應的總結概括性標簽及指數，標簽代表用戶的興趣、偏好、需求等，指數代表用戶的興趣程度、需求程度、購買概率等。

預測標簽。參考已有事實數據，基于用戶的屬性、行為、位置和特征，通過機器學習、深度學習以及神經網絡等算法進行用戶行為預測，針對這些行為預測配合營銷策略、規(guī)則進行打標簽，實現營銷適時、適機、適景推送給用戶。例如試用了某產品A后預測可能還想買產品B并推送購買鏈接給該用戶。

三、用戶畫像標簽體系的建立

1、什么是標簽體系

用戶畫像是對現實用戶做的一個數學模型，在整個數學模型中，核心是怎么描述業(yè)務知識體系，而這個業(yè)務知識體系就是本體論，本體論很復雜，我們找到一個特別樸素的實現，就是標簽。

標簽是某一種用戶特征的符號表示。是一種內容組織方式，是一種關聯性很強的關鍵字，能方便的幫助我們找到合適的內容及內容分類。（注：簡單說，就是你把用戶分到多少個類別里面去，這些類是什么，彼此之間有什么關系，就構成了標簽體系）

標簽解決的是描述（或命名）問題，但在實際應用中，還需要解決數據之間的關聯，所以通常將標簽作為一個體系來設計，以解決數據之間的關聯問題。

一般來說，將能關聯到具體用戶數據的標簽，稱為葉子標簽。對葉子標簽進行分類匯總的標簽，稱為父標簽。父標簽和葉子標簽共同構成標簽體系，但兩者是相對概念。例如：下表中，地市、型號在標簽體系中相對于省份、品牌，是葉子標簽。

用戶畫像標簽體系創(chuàng)建后一般要包含以下幾個方面的內容

（1）標簽分類

用戶畫像標簽可以分為基礎屬性標簽和行為屬性標簽。

由于基于一個目標的畫像，其標簽是在動態(tài)擴展的，所以其標簽體系也沒有統一的模板，在大分類上，與自身的業(yè)務特征有很大的關聯，在整體思路上可以從橫縱兩個維度展開思考：橫向是產品內數據和產品外數據，縱向是線上數據和線下數據。而正中間則是永恒不變的“人物基礎屬性”。

如果說其他的分類因企業(yè)特征而定，那么只有人物特征屬性（至于名字叫什么不重要，關鍵是內涵）是各家企業(yè)不能缺失的板塊。

所謂人物基礎屬性指的是：用戶客觀的屬性而非用戶自我表達的屬性，也就是描述用戶真實人口屬性的標簽。所謂非“自我表達”，舉例來說，某產品內個人信息有性別一項，用戶填寫為“女”，而通過用戶上傳的身份證號，以及用戶照片，用戶購買的產品，甚至用戶打來的客服電話，都發(fā)現該用戶性別是“男性”。那么在人物基礎屬性中的性別，應該標識的是“男性”，但是用戶信息標簽部分，自我描述的性別則可能標注為女性。

（2）標簽級別（標簽的體系結構）

分級有兩個層面的含義，其一是：指標到最低層級的涵蓋的層級；其二是指：指標的運算層級。其一非常好理解，這里重點說運算層級。

標簽從運算層級角度可以分為三層：事實標簽、模型標簽、預測標簽。

事實標簽：是通過對于原始數據庫的數據進行統計分析而來的，比如用戶投訴次數，是基于用戶一段時間內實際投訴的行為做的統計。

模型標簽：模型標簽是以事實標簽為基礎，通過構建事實標簽與業(yè)務問題之間的模型，進行模型分析得到。比如，結合用戶實際投訴次數、用戶購買品類、用戶支付的金額等，進行用戶投訴傾向類型的識別，方便客服進行分類處理。

預測標簽：則是在模型的基礎上做預測，比如針對投訴傾向類型結構的變化，預測平臺輿情風險指數。

（3）標簽命名&賦值

我們用一張圖來說明一下命名和賦值的差別，只要在構建用戶標簽的過程種，有意識的區(qū)別標簽命名和賦值足矣，不再贅述。

（4）標簽屬性

標簽屬性可以理解為針對標簽進行的再標注，這一環(huán)節(jié)的工作主要目的是幫助內部理解標簽賦值的來源，進而理解指標的含義。如圖所示，可以總結為5種來源：

1、固有屬性：是指這些指標的賦值體現的是用戶生而有之或者事實存在的，不以外界條件或者自身認知的改變而改變的屬性。比如：性別、年齡、是否生育等。

2、推導屬性：由其他屬性推導而來的屬性，比如星座，我們可以通過用戶的生日推導，比如用戶的品類偏好，則可以通過日常購買來推導。

3、行為屬性：產品內外實際發(fā)生的行為被記錄后形成的賦值，比如用戶的登陸時間，頁面停留時長等。

4、態(tài)度屬性：用戶自我表達的態(tài)度和意愿。比如說我們通過一份問卷向用戶詢問一些問題，并形成標簽，如詢問用戶：是否愿意結婚，是否喜歡某個品牌等。當然在大數據的需求背景下，利用問卷收集用戶標簽的方法效率顯得過低，更多的是利用產品中相關的模塊做了用戶態(tài)度信息收集。

5、測試屬性：測試屬性是指來自用戶的態(tài)度表達，但并不是用戶直接表達的內容，而是通過分析用戶的表達，結構化處理后，得出的測試結論。比如，用戶填答了一系列的態(tài)度問卷，推導出用戶的價值觀類型等。

值得注意的是，一種標簽的屬性可以是多重的，比如：個人星座這個標簽，既是固有屬性，也是推導屬性，它首先不以個人的意志為轉移，同時可以通過身份證號推導而來。

即便你成功了建立用戶畫像的標簽體系，也不意味著你就開啟了用戶畫像的成功之路，因為有很大的可能是這些標簽根本無法獲得，或者說無法賦值。

標簽無法賦值的原因有：數據無法采集（沒有有效的渠道和方法采集到準確的數據，比如用戶身份證號）、數據庫不能打通、建模失敗（預測指標無法獲得賦值）等等。

?2、標簽體系結構

標簽體系可以歸納出如下的層級結構。

（1）原始輸入層

主要指用戶的歷史數據信息，如會員信息、消費信息、網絡行為信息。經過數據的清洗，從而達到用戶標簽體系的事實層。

（2）事實層

事實層是用戶信息的準確描述層，其最重要的特點是，可以從用戶身上得到確定與肯定的驗證。如用戶的人口屬性、性別、年齡、籍貫、會員信息等。

（3）模型預測層

通過利用統計建模，數據挖掘、機器學習的思想，對事實層的數據進行分析利用，從而得到描述用戶更為深刻的信息。如通過建模分析，可以對用戶的性別偏好進行預測，從而能對沒有收集到性別數據的新用戶進行預測。還可以通過建模與數據挖掘，使用聚類、關聯思想，發(fā)現人群的聚集特征。

（4）營銷模型預測

利用模型預測層結果，對不同用戶群體，相同需求的客戶，通過打標簽，建立營銷模型，從而分析用戶的活躍度、忠誠度、流失度、影響力等可以用來進行營銷的數據。

（5）業(yè)務層

業(yè)務層可以是展現層。它是業(yè)務邏輯的直接體現，如圖中所表示的，有車一族、有房一族等。

3、標簽體系結構分類

一般來說，設計一個標簽體系有3種思路，分別是：（1）結構化標簽體系；（2）半結構化標簽體系；（3）非結構化標簽體系。

（1）結構化標簽體系

簡單地說，就是標簽組織成比較規(guī)整的樹或森林，有明確的層級劃分和父子關系。結構化標簽體系看起來整潔，又比較好解釋，在面向品牌廣告井噴時比較好用。性別、年齡這類人口屬性標簽，是最典型的結構化體系。下圖就是Yahoo!受眾定向廣告平臺采用的結構化標簽體系。

（2）半結構化標簽體系

在用于效果廣告時，標簽設計的靈活性大大提高了。標簽體系是不是規(guī)整，就不那么重要了，只要有效果就行。在這種思路下，用戶標簽往往是在行業(yè)上呈現出一定的并列體系，而各行業(yè)內的標簽設計則以“逮住老鼠就是好貓”為最高指導原則，切不可拘泥于形式。下圖是Bluekai聚合多家數據形成的半結構化標簽體系。

（3）非結構化標簽體系

非結構化，就是各個標簽就事論事，各自反應各自的用戶興趣，彼此之間并無層級關系，也很難組織成規(guī)整的樹狀結構。非結構化標簽的典型例子，是搜索廣告里用的關鍵詞。還有Facebook用的用戶興趣詞。

?4、用戶畫像標簽層級的建模方法

用戶畫像的核心是標簽的建立，用戶畫像標簽建立的各個階段使用的模型和算法如下圖所示。

原始數據層。對原始數據，我們主要使用文本挖掘的算法進行分析如常見的TF-IDF、TopicModel主題模型、LDA 等算法，主要是對原始數據的預處理和清洗，對用戶數據的匹配和標識。

事實標簽層。通過文本挖掘的方法，我們從數據中盡可能多的提取事實數據信息，如人口屬性信息，用戶行為信息，消費信息等。其主要使用的算法是分類和聚類。分類主要用于預測新用戶，信息不全的用戶的信息，對用戶進行預測分類。聚類主要用于分析挖掘出具有相同特征的群體信息，進行受眾細分，市場細分。對于文本的特征數據，其主要使用相似度計算，如余弦夾角，歐式距離等。

模型標簽層。使用機器學習的方法，結合推薦算法。模型標簽層完成對用戶的標簽建模與用戶標識。其主要可以采用的算法有回歸，決策樹，支持向量機等。通過建模分析，我們可以進一步挖掘出用戶的群體特征和個性權重特征，從而完善用戶的價值衡量，服務滿意度衡量等。

預測層。也是標簽體系中的營銷模型預測層。這一層級利用預測算法，如機器學習中的監(jiān)督學習，計量經濟學中的回歸預測，數學中的線性規(guī)劃等方法。實習對用戶的流失預測，忠實度預測，興趣程度預測等等，從而實現精準營銷，個性化和定制化服務。

不同的標簽層級會考慮使用對其適用的建模方法，對一些具體的問題，有專門的文章對其進行研究。

五、用戶畫像的應用場景

用戶畫像，即用戶信息標簽化，是企業(yè)通過收集與分析消費者基本屬性、社會屬性、生活習慣、行為特征等主要信息的數據之后，抽象出用戶的商業(yè)全貌。大數據的發(fā)展讓各行各業(yè)都日益聚焦于怎樣利用大數據了解用戶需求，實現精準營銷，進而深入挖掘潛在的商業(yè)價值。

不同的企業(yè)做用戶畫像有不同的戰(zhàn)略目的，廣告公司做用戶畫像是為精準廣告服務，電商做用戶畫像是為用戶購買更多商品，內容平臺做用戶畫像是推薦用戶更感興趣的內容提升流量再變現。企業(yè)對用戶的了解越多，就越容易為用戶提供所需產品和服務，從而提升用戶的粘性，提升企業(yè)盈利能力。

1、了解用戶

不得不承認大數據正在改變著各行各業(yè)，以前了解用戶主要是通過用戶調研和訪談的形式，形式單一、數據收集不全、真假難辨。尤其是在產品用戶量擴大后，調研的效用降低，以不能滿足企業(yè)發(fā)展的要求。利用大數據技術，基于標簽體系構建用戶的360°畫像，從用戶的各個維度進行分析，了解用戶是誰，他們有什么特征，他們的興趣偏好，而這些信息的研究是企業(yè)制定營銷策略、服務策略，提升用戶滿意度的重要依據。

2、精準營銷

要做到精準營銷，數據是最不可缺的存在。以數據為基礎，建立用戶畫像，利用標簽，讓系統進行智能分組，獲得不同類型的目標用戶群，針對每一個群體策劃并推送針對性的營銷。精準化營銷具有極強的針對性，是企業(yè)和用戶之間點對點的交互。它不但可以讓營銷變得更加高效，也能為企業(yè)節(jié)約成本。

3、產品創(chuàng)新

在用戶需求為導向的產品研發(fā)中，企業(yè)通過獲取到的大量目標用戶數據，進行分析、處理、組合，初步搭建用戶畫像，做出用戶喜好、功能需求統計，從而設計制造更加符合用戶核心需求的新產品，為用戶提供更加良好的體驗和服務。

4、渠道優(yōu)化

當前的零售企業(yè)的銷售渠道有多種，比如：自營門店、經銷商代理、電商平臺、電商APP等，每個渠道的用戶群體的消費能力、興趣偏好可能是不一樣的，通過用戶畫像可以讓合適的產品投放在合適的渠道投放，從而增加銷售量，這是目前零售行業(yè)慣用的方法。

5、個性推薦

眾所周知，今日頭條是個個性化的新聞推薦引擎，在今日頭條CEO張一鳴看來，算法是《今日頭條》這款興趣推薦搜索引擎應用的核心，這也是與傳統媒體最本質的區(qū)別，今日頭條之所以能夠非常懂用戶，精準推薦出用戶所喜好的新聞，完全得益于算法，而正是精準推薦，使得今日頭條在短短兩年多的時間內擁有了2.2億用戶，每天有超過2000萬用戶在今日頭條上閱讀自己感興趣的文章。

六、用戶畫像的分類

從畫像方法來說，可以分為定性畫像、定性+定量畫像、定量畫像

從應用角度來看，可以分為行為畫像、健康畫像、企業(yè)信用畫像、個人信用畫像、靜態(tài)產品畫像、旋轉設備畫像、社會畫像和經濟畫像等。

七、用戶畫像需要用到哪些數據

一般來說，根據具體的業(yè)務內容，會有不同的數據，不同的業(yè)務目標，也會使用不同的數據。在互聯網領域，用戶畫像數據可以包括以下內容：

（1）人口屬性：包括性別、年齡等人的基本信息
（2）興趣特征：瀏覽內容、收藏內容、閱讀咨詢、購買物品偏好等
（3）消費特征：與消費相關的特征
（4）位置特征：用戶所處城市、所處居住區(qū)域、用戶移動軌跡等
（5）設備屬性：使用的終端特征等
（6）行為數據：訪問時間、瀏覽路徑等用戶在網站的行為日志數據
（7）社交數據：用戶社交相關數據

用戶畫像數據來源廣泛，這些數據是全方位了解用戶的基礎，這里以Qunar的畫像為例，其畫像數據主要維度如下所示，包括用戶RFM信息、航線信息等。

Qunar的畫像數據倉庫構建都是基于Qunar基礎數據倉庫構建，然后按照維度進行劃分。

八、用戶畫像的作用

在互聯網、電商領域用戶畫像常用來作為精準營銷、推薦系統的基礎性工作，其作用總體包括：

（1）精準營銷：根據歷史用戶特征，分析產品的潛在用戶和用戶的潛在需求，針對特定群體，利用短信、郵件等方式進行營銷。
（2）用戶統計：根據用戶的屬性、行為特征對用戶進行分類后，統計不同特征下的用戶數量、分布；分析不同用戶畫像群體的分布特征。
（3）數據挖掘：以用戶畫像為基礎構建推薦系統、搜索引擎、廣告投放系統，提升服務精準度。
（4）服務產品：對產品進行用戶畫像，對產品進行受眾分析，更透徹地理解用戶使用產品的心理動機和行為習慣，完善產品運營，提升服務質量。
（5）行業(yè)報告&用戶研究：通過用戶畫像分析可以了解行業(yè)動態(tài)，比如人群消費習慣、消費偏好分析、不同地域品類消費差異分析

根據用戶畫像的作用可以看出，用戶畫像的使用場景較多，用戶畫像可以用來挖掘用戶興趣、偏好、人口統計學特征，主要目的是提升營銷精準度、推薦匹配度，終極目的是提升產品服務，起到提升企業(yè)利潤。用戶畫像適合于各個產品周期：從新用戶的引流到潛在用戶的挖掘、從老用戶的培養(yǎng)到流失用戶的回流等。

總結來說，用戶畫像必須從實際業(yè)務場景出發(fā)，解決實際的業(yè)務問題，之所以進行用戶畫像，要么是獲取新用戶，要么是提升用戶體驗、或者挽回流失用戶等具有明確的業(yè)務目標。

另外關于用戶畫像數據維度的問題，并不是說數據維度越豐富越好，總之，畫像維度的設計同樣需要緊跟業(yè)務實際情況進行開展。

九、用戶畫像的體系架構

按照應用系統分層設計的原則，基于標簽體系的用戶畫像的體系結構可以分為：數據源層、數據采集層、數據建模層、數據應用層，行業(yè)應用層等。

數據源層：用戶標簽體系建設的需要從不同的來源匯集數據，例如，企業(yè)的核心系統（不同的行業(yè)其核心系統不同，對制造業(yè)來說核心系統有ERP、MES、PLM等），營銷系統（CRM），互聯網數據（電商平臺以及微信、微博、論壇等社交平臺獲取的數據），以及從第三方專業(yè)機構獲取的數據（各地的數據交易中心購買的數據）。

數據采集層：與傳統數據項目的數據采集不同，基于標簽體系的用戶畫像的數據來源廣泛、數據量巨大，數據類型豐富（包括：結構化數據、半結構化數據和非結構化數據），有線上的用戶行為數據，也有應用系統日志數據，有互聯網爬蟲數據，也有API接口的第三方數據包。用戶畫像數據采集需要通過網絡爬蟲或網站公開API等方式從網站上獲取數據信息，并且可以將非結構化數據從網頁中抽取出來，將其存儲為統一的本地數據文件，并支持以結構化的方式存儲。同時支持圖片、音頻、視頻等文件或附件的采集，附件與正文可以自動關聯。

數據建模：基于標簽體系的用戶畫像建模主要是針對用戶畫像的建模和產品的建模。產品畫像建模包括了數據清洗、文本建模、類別識別、品牌識別、屬性識別、產品畫像等；用戶畫像建模包括了數據清洗、用戶全渠道ID識別、信息整合、分析建模和用戶畫像。通過統一產品類目和屬性體系和統一的用戶畫像標簽體系的建設，為用戶標簽的應用提供支撐。

數據應用：即基于標簽體系的應用，包括分析類應用（如用戶分析、產品分析）、服務類應用（如服務及產品創(chuàng)新）、營銷類應用（精準營銷）、數據接口API等。行業(yè)應用：基于標簽體系的用戶畫像在各行業(yè)的所應用和探索，將為行業(yè)的發(fā)展和創(chuàng)新帶來更多可能。

行業(yè)應用：基于標簽體系的用戶畫像在各行業(yè)的所應用和探索，將為行業(yè)的發(fā)展和創(chuàng)新帶來更多可能。

十、用戶畫像的建設步驟

1、數據采集

用戶畫像是根據用戶的人口信息、社交關系、偏好習慣和消費行為等信息而抽象出來的標簽化畫像，用戶畫像數據來源多樣，采集方式也不同：線下采集、線上采集、第三方接口等。

2、數據清洗

要實現精準的用戶畫像就需要對這些噪聲數據、臟數據進行處理，這個過程我們叫做數據清洗。

3、數據標準化

數據標準化的方法有很多種，常用的有“最小—最大標準化”、“Z-score標準化”和“按小數定標標準化”等。經過上述標準化處理，原始數據均轉換為無量綱化指標測評值，即各指標值都處于同一個數量級別上，可以進行綜合測評分析。

4、數據建模

數據建模就是根據用戶行為，構建模型產出標簽、權重。一個事件模型包括：時間、地點、人物三個要素。每一次用戶行為本質上是一次隨機事件，可以詳細描述為：什么用戶，在什么時間，什么地點，做了什么事。

用戶動態(tài)建模公式：用戶標識 +時間 + 行為類型 + 接觸點(網址+內容)，表示某用戶在什么時間、地點、做了什么事，所以會打上某標簽。用戶標簽的權重可能隨時間的增加而衰減，因此定義時間為衰減因子r，行為類型，同時該標簽對該用戶的重要程度也決定了用戶標簽的權重，進一步轉換為公式：用戶標簽權重 = 行為類型權重 × 時間衰減 × 用戶行為次數 × TF-IDF計算標簽權重

行為類型權重：用戶瀏覽、搜索、收藏、下單、購買等不同行為對用戶而言有著不同的重要性（偏序關系），該權重值一般由運營人員或業(yè)務來決定；

時間衰減：用戶某些行為受時間影響不斷減弱，行為時間距現在越遠，該行為對用戶當前來說的意義越小，采用牛頓冷卻定律；

行為次數：用戶標簽權重按天統計，用戶某天與該標簽產生的行為次數越多，該標簽對用戶的影響越大。

公式：t=初始溫度×exp(-冷卻系數×間隔的時間)，實際應用中，初始溫度為1就行，間隔的時間為今天與產生行為那天的天數，或者小時數都行，根據業(yè)務進行調整，冷卻系數的業(yè)務來決定，或者通過數據分析而來。

TF-IDF計算標簽權重：tf為某標簽在該用戶出現頻率，idf為某標簽在全部標簽中的稀缺程度。

5、標簽挖掘

標簽挖掘，即對用戶標簽體系中的用戶數據進行挖掘，形成用戶標簽，這個過程也叫標簽生產。標簽的生產方式主要有以下兩種：①基于規(guī)則定義的標簽生產方式，即根據固定的規(guī)則，通過數據查詢的結果生產標簽，重點在于如何制定規(guī)則。②基于主題模型的標簽生產方式，主題模型最開始運用于內容領域，目的是找到用戶的偏好，在用戶標簽中我們可以參照分類算法將用戶進行分類、聚類，使用關鍵詞的算法挖掘用戶的偏好，從而生產標簽。

6、數據可視化

數據可視化是基于標簽體系的用戶畫像的重要應用，通過詳實、準確對用戶的各類標簽數據進行匯集和分析，并以圖片、表格等可視化手段幫助企業(yè)全面了解用戶的基礎信息，用戶關系情況，用戶經濟情況、用戶偏好情況、健康情況、飲食情況等信息。同時，利用數據標簽體系的用戶畫像可視化技術，通過對用戶關系數據、用戶內容數據、用戶行為等數據進行可視化展示，能夠幫助企業(yè)管理人員、業(yè)務人員全面了解用戶，了解用戶是誰，他們有什么特征，他們的興趣偏好等，從而為智能推薦、精準營銷、產品和服務創(chuàng)新、渠道優(yōu)化等業(yè)務提供支撐。

此文來源網絡，如有侵權，請聯系浪尖(langjianliaodashuju)刪除。

標簽體系下的用戶畫像建設小指南