如何基于RFM和AHP構(gòu)建用戶評分分析體系
花花是某電商公司的一名產(chǎn)品運(yùn)營,如果新上線一款產(chǎn)品他的一貫做法都是做活動、蹭熱點(diǎn)、做營銷等等。但是,這些做法引來了大量的羊毛黨,獲取的真實(shí)客戶卻是屈指可數(shù)。
正在花花為此事頭疼之際,同組的前輩豆豆給他支個招,運(yùn)用 AHP 和 RFM 構(gòu)建用戶評分體系,精細(xì)化運(yùn)營,能帶來很好的效果。開心之余,花花趕緊使用度娘搜索,AHP 和 RFM 究竟是什么東西?又怎么運(yùn)用呢?接下來作者就給你嘮叨嘮叨。
1
AHP制定權(quán)重
1.1
AHP是什么?
層次分析法(Analytic Hierarchy Process)簡稱 AHP,20 世紀(jì) 70 年代中期由美國運(yùn)籌學(xué)家托馬斯·塞蒂(T·L·Saaty)提出。
AHP 是指將與決策有關(guān)的元素分解成目標(biāo)、準(zhǔn)則、方法等層次,主要用于定性的問題進(jìn)行定量化分析決策。
比如,某電商平臺根據(jù)用戶行為數(shù)據(jù)對用戶做綜合評分模型,找出忠誠用戶、活躍用戶、沉默用戶等等,進(jìn)而對各類用戶進(jìn)行精細(xì)化運(yùn)營。
1.2
AHP基本原理
AHP 的思路是密切的和決策者的主觀判斷以及推理聯(lián)系起來,也就是對決策者的推理或者判斷過程進(jìn)行量化,從而避免決策者在結(jié)構(gòu)復(fù)雜或方案較多時邏輯推理失誤。具體步驟如下:

1)建立評分體系
構(gòu)建用戶價值評分體系,對各類用戶進(jìn)行精細(xì)化運(yùn)營。
設(shè)定目標(biāo),列出影響目標(biāo)的所有元素。采用專家打分、用戶問卷等方式,逐一列出所有的影響因素,比如活躍度、忠誠度、購買力等。
2)構(gòu)建層次結(jié)構(gòu)、判斷矩陣
列出影響因素的指標(biāo)或方案。
判斷影響用戶活躍度的指標(biāo)有瀏覽頁面次數(shù)、停留時長、瀏覽商品次數(shù)、下單次數(shù)。
判斷影響用戶忠誠度的指標(biāo)有最近訪問時間、訪問頻率、主動評價次數(shù)。
判斷影響用戶購買力的指標(biāo)有單筆最高金額、平均訂單金額、購買次數(shù)。
3)算出權(quán)重系數(shù)
分別算出各個指標(biāo)層、準(zhǔn)則層的指標(biāo)權(quán)重,然后再算出決策公式(如下圖)。

4)一致性校驗(yàn)
若一致性指標(biāo) CR<0.1,就進(jìn)入下一環(huán)節(jié);否則,對各指標(biāo)權(quán)重重新賦值(即,重新構(gòu)建判斷矩陣)。
5)層次排序
層次排序分為層次單排序和層次總排序。所謂層次單排序,指對于上一層某因素而言,本層次各因素的重要性的排序;所謂層次總排序,指確定某層所有因素總目標(biāo)相對重要性的排序權(quán)值過程。
層次排序是從最高層到最底層依次進(jìn)行的。對于最高層次而言,其層次單排序的結(jié)果也是總排序的結(jié)果。
1.3
確定權(quán)重
1.3.1 構(gòu)建判斷矩陣
在確定各層次各因素間的權(quán)重時,如果僅是定性的結(jié)果,則通常不容易被其他人接受,因而 Saaty 提出一致性矩陣法,即兩兩因素相互比較,采用標(biāo)度,盡可能減少不同因素相互比較的困難,以提高準(zhǔn)確度。
運(yùn)用專家打分將所有因素兩兩比較確定合適的標(biāo)度。建立層次結(jié)構(gòu)后,比較因子及下屬指標(biāo)的各個比重,實(shí)現(xiàn)定性向定量轉(zhuǎn)化。
比如,采用 1-9 分標(biāo)度法,構(gòu)建決策層的打分矩陣 A,如下圖。


實(shí)際上,上述打分矩陣就是層次分析法中的判斷矩陣。
1.3.2 一致性檢驗(yàn)
一致性檢驗(yàn)是為了檢驗(yàn)各元素重要程度之間的協(xié)調(diào)性,避免出現(xiàn) A 比 B 重要,B 比 C 重要,而 C 又比 A 重要,這樣的矛盾情況。
1)相關(guān)理論
(1)一致性矩陣

(2)判斷矩陣是否為一致性矩陣

在判斷矩陣的構(gòu)造中,并不要求判斷矩陣一定具有一致性,這是由客觀事物的復(fù)雜性和人的認(rèn)識多樣性決定的。但判斷矩陣是計(jì)算排序權(quán)向量的依據(jù),因此要求判斷矩陣應(yīng)該滿足大體上的一致性。

2)對判斷矩陣一致性校驗(yàn)
先求解特征向量,采用手工計(jì)算方法——和積法:

手工計(jì)算矩陣 A 的特征值:
(1)求特征向量

(2)求最大特征值

手工求解精確度較低,只是求得最大特征值的近似值。一般情況下,可以采用在線計(jì)算工具 Matlab,鏈接地址:https://wis-ai.com/tools/ahp
(3)一致性校驗(yàn)


1.3.3 計(jì)算指標(biāo)層權(quán)重
1)計(jì)算活躍度的權(quán)重

因此,準(zhǔn)則層相對活躍度的權(quán)重依次為:
瀏覽頁面次數(shù)的權(quán)重:b1=0.63231
停留時長的權(quán)重:b2=0.21452
瀏覽商品次數(shù)的權(quán)重:b3=0.10961
下單次數(shù)的權(quán)重:b4=0.04357
2)計(jì)算忠誠度的權(quán)重

因此,準(zhǔn)則層相對忠誠度的權(quán)重依次為:
最近訪問時間的權(quán)重:c1=0.61935
訪問頻率的權(quán)重:c2=0.28423
主動評價次數(shù)的權(quán)重:c3=0.09642
3)計(jì)算購買力的權(quán)重

因此,準(zhǔn)則層相對購買力的權(quán)重依次為:
單筆最高金額的權(quán)重:d1=0.70706
平均訂單金額的權(quán)重:d2=0.20141
購買次數(shù)的權(quán)重:d3=0.09153
4)列出全部權(quán)重

5)如果一致性校驗(yàn)沒有通過,怎么辦?
作者在實(shí)際構(gòu)建評分矩陣時,發(fā)生了好幾次一致性校驗(yàn)不通過(如 CR>=0.1)。這可能由于一些主觀因素導(dǎo)致,也可能是由于構(gòu)建模型不合理導(dǎo)致。所以需要專家重新構(gòu)建打分矩陣,甚至需要重新構(gòu)建層次分析模型。
(1)構(gòu)建模型影響
因素是否合理、含義是否清晰、要素間是否重疊,這都會有影響。建議每層要素盡量不超過 7 個;如果元素之間的強(qiáng)度相差很大,盡量不要放在同一個層級。
(2)計(jì)算精度影響
特征值求解方法的不同(比如和積法、方根法等)、Excel 計(jì)算值的誤差、計(jì)算工具的誤差等,都可能導(dǎo)致一致性校驗(yàn)結(jié)果有些偏差,可以使用 Matlab 等精度更高的計(jì)算工具(https://wis-ai.com/tools/ahp),如下圖。

6)結(jié)論
運(yùn)用 AHP 模型得出和公式:
活躍度=b1*瀏覽頁面次數(shù)+b2*停留時長+b3*瀏覽商品次數(shù)+b4*下單次數(shù);
忠誠度=c1*最近訪問時間+c2*訪問頻率+c3*主動評價次數(shù);
購買力=d1*單筆最高金額+d2*平均訂單金額+d3*購買次數(shù);
用戶價值評分=0.64339*活躍度+0.28284*忠誠度+0.07377*購買力。
AHP 方法使用較少的定量數(shù)據(jù),就可以構(gòu)建模型,最終的結(jié)論只能表明因素的重要程度,不能得出用戶價值的評分值是多少。
因此,將 RFM 模型和 AHP 模型相結(jié)合,算出各個因素的分值,得出每個用戶的評分。
2
RFM計(jì)算分值
2.1
RFM是什么?
RFM 模型是衡量客戶價值和客戶創(chuàng)利能力的重要工具和手段。該模型通過一個客戶的近期購買行為(Recency)、購買的總體頻率(Frequency)以及消費(fèi)金額(Monetary)3 項(xiàng)指標(biāo)切分出多類客戶,最后根據(jù)不同類型客戶(如下圖)占比情況來評估客戶的整體分布,并針對不同類型的客戶進(jìn)行有針對性的營銷。

一個 RFM 用戶分層模型,重要發(fā)展客戶到底多少分?一般價值客戶多少分?作者將用某電商公司 2018 年 11 月 1 日-2019 年 4 月 30 日共 5 個月的交易數(shù)據(jù)來講述,為了保護(hù)隱私,數(shù)據(jù)經(jīng)過脫敏處理。
2.2
構(gòu)建RFM模型的步驟
2.2.1 獲取與清洗數(shù)據(jù)
RFM 模型主要用于分析用戶購買行為,通常獲得的數(shù)據(jù)包含付款時間、實(shí)付金額、訂單狀態(tài)等等信息的數(shù)據(jù),部分?jǐn)?shù)據(jù)如下圖。

獲得數(shù)據(jù)后,其中可能存在空值、異常值等情況,這類臟數(shù)據(jù)無法進(jìn)行分析,需要通過簡單的數(shù)據(jù)清洗去除。數(shù)據(jù)清洗的方式有兩類:異常值處理,如刪除、均值補(bǔ)差等;異常值識別,如按業(yè)務(wù)規(guī)則查找、語義沖突等。
比如,作者獲得交易數(shù)據(jù)后,發(fā)現(xiàn) “發(fā)貨時間” 為空,是臟數(shù)據(jù),需要剔除;對應(yīng) “訂單狀態(tài)” 的值是 “付款以后用戶退款成功,交易自動關(guān)閉”,退款用戶數(shù)據(jù)不該納入模型,需要去除。
清洗完之后,分別對 “發(fā)貨時間”、“訂單狀態(tài)” 進(jìn)行篩選,這時發(fā)現(xiàn) “發(fā)貨時間” 為空或訂單狀態(tài)為 “付款以后用戶退款成功,交易自動關(guān)閉” 這類數(shù)據(jù)已經(jīng)不存在了,說明已經(jīng)篩選干凈了。
2.2.2 建立模型
接下來,作者需要提取 R、F、M 的值:R(最近一次購買距今天的天數(shù))、F(購買了幾次)和 M(平均購買金額)。
構(gòu)建一張透視表,將 “買家昵稱” 分別拖到行位置和值位置,對 “買家昵稱” 進(jìn)行計(jì)數(shù)匯總,也就是得出買家的消費(fèi)次數(shù),即 F 值。將 “付款時間” 拖到值位置,設(shè)為最大值,將 “實(shí)付金額” 拖到值位置,設(shè)為平均值,即 M 值,如下圖。

將初步透視好的數(shù)據(jù)復(fù)制到一張新的表格(選擇性粘貼「值和數(shù)字格式」)。接著處理 R 的值,由于訂單截止日期是 2019 年 4 月 30 日,作者將建模時間設(shè)為 2019 年 5 月 1 日,求距離 5 月 1 日這一天客戶最近一次付款時間的間隔天數(shù),就是求每個客戶的 R 值,如下圖。

用 RFM 的計(jì)算方式,對所有因素(R、F、M)進(jìn)行 0-5 評分區(qū)段的映射。

或者用下面的公式歸一化處理(如下圖),正相關(guān)使用第一個公式,負(fù)相關(guān)使用第二個公式,R 屬于負(fù)相關(guān),因?yàn)樽罱淮钨徺I時間距越小,那么越重要。F 和 M 都是正相關(guān)。

規(guī)范化計(jì)算也可以使用 (X-Xmin)/均值(X) 和 (Xmax-X)/均值(X) ,需要注意的是,如果真實(shí)數(shù)據(jù)分布不平均的話,均值就可能出現(xiàn)偏差,比如有人消費(fèi) 100 萬元,有人消費(fèi) 1000 元,平均數(shù)的偏差就很大。所以,可以使用三分位、中位數(shù)或者(Xmax-Xmin)等方式進(jìn)行歸一化。

由于獲取的數(shù)據(jù)字段有限,無法通過指標(biāo)層得到準(zhǔn)則層的權(quán)重,所以直接使用 AHP 算出活躍度、忠誠度和購買力的權(quán)重,依次分別是 0.64339、0.28284、0.07377。得出標(biāo)準(zhǔn)化的數(shù)據(jù)以及一定權(quán)重的用戶價值,如下圖。

把 R、F、M、用戶價值按照 0、1 區(qū)分,如果大于均值為 1,否則為 0,得到 16 種用戶類型,如下圖。

將用戶類型代入數(shù)據(jù)中,得出的部分結(jié)果,如下圖。

2.3
模型可視化
2.3.1 分析各類客戶占比
對剛剛完成 RFM 模型表格進(jìn)行透視,將 “客戶類型” 拖至行區(qū)域,再把 “客戶類型” 拖至值區(qū)域兩次,第一次是為了計(jì)數(shù),第二次是為了查看客戶占比,如下圖。

繪圖,更清晰的查看不同客戶類型的用戶數(shù)占比,如下圖。

2.3.2 分析客戶金額占比
對 RFM 模型表格進(jìn)行透視,將 “客戶類型” 拖至行區(qū)域,再把 “累計(jì)金額” 拖至值區(qū)域兩次,第一次是為了計(jì)算每類客戶的累計(jì)消費(fèi)金額,第二次是為了查看每類客戶的金額占比,如下圖。

繪圖,更清晰的查看不同客戶類型的金額占比,如下圖。

3
總結(jié)與建議
1)從各類客戶占比圖中看出,次一般挽留客戶(0000)的人數(shù)最高,竟達(dá) 8725 人,人數(shù)占比 34.52%,此類客戶近期沒有購買,購買頻次低于平均值,下單平均金額比較低,并且用戶價值也較低,大約在 2018 年 雙11 下的單,屬于價格敏感性客戶,所以可以在促銷活動(如國慶節(jié)、六一等)時試著喚醒他們。
2)次重要挽留客戶(0010),最近沒有購買商品,消費(fèi)頻率較低,消費(fèi)金額較大的一類客戶,有 6905 人,人數(shù)占比 27.16%,支付金額占比最高。換句話說,對于該商家銷售額貢獻(xiàn)率最高的一批客戶,下單時間遠(yuǎn),購買次數(shù)低,已經(jīng)處于流失的邊緣,但是不同于次一般挽留客戶,這類客戶的平均銷售額較高。
對于這類客戶,運(yùn)營人員需要獲取他們的聯(lián)系方式,進(jìn)行回訪,詢問客戶沉睡的原因;或者說商品本身就屬于復(fù)購率低、消費(fèi)金額占比高的商品;或者從商品本身入手,試著比較客戶購買時間與商品的回購日期,是不是上次購買的商品還沒有用完。
3)重要發(fā)展客戶(1011),最近購買,購買頻次低,消費(fèi)金額大,用戶價值大的客戶有 2614 人,占總?cè)藬?shù)的 20.28%,支付金額相對較高。這類客戶大致是新客戶。
對于這類客戶,運(yùn)營人員近期適當(dāng)?shù)倪M(jìn)行短信推送,優(yōu)惠券發(fā)放等形式,來提高他們的購買頻率,爭取提高這類用戶的忠誠度,最終將他們轉(zhuǎn)變成重要價值客戶。

推薦閱讀
歡迎長按掃碼關(guān)注「數(shù)據(jù)管道」
