RFM模型:量化你的用戶價值!

萌面趙先生 | 作者

人人都是產品經理 | 來源

轉自 | 愛數據原統計網

在拓展市場初期沒有思路的時候,大家都在絞盡腦汁做活動、上新品、蹭熱點、做營銷,不斷的拓展客戶、做回訪維繫客戶感情,除了少數運氣好的之外,大部分效果寥寥。真正的用戶沒有幾個,到最後都便宜了羊毛黨。不同階段、不同類型的用戶需求點不同,有的客戶圖便宜,有的客戶看新品,有的客戶重服務,大包大攬的營銷運營,最後的結果就是涼涼。

解決得分方法也很簡單,就是用戶精細化運營,通過各類運營手段提高不同類型的用戶在產品中的活躍度、留存率和付費率。而如何將用戶從一個整體拆分成特徵明顯的羣體決定了運營的成敗。這裏介紹一個最經典的用戶分羣工具就是RFM模型。RFM模型是衡量用戶價值和用戶創利能力的經典工具,依託於用戶最近一次購買時間、消費頻次以及消費金額。

在應用RFM模型時,要有用戶最基礎的交易數據,至少包含用戶ID,交易金額,交易時間三個字段。

RFM的含義:

  • R(Recency)最近一次消費時間:表示用戶最近一次消費距離現在的時間。消費時間越近的客戶價值越大。1年前消費過的用戶肯定沒有1周前消費過的用戶價值大。

  • F(Frequency)消費頻率:消費頻率是指用戶在統計週期內購買商品的次數,經常購買的用戶也就是熟客,價值肯定比偶爾來一次的客戶價值大。

  • M(Monetary)消費金額:消費金額是指用戶在統計週期內消費的總金額,體現了消費者爲企業創利的多少,自然是消費越多的用戶價值越大。

基於這三個維度,將每個維度分爲高低兩種情況,我們構建出了一個三維的座標系。

(來源自網絡)

通過圖表很直觀的發現,我們把客戶分爲了2的三次方也就是8個羣體。

如果某個用戶最近一次消費時間距今比較久遠,沒有再消費了,但是累計消費金額和消費頻次都很高,說明這個用戶曾經很有價值也就是RFM模型中的重要保持客戶,我們不希望他流失,所以運營人員就會專門針對這類型用戶設計召回策略,這也就是RFM模型的核心價值。

當然這裏有個默認前提:

最近有過交易行爲的客戶,二次發生交易的可能性要高於最近沒有交易行爲的客戶;

交易頻率較高的客戶比交易頻率較低的客戶,更有可能發生二次交易;

過去所有交易總金額較多的客戶,比交易總金額較少的客戶,更有可能發生二次交易。

舉例來說明:以下是模擬我近一年的消費行爲(腦海中蹦出了一年逛兩次海瀾之家…):

假設當前統計時間爲2019年12月31日,經過簡單的統計計算可得:

  • R值 = 12月31日 – 11月11日 = 50;

  • F值 = 計數消費次數 = 4;

  • M值 = 1200+300+900+2000 = 4400;

這裏會遇到第一個問題:

R值最近一次消費時間表示用戶最近一次消費距離現在的時間,消費時間越近的客戶價值越大。以上方式計算出的R值越大說明當前用戶最近一次消費時間越遠用戶價值越小,而F值還有M值越大代表用戶價值越大,三組數據不在同一個描述維度,而且R值、F值、M值存在量級之間的差距,無法直觀的通過加減來衡量用戶價值。

這裏有兩種處理辦法分別是評分方式和算法。

1

評分方式

評分方式是根據三組數據各個值的特性,採用5分製爲各個數據賦予一個評分值,R值的評分機制是R值越大,評分越小。具體評分的規則可以根據經驗設定分值的給予區間,或者將數據平均分配成爲5組,對應5個分值。

在基於三組數據對應的評分值來計算評分值的平均數,大於等於平均數的數據劃到高的維度,低於平均數的數據劃到低的維度,自然將三組數據每組分別劃分爲高低兩組,交叉組合後就是我們上面說過的8種情況。然後在將三組數據對應的評分值做累加就是RFM總值了。


評分機制的優勢

計算RFM總值時解決了不同量級數據相加時影響權重不均衡的問題。由於用戶的交易行爲中R值和F值相對較小,如果三個值不處理就累加,M值直接決定了總值的量級,R值、F值對總值的影響很小,無法體現出用戶的真實價值。

同樣以剛剛的數據爲例:RFM總值 = 50+4+4400= 4454

可見M值4400直接決定了最後計算結果的量級,前面R值、F值對結果的影響基本忽略不計。採用評分制的方法後,將R、F、M值都映射到了1至5的區間之內,保證了各數據之間的可比性。


評分制的劣勢

賦值指標的設定需要資深的業務經驗,什麼樣的算高頻,什麼樣的算高額都是經驗,並且用戶的消費數據是不斷膨脹的,根據手動設定的劃分區間無法隨着數據的不斷膨脹而自動適配,所以需要根據經驗和數據反饋不斷修正。

2

算法方式

算法方式是根據數據特性將數據基於模型處理後量化用戶價值,分劃分高低維度、量化用戶價值兩步。


第一步:劃分高低維度

根據數據分佈情況將數據分爲高低兩組,這裏區分的方式一般採用四分位數(將一組數據由小到大排列並分成四等份,處於三個分割點位置的數值就是四分位數。處於正中位置的數字就叫做中位數,如果數組個數爲奇數個,則中位數爲排序後中間的一個數,如果數組個數爲偶數個,則中位數爲排序後中間兩個數的平均數。),而不是評分制的平均數。

分位數相對於平均數應用場景更廣,由於大部分數據都呈現長尾分佈,80%甚至90%以上都集中在低頻低額區間,少數的用戶提供了大部分銷售,採用平均數無法很好的體現數組的特性,長尾用戶很容易被平均,

下面舉個例子:土豪身價2個億,屌絲產品經理身價20萬,兩人平均後,平均身價1個億……

例子並不恰當,但是能看出在數據呈現長尾分佈的場景中,平均數在很多場景並不合適,而採用四分位數時,可以根據數據分佈情況,選擇中位數、四分之一位數或者四分之三位數,然後高於則劃分爲高緯度,低於則劃分爲低緯度。

這裏有一點需要注意!

由於R值的大小和用戶價值呈現反比,所以高於分位數的時候算低緯度,低於分位數時算高緯度。


第二步:量化用戶價值

首先解決R、F、M三值量級不均衡的問題,然後計算RFM總值量化用戶價值。可將三組數據分別無量綱化處理映射至0到1的區間在合理放大然後相加。很多同學一聽到算法就暈了,我挑選了這個方法中最簡單的一種,只用到了我們初中所學的數學,邏輯非常簡單,下面我爲大家介紹min-max歸一化。

min-max歸一化

先貼公式:

上式中,min是數組中的最小值,max是數組中的最大值。只要將數組中的數據依次經過上述公式處理,最後發現原數組收斂到了0至1的區間之內,是不是很簡單。

下面是我隨機生成的一組數據爲大家示例:

第一組源數據經過無量綱化處理後收斂至了0到1區間之內,可將不同量級的數據歸一化至同一量級,歸一化後的數據是一個位數極多的小數,而一般用戶對於極小數和極大數沒有直觀的感受。

所以這裏我把所有的數據同比放大了100倍,將源數據擴大到了0至100的區間,同時做了四捨五入,讓數據可讀性更強。經過這樣的處理就將數據從原來不同量級無法直觀對比,歸一化到了0至100的區間,方便大家直觀計算RFM總值。

最後計算RFM總值的公式如下:RFM總值 = R值*(-1)+F值+M值+100;

公式中同樣爲了解決R值同F、M值統計維度不一樣的問題,這裏給R值乘以了負1,同時爲了保證數據結果不會出現負數,又在最後加了100。這樣處理之後保證最後的RFM總值落在了0至400的區間之內,讓大家可以通過分值很直觀的量化用戶價值。

總之,RFM最終的目的就是幫助業務提高運營效率和產出價值,上述介紹了兩種方法,一種通過經驗人工劃分出用戶羣體,一種通過數據挖掘,給與業務運營建議。

具體的業務應用場景還是以淘氣值爲例(均爲個人猜想,如果哪裏說得不對,還請留言告知,謝謝)。

購物分:是近12個月購買金額的綜合分值。每一筆訂單、每日、每月、每一類商品、每一個店鋪,可獲得的最高可得分都不同,另外,購買更多種類的、高信譽商家的商品可以得到更多分;

獎勵分:獎勵分是近12個月內購買的商品類目數,反映真實消費體驗的文字評價、帶圖評價、追評、分享被點擊數、問大家參與次數、購買成交天數、連續購買月數的綜合分值。獎勵分受購物分正向影響,購物分越高,獎勵分越高;

基礎分:基礎分由當前信譽等級決定。信譽等級越高,基礎分越高,並且可得購物分和獎勵分的分數越高。

購物分圍繞着用戶的近12個月消費記錄,獎勵分則是圍繞着用戶的實際互動行爲,包括評價、分享、參與次數等。這裏特別強調一點RFM模型不僅僅針對消費數據,可以試試其他新的花樣,比如:

  • 互動行爲:最近一次互動時間、互動頻次、用戶的互動次數;

  • 直播行爲:最近一次觀看直播時間、直播觀看頻次、觀看直播累計時長;

  • 內容行爲:最近一次觀看內容時間、觀看內容頻次、觀看內容字數;

  • 評論行爲:最近一次評論時間、評論頻次、累計評論次數等等等等。

以上這些只是我的簡單思考,希望可以給大家更多的啓發。

淘寶根據用戶的淘氣值將用戶分成了三種類型:

  • 普通會員:0 ≤ 淘氣值 < 1000;

  • 超級會員:1000 ≤ 淘氣值 < 2500;

  • APASS會員:2500  ≤ 淘氣值。

分別設定了不同的權益針對性運營,在推出88會員的時候淘氣值高於1000分的用戶可以以88元直接購買會員。同時在淘氣值頁面看到了88會員中心【敬請期待】的頁面,在結合88會員入口處【花小積分 兌大權益】的文案,相信未來淘寶會在88會員上有新的運營動作。

最後關於無量綱化處理的方法還有很多,我這裏介紹了最簡單的一種,喜歡研究的同學可以自行百度。

END -

本文爲轉載分享&推薦閱讀,若侵權請聯繫後臺刪除

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章