Step1: 确定权重。
认为R、F、M 三要素对用户行为差异的反映是同等重要的。因此选择RFM 的权重为1: 1: 1。
Step2: 归一化。
R、F、M单位不同,数值上存在巨大的差异,因此要对RFM 分别进行归一化处理。
F 越大说明用户购买次数越高,M越大说明用户订购金额越大,F,M越大说明用户价值越高。R 代表用户上一次订购的时刻与研究时刻之间的时间间隔,这时间间隔越小,说明用户在这一段时间内的用户价值越高。因此,F 与M 与用户稳定程度正相关,而R 与用户稳定程度负相关,归一化时应区别处理。归一化后的数值越高,用户价值越高。
归一化方法:min-max标准化(Min-Max Normalization)
也称为离差标准化,是对原始数据的线性变换,使结果值映射到[0,1]之间。转换函数如下:
F 、M : X’ = ( X - Xmin ) / ( Xmax - Xmin ) ——X越大,X’越大
R: X’ = ( Xmax - X) / ( Xmax - Xmin ) ——X越小,X’越大
Step3: 聚类。
采用K 均值算法进行聚类。使用K-均值聚类法时,需要预先判断其聚类的类别数。本模型中客户分类通过每个顾客类别RFM平均值与总RFM平均值相比较来决定的,而单个指标的比较只能有两种情况:大于(等于)或小于平均值,因此可能有2 ×2 ×2 = 8种类别。标准化和确定聚类类别数后,进行聚类分析,得到8 类客户。
Step4: 划分用户所处等级。
即划分用户得分,得到每类用户的类型,以便定性分析用户忠诚度。
将R,F,M 分别按照归一化后的数值,由高到低排序,并均分为5 个等级,数值最高的等级得分为5,最低等级得分为1。最后得出每类用户的3 个元素分别所处的等级,得到3 个分数的组合。例如,第i 个用户,其元素R 平均值较大,得分为5,元素F 得分为3,元素M 得分为2,那么第i 个用户的类型为( 5,3,2) 型。
Step5: 划分用户类型。
将8 类客户的RFM平均值与总RFM均值比较,如果单个客户类别的均值大于总均值,则给该指标一个向上的箭头“↑”标记,反之则用“↓”。样本2中的比较情况如下。
类别 | 数量 | R均值 | F均值 | M均值 | 比较情况 | 客户类型 | 用户价值 |
1 | 1 | 80.00 | 1.00 | 299.00 | ↓↓↑ | 重要发展客户 | 较高 |
2 | 1 | 80.00 | 54.00 | 308.00 | ↓↑↑ | 重要保持客户 | 高 |
3 | 218 | 83.29 | 2.76 | 26.36 | ↑↑↑ | 重要挽留客户 | 较高 |
4 | 134 | 83.22 | 2.74 | 26.23 | ↓↓↓ | 新客户:重要发展客户 老客户:无价值客户 | 新:较高 老:低 |
5 | 111 | 83.26 | 2.76 | 26.26 | ↑↑↓ | 一般客户 | 一般 |
6 | 24 | 83.18 | 2.78 | 26.40 | ↓↑↑ | 重要保持客户 | 高 |
7 | 7 | 83.57 | 3.03 | 28.88 | ↑↑↑ | 重要挽留客户 | 高 |
8 | 4 | 83.53 | 2.98 | 28.10 | ↑↑↑ | 重要挽留客户 | 高 |
总均值 | 83.246 | 2.758 | 26.286 |
Step6: 用户价值指数Li。
Li = ωRCiR + ωFCiF + ωMCiM
权数ω可更具AHP法获得。聚类后,第i类R、F、M元素归一化数值的均值记为CiR、CiF、CiM。
通过计算的出的用户价值指数可以清楚比较用户价值大小。