发布时间:2023-09-05 09:00
前段时间制作人表示要重新梳理游戏内各个礼包促销弹窗和福利派送机制,提出了用户分群的需求。由于该分群并非只针对某一特定功能,例如活动礼包精准营销、用户流失预警及召回福利,因此需将目标玩家初步归类,以便设计具体功能时进一步细分。
RFM模型在传统行业应用颇广,其基本原理即根据客户最近一次交易时间(Recency,R)、最近一段时间内的付费频次(Frequency,F),最近一段时间内的付费金额(Monetary,M) 三个维度来划分用户。
一般而言,
最近有过交易行为的客户再次发生交易的可能性要高于最近没有交易行为的客户;
交易频率较高的客户比交易频率较低的客户更有可能再次发生交易;
过去交易总金额较多的客户比交易总金额较少的客户更有消费积极性;
满足以上三个前提,RFM模型分群才有实际意义。如此,根据RFM三个维度的高低,即可将用户分为如下八类,在设计运营策略时,可根据用户类型有的放矢,从而实现精细化运营。
在本次应用中,数据采集自2020/03/05 0点起近90d内玩家的支付记录,数据清洗时需将测试机数据去除,以免极端值影响数据分布。
数据平台:Hive SQL
数据清洗完毕后做以下处理:
根据支付时间计算距2020.2.16的间隔天数,汇总每个id的最短间隔天数RecencyAgg,90d内累计付费频次FrequencyAgg,90d内累计充值额MonetaryAgg;
考察各维度玩家分布,计算RecencyAgg/ FrequencyAgg/ MonetaryAgg得分:
RFM总分计算权重根据业务经验设定,书中给出的业务经验公式为:
RFM总分 = 100*R_S +10*F_S + 1*M_S
而游戏中一次付费用户占绝大多数比例,付费次数比付费金额更具有实际参考价值。高M_S的玩家占比虽少,却贡献了游戏绝大部分内购收入,因此权重设置相对地没书上给出的那么悬殊。
经和策划讨论,最终分析采用的权重为:
RFM总分 = 50*R_S +30*F_S + 20*M_S
使用工具:python pandas、seaborn、ggplot包,excel
由下图可知,用户群中小R较多,玩家付费情况较为集中,不易看出相关趋势;
做RFM各维度处理后,即各得分的散点图。由图可知,各Monetary的玩家最近一次付费间隔分布较为均匀,但在图形右测,Monetary得分较高的玩家,其Recency得分也较高,即近期付费总额较多的玩家,近期越有可能发生付费行为,这一点比较符合我们的业务认知。Frequecy和Recency的关系同理。
Monetary和Frequency得分存在一定线性相关;
付费玩家整体R、F、M三个维度的分布图如下所示:
由以上分布图可知:
根据前面提到的RFM总分计算公式,得出每个用户RFM总分。分数越高,说明付费用户价值越高,需要重点关注。
RFM总分 = 50*R_S +30*F_S + 20*M_S
付费玩家整体RFM总分分布较为均匀,大于80分的玩家极少,且这些玩家基本都是活跃多次付费中大R,对游戏收入贡献最为明显。在具体分群时,可以将RFM≥60分(占比12.3%)的玩家定义为重点运营玩家;
(不同公司不同项目的运营资源或有不同,RFM≥60分和占比12.3%这两个数值不具有绝对参考意义。)
每一类用户的分类标准及定义如下:
以下是每一类用户在R、F、M三个维度上的箱线分布图。其中箱的上下边缘分别代表25分位数和75分位数,中线为50分位数(也称中位数)。线的两端分别表示数据的极大值和极小值。
根据上述箱线图可知:
付费时间间隔(RecencyAgg)以14d为划分标准。
其中,四类沉默付费玩家的付费时间间隔又稍有差异,沉默多次付费中大R和沉默多次付费小R的付费时间间隔相对沉默一次付费中大R和沉默一次付费小R更短,如果需进一步验证该差异是否有统计学意义,则需做t检验或者方差分析。
四类活跃付费玩家仅有活跃一次付费中大R约近5d都没有付费行为。但一次付费就能成为中大R的玩家本就极少,小样本的分布不是很具有代表性。
所以整体来说,这些活跃付费玩家在付费时间间隔这个维度上的分布差异不大。
付费频次(FrequencyAgg)以是否一次付费为划分标准。
在前面四类多次付费玩家中,中大R的付费频次明显高于小R的付费频次。
活跃付费玩家的付费频次略高于沉默付费玩家的付费频次。
付费金额(MonetaryAgg)以是否位于TOP20%付费额为划分标准。
无论活跃付费还是沉默付费,两类多次付费中大R的付费金额分布差异不大,两类多次付费小R的付费金额分布差异也不大,两类一次付费小R亦是如此,即沉默付费与否,与玩家尚活跃付费时的付费金额无明显相关。
一次付费中大R由于样本量小,暂不讨论。
各类玩家付费性质和人数占比、收入贡献数据如下。运营重要性以⭐来表示,⭐的数量越多、颜色越深,运营的重要性越高。
每一类用户都应采用不同的运营手段,尤其是那些收入贡献多,但又不活跃了的玩家(即沉默多次付费中大R),这样的玩家我们需要进一步排查,是因为玩家流失了呢?还是因为运营活动、促销活动没跟上,或者后期礼包推送不合理才导致玩家没了付费意愿?
记录一个 Nginx-FastCGI-"Primary script unknown" 错误
【最佳实践】意出望外的一次相遇|利楚初探 OceanBase
深入理解SpringMVC中央调度器DispatcherServlet
模型的度量指标和损失函数有什么区别?为什么在项目中两者都很重要?
Docker容器内报错权限不足:ls: cannot open directory ‘.‘: Permission denied
「Python」面向对象封装案例1——小夏爱跑步、案例扩展(多个对象之间属性互不干扰)
CTFHub_2021-第四届红帽杯网络安全大赛-Web-WebsiteManger