您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 数学建模之基于-RFMS-指标的大型百货商场会员画像数据挖掘
1基于RFMS指标的大型百货商场会员画像数据挖掘摘要当代电商产业的迅猛发展使传统零售业受到冲击,完善商场会员画像成为运行商精细化管理、充分发挥会员价值的有效途径,我们希望基于数据挖掘的会员体系分析为其建立稳定的会员关系、策划促销活动提供可靠依据。问题1中,分离数据后首先通过消费行为特征(频次、总额、单次最高消费等)和人口学信息特征(年龄、性别)分析会员的消费特征,得出女会员占主体、消费频次和总额高,特别是30-49岁年龄段的女士,但是男性会员消费质量高,平均和单次消费金额均略高于女性。然后对比会员和非会员之间的价值差异,发现会员消费更活跃、购买力也更强。问题2中,构建FMS购买力模型()100()10()1()iiiiGcFcMcSc,通过百分位阈值给各指标打分,可将每位会员的购买力分为8类,将其对应为铂金、黄金、白银、青铜四个价值等级,随机检验表明模型评价高质量率达62.5%,其余均为中上评价水平。问题3中,构建RF消费状态评价模型()()()iiiZcRcFc,通过滑动时间窗口计算出会员生命周期中消费状态随时间的变化,发现近年来新会员数量迅猛增加,超过总数40%,但完全“活化”的活跃会员不多,同时会员办卡1年内大概率消费活跃度偏低。活跃会员数虽有增加,但其增长率低于新会员增长率;非活跃会员数保持相对稳定的数目。问题4中,计算出2015年至2017年非活跃会员激活率超过10%,非活跃会员是存在激活的可能性的,激活率1()(,,,)indzlAtfxxxx主要受商场促销活动四个指标中折扣促销活动次数和折扣力度影响,折扣大的活动能对非活跃会员产生较大的“延迟”效应,因此活动前的广泛宣传对提高激活率十分重要。问题5中,通过消费细目数据挖掘,以商品类别为指标分析出会员消费喜好,并计算出热销前十的每种商品类目“交叉连带率”,将两者结合提供一份基于会员喜好的有效连带促销方案(如中秋节日促销),尽可能产生更多消费市场和经济效益。关键词:会员价值体系RFMS指标数据挖掘精细化管理2一、问题的重述在零售行业中,会员价值体现在持续不断地为零售运营商带来稳定的销售额和利润,同时也为零售运营商策略的制定提供数据支持。零售行业会采取各种不同方法来吸引更多的人成为会员,并且尽可能提高会员的忠诚度。当前电商的发展使商场会员不断流失,给零售运营商带来了严重损失。此时,运营商需要有针对性地实施营销策略来加强与会员的良好关系。比如,商家针对会员采取一系列的促销活动,以此来维系会员的忠诚度。有人认为对老会员的维系成本太高,事实上,发展新会员的资金投入远比采取一定措施来维系现有会员要高。完善会员画像描绘,加强对现有会员的精细化管理,定期向其推送产品和服务,与会员建立稳定的关系是实体零售行业得以更好发展的有效途径。附件中的数据给出了某大型百货商场会员的相关信息:附件1是会员信息数据;附件2是近几年的销售流水表;附件3是会员消费明细表;附件4是商品信息表,一般来说,商品价格越高,盈利越高;附件5是数据字典。请建立数学模型解决以下问题:1.分析该商场会员的消费特征,比较会员与非会员群体的差异,并说明会员群体给商场带来的价值;2.针对会员的消费情况建立能够刻画每一位会员购买力的数学模型,以便能够对每个会员的价值进行识别;3.作为零售行业的重要资源,会员具有生命周期(会员从入会到退出的整个过程),会员的状态(比如活跃和非活跃)也会发生变化。试在某个时间窗口,建立会员生命周期和状态划分的数学模型,使商场管理者能够更有效地对会员进行管理;4.建立数学模型计算会员生命周期中非活跃会员的激活率,即从非活跃会员转化为活跃会员的可能性,并从实际销售数据出发,确定激活率和商场促销活动之间的关系模型;5.连带消费是购物中心经营的核心,如果商家将策划某次促销活动,如何根据会员的喜好和商品的连带率来策划此次促销活动?二、问题的分析2.1问题一分析对于该商场会员的消费特征分析,我们以附件1中本地会员的卡号(kh)作为唯一识别特征,与附件3中会员消费明细表(包括本地会员和非本地会员)进3行匹配,筛选出在此期间本地会员的的消费明细,从消费行为特征(会员购买频次、消费总额、平均购买金额和单次最高消费)以及人口学信息特征(会员年龄阶段、性别)分析该商场本地会员的消费特征。对于会员与非会员群体的差异分析,我们以附件3中会员消费明细表中的会员消费产生的时间(dtime)、商品编码(spbm)和消费金额(je)作为识别特征,与附件2销售流水表进行匹配,分离出此期间会员(本地会员)以及非会员(非本地会员和非会员)的消费信息,以消费行为特征(会员购买频次、消费总额、平均购买金额)为指标比较两个群体的差异,并结合具体数据分析会员群体给商场带来的价值。2.2问题二分析构建每一位会员购买力模型时,基于附件3数据,我们借鉴传统RFM方法中“购买频次(F)”和“消费总额(M)”指标[1],结合问题一中直观体现购买能力的“单次最高消费(Singlepeakconsumption,S)”指标,建立“FMS”会员购买力评价模型[2]。每个指标按整体会员消费情况百分位阈值赋予不同“评价分数”[3],并结合各指标的系数计算出每位会员购买力的评分。2.3问题三分析首先,确定滑动的研究时间窗口,起初为半年,其后以半年为单位逐渐增加,共有6个时间窗口。其次,确定时间窗口后,明确每个会员生命周期的算法;接着,在问题二模型基础上,建立判别会员活跃状态的“RF”模型,算出每个时间窗口内生命周期与活跃状态之间的概率分布关系;最后比较时间窗口滑动后,生命周期与活跃状态随时间变化的关系。2.4问题四分析计算激活率同样基于问题三中时间窗口滑动的考量。我们追踪在原时间窗口中为非活跃的会员、在下一个窗口中变为一般活跃或很活跃的人数占原时间窗口中非活跃会员总数,将其定义为该时段内的非活跃会员激活率。问题三种我们设定了6个时间窗口,因而可得出5个时段内的激活率,依此分析非活跃会员转化为活跃会员的可能性。此外,结合实际销售数据,追踪分析原非活跃会员是否与商场促销活动的相关指标存在关系。2.5问题五分析需要分别计算出会员的消费偏好以及消费时的连带情况,进而策划促销活动。首先,通过附件3中本地会员消费流水中的商品名称和附件4中匹配,分析所有本地会员的消费品牌编码(不同的名牌标码计算其对应的购买次数),借此得出会员消费时喜爱的品牌类别排行;其次,分析会员喜爱的品牌中商品的连带情况,由该品牌购买总数量和有效单据数确定商品的连带率。4三、模型假设1.假设问题二中FMS购买力模型中商场会员消费频率、消费金额和单次消费最高金额三个不同的行为维度是相互独立的,不具有相关性[4];2.假设研究的时间窗口内,某会员无消费记录,则该会员与时间窗口前一天进行最后一次消费,以此计算其生命周期;3.假设研究的时间窗口内,某会员无消费记录,则该时段内该会员卡处于“休眠”状态,不处于问题3中不活跃、一般活跃和很活跃三种状态中的任何一种,也就相应的不存在问题4中的激活与否问题。4.假设问题5中促销活动主要以底价商品(单个商品价格小于10元)和折扣商品(售价与消费金额的差值占售价比例20%)这两种为主;5.假设研究窗口以半年为单位增加或减少,会员半年中的消费行为特征能表明其长期的消费习惯;6.假设问题三中RF状态模型中商场会员消费频率、最近消费时间两个不同的行为维度是相互独立的,不具有相关性;7.假设问题四中非活跃会员的激活主要受商场促销活动次数和促销力度的影响,与会员主观因素无关;四、符号说明五、模型的建立与求解5.1数据预处理符号符号说明符号符号说明F购买频次nx参加促销活动总次数R最后一次消费时长dx参加底价促销活动次数M消费总额zx参加折扣促销活动次数G购买力lx折扣促销活动的折扣率S单次最高消费A非活跃会员激活率Z消费状态it第i个时间窗口ic第i个会员jJr第j个品牌连带率5结合商场实际运行情况,我们对附件数据进行预处理:(1)办卡日期、出生日期处于1900年1月1日之前或2018年1月4日之后的会员信息记录无效;(2)附件1中会员出生日期和性别不明确的,其年龄和性别状况缺测,该会员信息无效;(3)附件2中若标红、商品售价、销售数量或消费金额为负值时,该消费记录无效;(4)附件3中会员消费记录若商品售价、销售数量、消费金额或此次消费积分存在负值时,该消费记录无效;5.2问题一的分析与处理结合前面的问题一求解思路,在分析该商场会员的消费特征时,我们以附件1中本地会员的卡号(kh)作为唯一识别特征,与附件3中2015年1月1日至2018年1月3日期间的的会员消费明细表(包括本地会员和非本地会员)进行匹配,筛选出在此期间本地会员的的消费明细,从消费行为特征(会员购买频次、消费总额、平均购买金额和单次最高消费)以及人口学信息特征(会员年龄阶段、性别)分析该商场本地会员的消费特征。对于会员与非会员群体的差异分析,我们以附件3中会员消费明细表中的会员消费产生的时间(dtime)、商品编码(spbm)和消费金额(je)作为识别特征,与附件2中2016年1月1日至2017年9月23日期间的的销售流水表进行匹配,分离出此期间会员(本地会员)以及非会员(非本地会员和非会员)的消费信息。考虑到附件2中的销售流水表中无非会员的人口学信息特征,我们以消费行为特征(会员购买频次、消费总额、平均消费金额)为指标比较两个群体的差异,并结合具体数据分析会员群体给商场带来的价值。5.2.1商场会员的消费特征分析(1)通过Fortran编程将附件3中数据进行预处理,得出有效会员消费信息(支撑材料中1_1_vipxf.txt),通过Excel进行统计画图,得出会员消费的消费行为特征[5](会员购买频次、消费总额、平均购买金额和单次最高消费)以及人口学信息特征(会员年龄阶段、性别)。(2)人口学信息特征:主要是会员的年龄阶段和性别。数据预处理后,本地会员有效消费记录数据集包含392690条消费记录,43940条会员信息。对比图1我们可发现会员客户中存在很大的性别差异,其中女会员38636人(占总数88%),男会员4409人(仅占10%不到),有895明会员性别不详(占总数2%)。女会员数远大于男会员数,是商场会员的主力军。6图1本地会员的性别比例图图2本地会员各年龄段的人数及其比例据图2可得知,该商场会员客户群体中也存在较大的年龄差异。30-39岁青年(10206人,占比23.23%)、40-49岁中年(10474人,占比23.84%)是会员主要群体,均占比20%以上。其中50-59岁中老年会员数低于30-39岁青年、40-49岁中年人数,但多于20岁以下青少年(171人,仅占比0.39%)、60岁以上老年人(1267人,占比2.89%)。除此之外,年龄不详的会员有12221人,约占27.8%,而性别不详的会员占比不到2%,表明在登记会员卡信息时,年龄信息缺失率远大于性别信息缺失率,基于女性会员占据会员主力军的实况下,年龄差异能为商场管理者提供更多有效的会员信息,因此在登记会员信息时,对会员的年龄信息给予更多的关注度。(3)消费行为特征:主要是会员购买频次、消费总额、平均购买金额和单次最高消费。进行数据预处理后,本地会员有效消费记录集包含43940条会员信息,392690条消费记录,消费总额为593081426.5元,平均消费额为1510.30元,其购买频次、消费总额、平均购买金额和单次最高消费分布信息主要如表1、表2所示。表1中为本地会员消费频次和消费总额相关信息。分析发现,在2015年17月1日至2018年1月3日近3年期间,有超过60%的本地会员只有不超过5次的消费记录,平均每7个月消费1次,这其中有占总会员数40%左右的会员数,3年期间只有1-2次的消费记录,即低频消费/不活跃会员数占据了商场会员相当表1会员的消费频次、消费总额指标频数分布及其占比消费频次消费总额次数会员数占比%金额(元)会员数占比%1-21821441.45小于50034477.843-51042723.735
本文标题:数学建模之基于-RFMS-指标的大型百货商场会员画像数据挖掘
链接地址:https://www.777doc.com/doc-1277749 .html