数模优秀论文总结—2018“大型百货商场会员画像描绘”

针对2018年数学建模国赛优秀论文分析思路进行简单总结

  1. 基于RFMT模型的百货商场会员画像描绘
  2. 大型百货商场会员画像描述
  3. 基于RFMS 指标的大型百货商场会员画像数据挖掘

1 基于RFMT模型的百货商场会员画像描绘

点击下载原论文pdf

1.1 待解决问题

1、对该商场的会员消费特征以及会员与非会员差异进行分析,并说明会员给商场带来的价值

2、建立刻画会员购买力的数学模型,对会员的价值进行识别

3、在某个时间窗口,建立会员生命周期和状态划分的数学模型

4、计算会员生命周期中非活跃会员的激活率,并确定激活率和商场促销活动之间的关系模型

5、根据会员的喜好和商品的连带率设计促销方案帮助商家策划促销活动

1.2 解决思路

通过EXCELSQL Server进行数据预处理工作(注意对数据表进行关联)

1、对于问题一,运用数据统计分析的方法来对会员信息进行分析。问题中需要根据会员消费明细表分析会员的消费特征,主要从三个维度来分析:购买力(会员消费金额、会员消费指数、购买数量)、时间偏好(季节性倾向)、消费偏好(特价商品消费占比、高价商品消费占比)。而对于会员与非会员群体之间的差异,从购买力以及购买数量的角度深入分析会员与非会员带给商场的价值差异,进而分析会员给商场带来的价值。——描述性统计

2、对于问题二,在众多的用户价值分析模型中,RFM 模型是衡量客户价值和增益能力的重要工具,考虑到本文研究对象为大型百货商场,相对消费会较为高端,可以增加一个反映会员一次性消费的最高能力的指标,故我们引入改进的RFM 模型——RFMT 模型,对会员购买力进行刻画,并通过RFMT 模型的会员得分对每个会员进行价值等级划分,最终可得知每一位会员对于商场的价值。应用层次分析法计算RFMT模型每个指标的指标权重,构建指标得分规则计算RFMT指标的得分,最终通过K-means 聚类法对会员群体进行价值等级分类。

3、对于问题三,基于问题二中的RFMT模型,选取R(会员最近一次购买商品的时间间隔天数)和F(会员在限定时间内购买商品的频率)指标作为聚类依据,运用Clementine 软件,应用K-means 聚类法对有消费记录的会员进行状态聚类,最终可知每个会员所处的生命周期状态。

4、对于问题四,从问题三的聚类结果中可筛选出非活跃状态的会员,给非活跃会员构建分析指标:R、F、M、T 指标,针对非活跃会员的RFMT 指标进行因子分析,可得到相应指标的因子得分,以每个公因子的方差贡献率作为权重系数,对每个因子进行加权求和,从而计算得到各非活跃会员的激活率。对于非活跃会员激活率和商场促销活动之间的关系模型,考虑到商场促销活动与特价商品有关,结合非活跃会员的激活率和特价商品消费总金额在商品消费总金额中的占比,利用SAS软件相关性分析,得到激活率和商场促销活动之间的关系模型。

5、对于问题五,针对会员消费情况,使用Clementine软件对会员购买的商品进行关联规则挖掘。第一阶段必须先从会员消费数据集中找出所有的高频商品,第二阶段再由这些高频商品中产生关联规则。

1.3 摘要

数模优秀论文总结—2018“大型百货商场会员画像描绘”_第1张图片

1.4 小的注意点

1、变量说明部分两个变量及符号解释在一行,不仅节省空间,也美观

2、重要结果若数据过多,可以只展示一小部分


2 大型百货商场会员画像描述

点击下载原论文pdf

2.1 解决思路

1、对于问题一,首先根据附件一和附件二的单据号,借助SQL Server数据库的存储与处理功能提取出会员与非会员的消费数据,再借助EXCEL统计出会员的消费金额、购买数量及购买商品的平均价格,非会员的消费金额、购买数量及购买商品的平均价格。为了研究会员与非会员之间的消费特征差异,以及会员给商场带来的价值,将两者的消费特征数据进行对比,对于商场而言,消费金额越高,给商场带来的价值就越大。

2、对于问题二,为了对会员的购买力进行刻画,根据会员的消费特征,对会员进行分类,建立分类模型。本题选用K-均值聚类法,运用SPSS软件对筛选整理好的数据进行聚类。

3、对于问题三,在研究会员的生命周期的时候,通过对数据的分析,把最近没有消费行为天数和消费次数,作为划分会员生命周期阶段的指标,把会员生命周期划分为五个阶段:引入期-成长期-成熟期-休眠期-流失期。

4、对于问题四,:定义:激活率=当月活跃人数占比-上月活跃人数占比。会员当月有消费记录则当月为活跃状态,否则当月为非活跃状态。取登记时间为2015年到2016年共13671个会员为研究对象,根据其消费明细统计得到2017年活跃状态矩阵,表1中1代表当月为非活跃状态,2表示当月为活跃状态。基于活跃状态矩阵采用Matlab计算其**马尔科夫状态转移矩阵。**通过线性拟合可得销售量与激活率的关系表达式为一元二次方程。

5、对于问题五,首先根据会员卡号+消费时间+商品编码删除一次消费中商品重复数据,然后根据会员卡号+消费时间提取每次购物篮商品数据,最后采用购物篮数据采用FP-Growth算法,对会员消费明细数据进行关联分析,支持度计数设为50,即规则支持度计数大于等于50才是频繁项集。

2.2 摘要

数模优秀论文总结—2018“大型百货商场会员画像描绘”_第2张图片

2.3 小的注意点

1、对于“会员画像”的描述,可以采用E-R图完成,提供实体(即数据对象)、属性、和联系的方法


3 大型百货商场会员画像描述

点击下载原论文pdf

3.1 解决思路

1、对于问题一,对于该商场会员的消费特征分析,以附件1中本地会员的卡号(kh)作为唯一识别特征,与附件3中会员消费明细表(包括本地会员和非本地会员)进行匹配,筛选出在此期间本地会员的的消费明细,从消费行为特征(会员购买频次、消费总额、平均购买金额和单次最高消费)以及人口学信息特征(会员年龄阶段、性别)分析该商场本地会员的消费特征。对于会员与非会员群体的差异分析,以附件3中会员消费明细表中的会员消费产生的时(dtime)、商品编码(spbm)和消费金额(je)作为识别特征,与附件2销售流水表进行匹配,分离出此期间会员(本地会员)以及非会员(非本地会员和非会员)的消费信息,以消费行为特征(会员购买频次、消费总额、平均购买金额)为指标比较两个群体的差异,并结合具体数据分析会员群体给商场带来的价值。会员价值效应

2、对于问题二,构建每一位会员购买力模型时,基于附件3数据,借鉴传统RFM方法中“购买频次(F)”和“消费总额(M)”指标,结合问题一中直观体现购买能力的“单次最高消费(Single peak consumption,S)”指标,建立**“FMS”会员购买力评价模型**。每个指标按整体会员消费情况百分位阈值赋予不同“评价分数”,并结合各指标的系数计算出每位会员购买力的评分。

3、对于问题三,首先,确定滑动的研究时间窗口,起初为半年,其后以半年为单位逐渐增加,共有6个时间窗口。其次,确定时间窗口后,明确每个会员生命周期的算法;接着,在问题二模型基础上,建立判别会员活跃状态的“RF”模型,算出每个时间窗口内生命周期与活跃状态之间的概率分布关系;最后比较时间窗口滑动后,生命周期与活跃状态随时间变化的关系。

4、对于问题四,:计算激活率同样基于问题三中时间窗口滑动的考量。追踪在原时间窗口中为非活跃的会员、在下一个窗口中变为一般活跃或很活跃的人数占原时间窗口中非活跃会员总数,将其定义为该时段内的非活跃会员激活率。问题三设定了6个时间窗口,因而可得出5个时段内的激活率,依此分析非活跃会员转化为活跃会员的可能性。此外,结合实际销售数据,追踪分析原非活跃会员是否与商场促销活动的相关指标存在关系。

5、对于问题五,需要分别计算出会员的消费偏好以及消费时的连带情况,进而策划促销活动。首先,通过附件3中本地会员消费流水中的商品名称和附件4中匹配,分析所有本地会员的消费品牌编码(不同的名牌标码计算其对应的购买次数),借此得出会员消费时喜爱的品牌类别排行;其次,分析会员喜爱的品牌中商品的连带情况,由该品牌购买总数量和有效单据数确定商品的交叉连带率

3.2 摘要

数模优秀论文总结—2018“大型百货商场会员画像描绘”_第3张图片

3.3 小的注意点

1、对于部分指标的计算,可以自己根据文献或相关资料进行定义


你可能感兴趣的:(数学建模,数学建模)