数据化运营案例

文章目录

  • 一、目标客户的特征分析
  • 二、目标客户的预测模型(响应、分类)
  • 三、目标群体的活跃度定义
  • 四、用户路径分析
  • 五、交叉销售模型
  • 六、信息质量模型
  • 七、用户分层模型
  • 八、卖家(买家)交易模型
  • 九、信用风险模型
  • 十、商品推荐模型

一、目标客户的特征分析

二、目标客户的预测模型(响应、分类)

逻辑回归、决策树、神经网络、支持向量机等
响应模型的核心就是响应概率。根据建模数据中实际响应比例的大小进行分类,响应模型还可以细分为普通响应模型和稀有事件响应模型。一般来说,如果响应比例低于1%,则应当作为稀有事件响应模型来进行处理,其中的核心就是抽样,通过抽样技术人为放大分析数据样本里响应事件的比例,增加响应事件的浓度,从而在建模过程中更好地捕捉,拟合其中自变量与因变量的关系。

三、目标群体的活跃度定义

1.两个基本点
活跃度的组成指标应该是该业务场景中最核心的行为因素。
衡量活跃度的定义合适与否的重要判断依据是其能否有效回答业务需求的终极目标。
2.活跃度所涉及的统计技术主要有两个,一个是主成分分析,另一个是数据的标准化
主成分分析的目的就是把多个核心行为指标转化为一个或少数几个主成分,并最终转化成一个综合的分数,来作为活跃度的定义;标准化技术则是因为不同的指标有不同的度量尺度

四、用户路径分析

主要是分析用户在网页上流转的规律和特点,发现频繁访问的路径模式。用途包括提炼特定用户群体的主流路径、网页设计的优化和改版、用户可能浏览的下一个页面的预测、特定群体的浏览特征等

五、交叉销售模型

一旦客户成为付费用户,就要想方设法保留和延长这些客户在企业的生命周期和客户的利润贡献,一般有两个运营选择方向,一是延缓客户流失,在该场景下,通常就是用户流失预警模型发挥作用;二是让用户消费更多的商品,从而更大地挖掘用户利润,即找出更好地引导、满足、迎合客户需求。第二类场景中,涉及的主要应用模型就是交叉销售模型。
交叉销售模型通过对用户历史消费数据的分析挖掘,找出明显关联性质的商品组合,然后用不同的建模方法,去构建消费者购买这些关联商品组合的可能性模型,再用其中优秀的模型去预测新客户中购买特定商品组合的可能性。
常见的项目背景:
一是按照关联技术,发现那些有较大可能被一起采购的商品,将它们进行有针对性的促销和捆绑,这就是交叉销售
二是借鉴响应模型的思路,为某几种重要商品分别建立预测模型,对潜在消费者通过这些特定预测模型进行过滤,然后针对最有可能的前5%的消费者进行精确的营销推广
三是仍然借鉴预测响应模型的思路,让重要商品两两组合,找出那些最有可能消费的潜在客户
四是通过决策树清晰的树状规则,发现基于具体数据资源的具体规则。
相应的建模技术主要包括关联分析、序列分析,即在关联分析的基础上,增加先后顺序的考虑,以及预测模型技术,诸如逻辑回归、决策树等。

六、信息质量模型

应用场合主要包括商品Offer质量优化、网店质量优化、网上论坛的发帖质量优化、违禁信息的过滤优化等,凡是涉及信息质量监控和优化的场景都是适用信息质量模型的解决方案的。
涉及的主要还是常规的数据挖掘技术,比如回归算法、决策树等。目标变量具有一定的特殊性,一般为专家打分。

七、用户分层模型

分层模型是介于粗放运营与基于个体概率预测模型之间的一种折中和过渡模型,其兼顾了精细化的需要,又不需要投入太多资源投入到预测模型的搭建和维护中。
常用的技术包括统计分析技术(如相关性分析、主成分分析等),又可以含有预测(响应、分类)模型的技术。

八、卖家(买家)交易模型

为买卖双方服务,帮助卖家获得更多的买家反馈,促进卖家完成更多的交易、获得持续的商业利益,其中涉及主要的分析类型包括:自动匹配(预测)买家感兴趣的商品(即商品推荐模型)、交易漏斗模型(找出交易环节的流失漏斗,提升交易效率)、买家细分(帮助提供个性化的商品和服务)、优化交易路径涉及(提升买家消费体验)等。

九、信用风险模型

这里的信用风险包括欺诈预警、纠纷预警、高危用户判断等。

十、商品推荐模型

目前,常用的商品推荐模型主要分为规则模型、协同过滤和基于内容的推荐模型。不同的推荐模型有不同的推荐算法,对于规则模型,常用的算法有Apriori等;而协同过滤中则涉及K近邻算法、因子模型等。
1.关联规则-Apriori算法
电商中常用的一种数据挖掘方法就是从用户交易数据集中寻找商品之间的关联规则。关联规则中常用的一种算法是Apriori算法。主要包含两个步骤:首先找出数据集中所有的频繁项集,这些项集出现的频繁性要大于或等于最小支持度;然后根据频繁项集产生强关联规则,这些规则必须满足最小支持度和最小置信度
缺点:需要频繁扫描交易数据集,如果面临海量数据集,就难以满足实际应用需求;对于大型数据集,计算候选集算法的效率低。Mahout包的并行版本FP-growth算法可以优化这个问题
2.协同过滤算法
协同过滤算法主要分为基于启发式和基于模型式。其中,基于启发式的协同过滤算法,又可以分为基于用户的协同过滤算法和基于项目的协同过滤算法。主要包含3个步骤:收集用户偏好信息;寻找相似的商品或者用户;产生推荐。
a)基于用户的协同过滤
首先根据用户历史行为数据,寻找与新用户相似的其他用户;同时,根据这些相似用户对其他项的评价信息预测当前新用户可能喜欢的项。即,先计算用户之间的相似度,然后根据评分数据和相似矩阵计算推荐结果。
常用的相似度计算方法包括皮尔逊相关系数和余弦相似度等。
然后计算用户对未评分商品的预测分值,计算公式如下:
在这里插入图片描述r-bar为用户u的均分,s(u,u’)表示用户u和用户u’的相似度
b)基于项目的协同过滤
通过计算Item之间的相似度,从而预测用户评分。Item-Based协同过滤算法是通过用户评分数据和计算的Item相似度矩阵,从而对目标Item进行预测的。
Item之间的相似度计算同样可以采用皮尔逊相关系数和余弦相似度,还有种常用的方法是基于条件概率计算Item之间的相似度,公式如下:
在这里插入图片描述,s(i,j)表示项i和j之间的相似度;表示i和j共同出现的频率;
表示阻力因子,主要用于平衡控制流行和热门Item,比如电商中的热销商品等。
然后,根据上述计算的Item之间的相似度矩阵,结合用户的评分,预测未知评分,预测公式如下:在这里插入图片描述,其中p表示用户u对项i的预测评分;s(i,j)为项i,j之间的相似度,r为用户u对项j的评分。
c)基于内容的算法模型
根据商品标题、类目和属性等信息,计算商品之间的关系,然后结合用户行为特征,为用户提供商品推荐。

你可能感兴趣的:(数据挖掘)