业务数据分析工作心得

目录

  • 业务数据分析
    • 提升酒店订单量
    • 用户价值分析
  • 额外提升工作
    • smtp自动邮件
    • 分析过程自动化

业务数据分析

这篇博客用来记录自己在携程任职数据分析师期间涉及的一些业务数据分析知识,分别是碰到不同业务需求时自己的分析思路以及预期结果,业务决策等,希望以此方式来进行归纳总结,提升自己。

提升酒店订单量

  • 业务需求:挖掘与酒店订单量相关变量,探究不同业务场景酒店订单转化率,并制定相应业务决策。
  • 解决思路:获取用户订单数据,构建时间序列维度酒店订单量与订单其余指标的非线性模型,以此找出重要指标。基于此分析在不同营销场景下,指标的表现。

一般情况下,可以通过线性回归来找出特征重要性。但大多数情形具有高度多重共线性,且不服从线性关系,因此传统线性回归无法完成任务,需要借助非线性模型或时间序列模型的帮助。而在此之前,需要去除共线性。通常可以根据业务经验排除一些具有明显相关性的变量,再根据相关系数剔除一些变量。(此处也许可以考虑使用ridge regression或lasso regression) 这里有两个思路:

  1. 利用多元时间序列模型,如VAR,根据脉冲响应分析,方差分解,格兰杰因果检验可确定各变量之间的影响,此类方法解释性更强,前提需验证协整关系。
  2. 利用树类model,如xgboost,gbdt,random forest等可计算特征重要性(但可解释性较差)。这里需要利用交叉验证对各模型进行调参,通常参数接近真实值时,feature importance不会差距太大,若不确定可调试多组参数,计算所有参数下的importance组合来确定。由此可选出重要特征,再对此类特征进行业务场景拆分,观察各维度下指标表现。

由于业务目标是制定相应决策,因此应尽量关注能够调控的变量,而不是重要但无法控制的变量。数据分析也应以业务能够落地实施为基础。


以这次为例,模型发现会员卡的数量对于订单量的提升具有显著作用。但这只是从信息墒减少的角度来看,而不具有任何因果关系。因此后续有两个工作:验证结论与提出决策。验证结论即回到业务场景,通过拆解数据,来观察不同场景下指标表现情况;而提出决策即在结论正确的前提下,提出方法以促进业务转化。

在这里,即验证用户购买会员卡是否会提升未来酒店订单量。那么拆解业务场景即:购买会员卡的用户与未购买会员卡的复购转化率。同时为了更好地量化提升的收益,可以利用转化率与平均房价,计算各酒店的期望收益。若购买会员卡的后续转化率较高,期望收益大,那么说明会员卡具有提高收益与用户留存的功能,即有必要加大投资力度,对会员卡进行营销。因此业务决策即提高会员卡营销,监督各酒店会员卡营销情况,确保订单量增长。


整体逻辑:利用模型发现重要变量,再代回业务场景验证假设,自下而上。
缺点:自下而上的逻辑可能漏掉某些重要潜变量,无法体现在模型中,但是对于业务却十分重要。
改进可能:可尝试先进行EDA,拆解指标各维度(但工作量较大,且盲目);模型上可以考虑结构方程模型与层次分析法。
涉及工具:SQL取数,Excel拆解数据与画图,R or python建模

用户价值分析

在实际业务场景中,还将分析用户价值。用户价值通常能够对用户分层,从各个维度将用户分为几个不同类型。并且用户价值可作为用户会员积分体系的参考。(因为会员积分能够增加用户粘性,同时也是返利给用户的一种手段)

额外提升工作

数据分析除了要取数,清洗并得出结论,还需要对每一次分析作总结,将有价值的分析过程进行提炼。这一部分将会总结自己在干活时想到的一些提升工作,希望将来能够陆陆续续实现或完善。

smtp自动邮件

smtp大概是我用过最多的方法了。很多时候需要邮件来进行一些监控工作,而节省人力的方法即smtp。此前需要了解是否有smtp权限,利用smtp可实现一些自动收发邮件的工作。
具体实现可参考:Python实现自动写邮件

在上述会员卡案例中,通过分析发现会员卡数量对于提升订单量有重要作用,那么可以考虑监控各个酒店会员卡营销数量,或是给各个酒店自动发邮件进行提醒。通过smtp可有效降低人力成本,且操控空间较大。

以此为模板,可在日报,周报等基础上,进行更细粒度的监控,内容可根据具体分析需求修改。

分析过程自动化

对于一些固定的分析过程,每次需要做同样的数据清洗步骤,是否能写一段code进行自动化处理并生成对应图表?

  • 个人觉得意义不大,只需保留取数code即可,但在报表生成上可以优化,考虑使用Power BI或Tableau。

你可能感兴趣的:(数据分析)