Solving Customer Churn with Machine Learning

利用机器学习解决客户流失问题

Summary

Paypal在203年提供全球支付平台市场。 该公司拥有1.73亿活跃客户帐户导致40亿付款是Paypal的服务费, 这些2014年处理作为通过其平台支付的百分比,也就是说,它拥有的客户越活跃,公司收入也就越多。 因此,客户流失是一个Paypal和公司的关键业务指标,paypal努力通过各种方式减少客户流失,包括一些营销和产品开发计划。借助H2O强大的预测建模和机器习,Paypal已经能够解决流失问题,所以公司可以比以往更快,更有效率激活或重新激活消费者 。

Challenge

对于Paypal,消费者流失可能会产生重大影响。以前,该公司看了一下特定时间增量的问题。 Paypal会运行报告,这显示了所有客户的流失日期作为报告运行的日期。虽然这些信息很有用,但并不完全准确,并且因此,Paypal对赢回客户的营销努力是不太理想。实际上,客户的流失日期需要更加接近当他们最后与Paypal平台进行交互时用机器学习,Paypal的数据科学家可以预测一下客户将留在平台或该客户会流失,何时流失。另外,因为不同的客户群可能对平台功能有不同的反应。

解决方案

Paypal需要重新定义公司的指标与流失有关,所以执行团队可以运行关键绩效指标和更好地了解的长期健康商业。 此外,还包括运营团队营销和产品团队,需要更准确,可操作的信息,以帮助他们运行系列广告保留或重新激活客户。每个内部利益相关者都需要快速获取信息,Paypal的资深数据科学家Julian Bharadwaj和他的团队开始开发一个预测模型,以显示何时客户会流失或不流失。 在这个过程中,团队直接使用随机森林和GBM用H2O,通过过R.“整合是我们的主要特征之一寻找,“巴拉德瓦伊说。 “就在数据科学中世界,Python是一个伟大的球员,R是一个伟大的球员。该事实上,H2O几乎与它们都融为一体无缝地是我们的决定因素之一采用H2O,“他继续道。随着模型的开发,Bharadwaj看起来在交易和行为变量以及客户的人口统计数据。前两个被证明是流失的关键指标;后者不是很有用,所以团队放弃了它。使用H2O可以快速而且相对容易地做到这一点:可以跨多个参数修改模型并且很快跑了好几次,所以Bharadwaj可以确保输出的有效性。“就像H2O多处理和多线程一样,你得到的结果真的很棒,“Bharadwaj说。 “使用H2O以外的任何东西意味着我们无法在数据集上运行多个模型并在我们需要的时间实际提供输出,“他说。 “但是对于H2O,我可以随意运行森林不同调整的超参数和几个不同的关于整个人口的GBM,以获得一个赢得最好的的模型。“现在投入生产,Paypal在Hadoop上使用H2O来运行预测建模工厂 - 大规模,快速建模- 这有助于Paypal运行更加复杂和有效减少客户流失的营销计划

image.png

总结

第一步,定义与流失相关的所有指标,关于客户流失比较关键的指标是交易信息,行为信息。和用户的基本信息关系不大。其次,对于我个人而言,了解大数据的解决方案。这里给自己定一个目标,一个月,了解关于大数据机器学习的解决方案。

你可能感兴趣的:(Solving Customer Churn with Machine Learning)