数据建模实战:方寸之间玩转购物篮分析

购物篮分析是零售行业里非常重要经典的一个模型,曾经被大家津津乐道的啤酒与尿布的故事,相信大家都还记忆犹新,这个故事很好地诠释了商品关联性对销售额的提升作用,时至今日,仍有很强的现实指导意义。这种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,就叫做商品关联分析法,也叫作“购物篮分析”。购物篮分析的实现方法有很多,下面教一下大家如何去制作一个完整的购物篮分析模型。

一、前言:

在开始制作购物篮分析模型之前,我们先来理解一下购物篮分析模型的价值在哪里。购物篮分析的本质是研究商品与商品间的关联关系,比如分析A商品和哪个商品搭配会卖的更好,或者分析客户在购买了A商品之后,对B商品会产生什么影响等等。通过这种交叉分析,我们便可以对客户感兴趣的商品组合去做出相应的调整,或者据此去深入研究更高层次的推荐算法。

做购物篮分析还得先理解三个概念,支持度、置信度与提升度。支持度指A商品和B商品同时被购买的概率,用公式表示就是支持度=同时购买A和B订单数/总购买订单数;置信度是指购买A之后又购买B的条件概率,用公式表示就是置信度=同时购买A和B订单数/购买A的订单数;提升度指的是先购买A对购买B的提升作用,用公式表示就是提升度=支持度/((购买A次数/总购买订单数)*(购买B次数/总购买订单数))。看不懂的小伙伴可以看下图的举例说明,加深理解:

二、购物篮分析步骤:

首先要准备一份零售行业的数据源,需包含单据编码、商品名称等信息,文中提供的案例数据源大家可以在根据文末提供的信息进行获取。如果用Excel做购物篮分析,难度会很大,建议用其他工具进行制作,本文选择用SQL语句的方式去制作:

第一步,新建一个临时表,对商品名称进行交叉关联,为每一组交叉商品增加一列总订单数的字段,并把该临时表命名为t1:

执行语句后,可得出以下4个字段:

第二步,新建一个临时表t2,对商品名称进行交叉关联,算出同时购买A商品与B商品的订单数:

执行语句后,可得出以下3个字段:

第三步,把t1与t2两个临时表的字段进行关联:

执行语句后,可得出以下4个字段:

第四步,新建一个临时表t4,算出A商品的订单数:

执行语句后,可得出以下2个字段:

第五步,新建一个临时表t5,算出B商品的订单数:

执行语句后,可得出以下2个字段:

最后一步,根据支持度、置信度与提升度的公式,以及我们得出的这5个临时表的数据,我们就可以开始进行运算了。根据t3表里‘’同时购买A和B订单数‘’与‘’总订单数‘’这两个字段,我们可以算出支持度的数据。根据t3表里‘’同时购买A和B订单数‘’与t4表里‘’A商品订单数‘’这两个字段,我们可以算出置信度的数据。同理,利用‘’同时购买A和B订单数‘’、‘’购买A订单数‘’、‘’购买B订单数‘’与‘’总订单数‘’这几个字段,我们最后就可以得出提升度的数据了。

最后得出的结果如下:

三、后续建议:

从上面的制作过程来看,如果要制作一个完整的购物篮分析模型,过程还是挺复杂的。为了对数据建模以及多维分析有更深的认识,小编推荐大家利用智分析的数据模型去制作购物篮分析,智分析的数据模型具有非常强大的多维分析能力,不仅支持自助取数,还支持SQL、MDX等高阶的查询语法。智分析的数据源接口同样也很丰富,可以连接各种数据库,也可以以Excel文件导入的方式进行导入:

进入数据模型的界面后,便可以开始搭建购物篮分析的数据模型了,这里依然是选择用SQL查询的方法去做购物篮分析,新建一个SQL查询,输入语句,执行后便可以得出购物篮分析模型的数据:

数据模型搭建之后,可以借助智分析自助仪表盘对购物篮分析的数据进行可视化呈现,仪表盘可以进行下钻、筛选、轮播等高级的操作,非常适合展示购物篮分析、RFM分析、ABC分析等数据模型:

PS:关于文中提到的数据源以及模型资料,大家可以点关注之后私信我进行获取


你可能感兴趣的:(数据建模实战:方寸之间玩转购物篮分析)