【机器学习】四、关联规则原理及实例

一、关联规则简介
关联规则(Apriori算法),又称为关联分析。其目的是找出,一堆事物中具有关联的事物。
关联规则最经典的案例就是“啤酒与尿布”,沃尔玛拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些。沃尔玛数据仓库里集中了其各门店的详细原始交易数据。在这些原始交易数据的基础上,沃尔玛利用数据挖掘方法对这些数据进行分析和挖掘。码字不易,喜欢请点赞!!!
【机器学习】四、关联规则原理及实例_第1张图片
一个意外的发现是:"跟尿布一起购买最多的商品竟是啤酒!经过大量实际调查和分析,揭示了一个隐藏在"尿布与啤酒"背后的美国人的一种行为模式:在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%~40%的人同时也为自己买一些啤酒。产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。

二、关联规则
关联规则最重要的就是支持度Support和置信度Confidence。

  1. 支持度的计算方法:
#下面式中XY表示XY同时发生的次数,N表示总事物数
support(X->Y) = XY/N
  1. 置信度的计算方法:
confidence(X->Y) = support(X->Y) / support(X)
<=>
#XY表示XY同时发生的次数,X表示X发生的次数
confidence(X->Y) = XY/X

最终找到的规则,要满足支持度和置信度即可。

三、关联规则使用
关联规则的使用可以看我下面这篇博客,是一个公司机器学习岗位的笔试题。
https://blog.csdn.net/Asher117/article/details/87745195

你可能感兴趣的:(机器学习)