关联规则--Apriori算法

一、算法原理:

应用: 关联规则挖掘,发现事物之间的内在联系
超市每天都收集大量的顾客购物数据, 称其为购物篮交易(market basket
transaction)。 表中每一行对应一个交易,包含一个唯一标识TID和特定顾客购买的商品集合。
关联规则--Apriori算法_第1张图片
①支持度: P(A ∩ B), 既有A又有B的概率
②置信度:
P(B|A), 在A发生的事件中同时发生B的概率 p(AB)/P(A)
例如购物篮分析: 牛奶 ⇒ 面包
例子: [支持度: 3%, 置信度: 40%]
支持度3%: 意味着3%顾客同时购买牛奶和面包
置信度40%: 意味着购买牛奶的顾客40%也购买面包
③如果事件A中包含k个元素,那么称这个事件A为k项集事件A满足最小支持度阈值的事件称为频繁k项集。
④同时满足最小支持度阈值和最小置信度阈值的规则称为强规则.
支持度:
support(X–>Y) = |X交Y|/N=集合X与集合Y中的项在一条记录中同时出现的次数/数据记录的个数。support({啤酒}–>{尿布}) = 啤酒和尿布同时出现的次数/数据记录数 =3/5=60%。
置信度:

你可能感兴趣的:(算法,apriori)