关联规则算法1------关联规则Apriori原理和R实现

1 关联规则产生

关联规则反应的是一个事物与其他事物之间的关联关系,被称为购物篮模型,最初产生为啤酒喝尿布的故事。电商网站多用于商品推荐、联合发券、品类联合促销等方面。

2 关联规则指标

1)支持度为事物在数据集中发生的概率,支持度的意义在于度量项集在整个事务集中出现的频次,我们希望关注频次高的项集。

Support(A)=A/U

2)置信度,在A发生的条件下B发生的概率

Confidence(A-->B)=P(AB)/P(A)

3)提升度

Lift(A→B) = P(B|A) / P(B)=P(AB)/P(A)P(B)、

4)频繁项集:经常一起出现的项集

3  关联规则 ----Apriori算法原理

假设交易记录

item1 A B C D
item2 B C D  
item3 C D    
item4 B F G H
item5 A C D  

3.1 生成关联规则

关联规则算法1------关联规则Apriori原理和R实现_第1张图片

4关联规则R语言实现

4.1读数据变换成交易记录集

#format有两种格式single原始记录和basket购物篮记录
rp<-read.transactions('D:\\R\\Apriori_id_50.csv',
                      format = 'single',
                      sep=',',
                      cols=c(1,2))

4.2 生成关联规则

#关联模型
asso_rules <- apriori(rp, parameter = list(supp = 0.001,  #支持度
                                      conf = 0.5,   #置信度
                                      minlen = 2  #规则长度最小数
))

4.3规则结果展示

关联规则算法1------关联规则Apriori原理和R实现_第2张图片

4.4查看和保存规则

查看规则:inspect(asso_rules)

保存规则:write.csv(asso_rules,file='D:\\R\\asso_rules.csv')

你可能感兴趣的:(关联规则)