Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票

一、练习目标
1、掌握TransactionEncoder编码方法,
2、掌握关联规则的模型构建,加深理解关键指标(支持度、置信度、提升度等)。

二、关键结论
1、支持度设置为0.3,比设置为0.5,所得频繁项集大大增加.
2、当置信度统一设置为0.99时,前者所得的强关联规则集共为260条,后者仅有2条。
3、如果支持度设置过高,那么将省略了许多可能有意义的强关联规则集。
4、本次练习设置不同置信度,lift都是大于1,说明挖掘所得的关联规则都是强关联规则。

三、指标的统计公式
置信度confidence:confidence(x—>y)=support (xy)/ support x
提升度lift: confidence(x—>y)/ support y
规则杠杆率leverage:support (xy)- support x * support y
规则确信度conviction:(1-support y)/(1-confidence(x—>y))

四、练习步骤

Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第1张图片

Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第2张图片
Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第3张图片
Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第4张图片
Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第5张图片
Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第6张图片
Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第7张图片
Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第8张图片
Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第9张图片
Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第10张图片
Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第11张图片
Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第12张图片
Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第13张图片
Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第14张图片
Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第15张图片
Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第16张图片
Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第17张图片
Python算法练习(十三)// 算法:关联规则,数据集:美国国会投票_第18张图片

你可能感兴趣的:(Python)