[人工智能学习日志]kaggle机器学习实战案例学习1

来自bilibili课程膜拜!大佬爆肝750小时把kaggle上【12大机器学习实战项目】用视频的方式讲明白了!-人工智能、机器学习、深度学习、AI

第一课

关联规则

1.一个样本是一个“事物”;
2.属性是“像”;
3.多个项是“项集”

支持度

1.一个项集或规则在所有事务中出现的概率

置信度

1.已经有了X,也有Y的可能性;即确定Y在包含X的事务中出现的频繁程度

提升度

1.物品集A的出现对物品集B的出现概率发生了多大变化
2.lift(A==>B)=confidence(A==>B)/support(B)=p(B|A)/p(B)
3.>1值越大,提升度越强

python实现关联规则

1.使用mlxtend工具包:pip install mlxtend
2.

from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules

apriori可以用来计算支持度,association_rules可以做评估

数据集制作

1.get_dummies函数可以方便做特征的编码
2.可以先用apriori看support支持度,然后用association_rules看lift提升度,看哪种选择更相关一些

你可能感兴趣的:(深度学习AI,人工智能,机器学习,数据挖掘)