关联规则、支持度(support)、置信度(confidence)

关联规则

关联规则:用于表示数据内隐含的关联性

  • Support(支持度):表示同时包含A和B的事务占所有事务的比例。如果用P(A)表示使用A事务的比例,那么Support=P(A&B)
  • Confidence(可信度):表示使用包含A的事务中同时包含B事务的比例,即同时包含A和B的事务占包含A事务的比例。公式表达:Confidence=P(A&B)/P(A)
  • Lift(提升度):表示“包含A的事务中同时包含B事务的比例”与“包含B事务的比例”的比值。公式表达:Lift=( P(A&B)/P(A))/P(B)=P(A&B)/P(A)/P(B)。
    提升度反映了关联规则中的A与B的相关性,提升度>1且越高表明正相关性越高,提升度<1且越低表明负相关性越高,提升度=1表明没有相关性。

参考链接:https://www.jianshu.com/p/dc053deb94f2

关联分析

定义
关联规则、支持度(support)、置信度(confidence)_第1张图片
关联分析研究的关系
关联规则、支持度(support)、置信度(confidence)_第2张图片
基本概念
关联规则、支持度(support)、置信度(confidence)_第3张图片

支持度(support)

支持度:{X, Y}同时出现的概率
在这里插入图片描述
支持度没有先后顺序之分

置信度(confidence)

置信度:购买X的人,同时购买Y的概率
关联规则、支持度(support)、置信度(confidence)_第4张图片

其他内容:

1、数据分析之T检验

2、数据分析之参数检验与非参数检验

3、数据分析之正态性检验

4、Jupyter 中的表格样式 高亮设置

更多内容请移步:https://blog.csdn.net/dd18203614685

你可能感兴趣的:(数据分析,python,python)