监督学习——关联规则

介绍
第一部分 参数方法——类密度模型参数估计
第二部分 监督学习——分类(基于似然的方法)
第三部分 监督学习——分类(基于判别式的方法)(参数方法——判别式参数估计)
第四部分 监督学习——回归
第五部分 监督学习——关联规则
第六部分 维度规约(特征的提取和组合)
第七部分 半参数方法
第八部分 非监督学习——聚类
第九部分 非参数方法——密度估计
第十部分 非参数方法——决策树实现的判别式
第十一部分 多层感知器——非参数估计器
第十二部分 局部模型
第十三部分 支持向量机与核机器
第十四部分 隐马尔科夫模型
第十五部分 参数的贝叶斯估计
第十六部分 集成学习——组合多学习器
第十七部分 增强学习
第十八部分 机器学习实验
第十九部分 特征工程与数据预处理

关联规则是的蕴含式。通过数据,希望发的现X与Y之间的依赖性。

在学习关联规则时,通常需要计算3个度量:

的支持度(support)

的置信度(confidence)

的增益   

支持度说明统计显著性,大的支持度也就一直为大数据量,是频繁的情况。

置信度说明规则的强度。为了能说明规则具有足够的置信度,其值应该接近1,并显著大于,此失增益就显著大于1。我们往往对最大化置信度感兴趣。

增益就是置信度与的比例。如果X与Y独立,则增益接近1。如果增益大于1,可以说明X使Y更易出现。相反如果小于1,说明X使Y更不易出现。

找出具有高于给定支持度和置信度的 所有规则,有Apriori算法,及一些改进算法。相关算法细节的介绍比较常见,这里不再多做总结。

你可能感兴趣的:(监督学习——关联规则)