两种找频繁项集的方法

两种找频繁项集的方法

Apariori算法:主要通过限制候选产生发现频繁项集
使用的是频繁项集的先验原理
是一种称为逐层搜索的迭代方法,其中k项集用于搜索(k+1)项集
使用步骤:
1、扫描数据库,累计每个项的计数,并收集满足最小支持度的项,找到频繁1项集 L1
2、使用L1&L2产生候选2项集C2
3,C2计数、
4、剪枝(根据最小支持度)

FP树表示法
自底向上方式探索树
逐个读入事务,并把每个事务映射到FP树中一条路径来构造,路径重叠时,重叠越多,使用FP树结构获得的压缩效果就越好,
步骤:
1.根据最小支持度找底节点的频繁项集
2.通过频繁项集结点处理与之相关的结点
3,逐层查找,小于最小支持度的排除

你可能感兴趣的:(机器学习)