FP-growth


步骤如下:

1. 去掉不满足最小支持度的元素项

2. 对事务记录过滤和排序,构建FP树

排序基于元素项的绝对出现频率来进行;

构建FP树的过程:

从空集开始,向其中不断加频繁项集。过滤、排序后的事务依次添加到树中,如果树中已存在现有元素,

则增加现有元素的值;如果现有元素不存在,则向树添加一个分枝。

3. 抽取条件模式基

首先从保存在头指针表中的单个频繁元素项开始,对于每一个元素项,获得其对应的条件模式基

条件模式基是以所查找元素项为结尾的路径集合。每一条路径其实都是一条前缀路径。简而言之,一条前缀

路径是介于所查找元素项与树根节点之间的所有内容。

4. 创建FP条件树

对于每一个频繁项,都要创建一棵条件FP树。有些元素项单独看来它们都是频繁项,但是在条件树中,它们却不是频繁的。

你可能感兴趣的:(机器学习,机器学习)