FP-growth

文章目录

  • Fp-growth不用生成候选集
  • 用交易数据库建立FP-tree
  • FP-tree结构的好处
  • 用FP-tree挖掘频繁集
  • 挖掘FP-tree 的主要步骤
          • 1. 从FP-tree到条件模式库
          • 2. 建立条件FP-tree
          • 3. 递归挖掘条件FP-tree
  • 频繁增长的原理
  • 为什么频繁增长速度快
  • 经典的FP-growth类算法
  • 性能瓶颈
  • 源码地址

Fp-growth不用生成候选集

FP-growth_第1张图片

用交易数据库建立FP-tree

FP-growth_第2张图片

FP-tree结构的好处

FP-growth_第3张图片

用FP-tree挖掘频繁集

FP-growth_第4张图片

挖掘FP-tree 的主要步骤

FP-growth_第5张图片

1. 从FP-tree到条件模式库

FP-growth_第6张图片

  • FP-tree支持条件模式库构造的属性
    FP-growth_第7张图片
2. 建立条件FP-tree

FP-growth_第8张图片

  • 通过建立条件模式库得到频繁集
    FP-growth_第9张图片
3. 递归挖掘条件FP-tree

FP-growth_第10张图片* 单FP-tree路径生成
FP-growth_第11张图片* 特例:FP-tree中的唯一前缀
FP-growth_第12张图片

频繁增长的原理

FP-growth_第13张图片

为什么频繁增长速度快

FP-growth_第14张图片

经典的FP-growth类算法

FP-growth_第15张图片

性能瓶颈

FP-growth_第16张图片

源码地址

FP-growth+Python

你可能感兴趣的:(数据挖掘)