fp growth 实现

近日,准备使用fp growth写个程序,挖掘频繁模式。但是从han jia wei哪里下载的c语言程序效率非常低。根本不能满足大数据量的要求。

仔细分析源代码发现,fp growth需要生成很多棵树,每个结点路径都需要保存,还是非常消耗资源的。

考虑之后,使用hadoop编写了一个简单的fp growth,总是耗尽java的内存。最后,限制了结点的数量,得到一个计算结果。

你可能感兴趣的:(java,c,hadoop,语言,FP)