分布式数据挖掘平台

Mahout把我在学校学的人工智能算法全部过滤了一遍,算是为java社区做了贡献。但是我要真正做一些数据挖掘的时候,像WEKA,它够吗?

这是我的第一个担心。毫无疑问这些东西可以完成基本的数据挖掘工作。但是我的项目捆在上面会不会收约束?

另一个问题是分布式。相对上一个问题我倒是认为这个不是大问题。算法是死的人是活的,磨刀不误砍柴功花点精力琢磨一下总有办法让他“分布式”运行。

开源的特色是少而精。说中科院搞了个pdminer,这么强但是人家只给中国移动用。我等平民百姓想看看都不行,说明精英都不傻? 还是精英都“太傻,”?

无论如何,反正分布式不会让你没活干。

你可能感兴趣的:(分布式数据挖掘平台)