libSVM 与 mahout 初比较

参考资料:http://www.csie.ntu.edu.tw/~cjlin/libsvm/index.html

关于libSVM的使用可以见上面的链接

libSVM就如同自己介绍的一样easy--use,而且支持的平台比较广泛,支持的语言也很多

mahout的许多算法是建立在hadoop支持的基础上的分布式计算理念的实现,虽然同是机器学习,但是二者支持的范围不太一样。

如果数据量很大,首选的当然是mahout,因为如果使用libSVM的话就会自己下功夫去处理分布式计算结果的聚合问题。

如果数据量比较小,模型简单,libSVM是和很好的选择,mahout有点简单的文档会在你想进一步设计自己的模型时有自杀的冲动【需要研读代码才知道怎么做,做什么】。

  mahout libSVM
需分析的数据量
支持系统 Linux windows、linux
支持语言 java 很多
建模难度 高,需要对建模使用的算法有很好的掌握 较易
计算模式 分布式+单机 单机

你可能感兴趣的:(数据挖掘,Mahout,libsvm)