单机模式处理大数据,搜集一些好用的开源利器

1. LibFM

项目主页:http://www.libfm.org/


2. Svdfeature

项目主页:http://apex.sjtu.edu.cn/apex_wiki/svdfeature


3. Libsvm和Liblinear

libsvm项目主页:http://www.csie.ntu.edu.tw/~cjlin/libsvm/

liblinear项目主页:http://www.csie.ntu.edu.tw/~cjlin/liblinear/

初次使用必读:practical guide

libsvm的开发心得by林智仁:http://www.csie.ntu.edu.tw/~cjlin/talks/kdd.pdf


4. rt-rank

项目主页:http://research.engineering.wustl.edu/~amohan/

rt-rank中实现了推荐系统中常见的random forests和gradient boosted decision trees这两种方法,使用起来很方便。


3. Mahout

项目主页:http://mahout.apache.org/


4. MyMediaLite

项目主页:http://www.ismll.uni-hildesheim.de/mymedialite/


4. GraphLab 和 GraphChi

GraphLab项目主页:http://graphlab.org/ 

GraphChi项目主页:http://graphlab.org/graphchi/

GraphChi的下载地址:https://code.google.com/p/graphchi/downloads/detail?name=graphchi_src_v0.1.2_toolkits.tar.gz

GraphChi介绍:http://www.technologyreview.com/news/428497/your-laptop-can-now-analyze-big-data/?nlid=nldly&nld=2012-07-17

CF for GraphChi: http://bickson.blogspot.com/2012/08/collaborative-filtering-with-graphchi.html

你可能感兴趣的:(机器学习)