Python的机器学习库汇总与梳理

http://blog.chinaunix.net/uid-22414998-id-4143709.html

由于最近手头项目需要,我查阅了Python相关的机器学习库。我将不断地更新本贴,从而详细说明各个库的优劣。

一、前提

在Pthon下做机器学习,需要科学计算包和绘图库的支持,科学计算则是NumPy或SciPy,似乎NumPy更流行些。画图工具包则必定为matplotlib。这些都是开源、免费使用的,选择这些库主要的原因是做线性代数中的矩阵计算极为便利,而且效率比自己开发高的多。

二、机器学习库

(1)scikit-learn

[http://scikit-learn.org/]

Python下做机器学习,首推scikit-learn。该项目文档齐全、讲解清晰,功能齐备,使用方便,而且社区活跃。

Python的机器学习库汇总与梳理_第1张图片

(2)Orange

[http://orange.biolab.si/]

机器学习是其的功能之一,主要还是侧重数据挖掘,可以用可视化语言或Python进行操作,拥有机器学习组件,还具有生物信息学以及文本挖掘的插件。

Python的机器学习库汇总与梳理_第2张图片

(3)shogun

[http://shogun-toolbox.org/]

shogun,非日本的老外弄的一个机器学习库,还专门配了一个我们能看懂的日文名“将军”(是日本幕府时代的将军)。文档齐全,开发活跃,更新快,运算速度也很快。主攻大尺度的核函数,尤其是大尺度核函数下的SVM。具有很多SVM的高级用法,比如多核配用等。支持Python、R、C++、Matlab等语言。

Python的机器学习库汇总与梳理_第3张图片

(4)其它

A.pyml(a python module for machine learning,支持svm/knn/k-means==)

http://mlpy.sourceforge.net/

B.milk(python的机器学习工具包,主要是针对监督学习,包括svm/knn/决策树)

http://pypi.python.org/pypi/milk/

本文参考了oschina.net及http://www.cnblogs.com/wuren/archive/2013/03/27/2985352.html

你可能感兴趣的:(Python的机器学习库汇总与梳理)