值得关注的 5 个开源机器学习项目

4. Mahout

垃圾邮件过滤、人脸识别、推荐引擎——当你有一个大数据集并且希望利用它们执行预测分析和模式识别,机器学习是必经之路。这门科学,计算机可以在没有事先规划的前提下自主学习、分析和操作数据,现在越来越多的开发人员关注机器学习。

Project: scikit-learn

库,Shogun 可以轻松在 Java、Python、C#、Ruby、R、Lua、Octave、Matlab 语言和环境下使用。

5. MLlib

Hadoop 集群,MLlib 可以在没有 Hadoop 的情况下部署在 Spark 上——以及在 EC2 或 Mesos 上。

GitHub: https://github.com/accord-net/framework/

包上构建—— NumPy SciPy 和 matplotlib ——服务于数学和自然科学。生成的库要么可以使用交互式 " 工作台 "

跟踪等功能。Accord 还提供一个从神经网络到决策树系统的机器学习常见库。

GitHub: https://github.com/shogun-toolbox/shogun

机器学习技术的兴起不仅是因为硬件成本越来越便宜以及性能越来越强大,促使机器学习在单机或大规模集群上轻松部署的免费软件激增也是重要因素。机器学习库的多样性意味着无论你喜欢什么语言或环境,都有可能是获得你喜欢的。

Apache 自己的 Spark 和 Hadoop 机器学习库,旨在为大规模和高速度而设计的 MLlib

Mahout 缺点之一:目前几乎没有算法支持高性能的 Spark 框架,反而使用日益过时的 MapReduce 框架。该项目目前不接受基于 MapReduce 的算法,那些想要获得更高性能的开发者转而用 MLlib 替代。

1. Scikit-learn

2. Shogun

Python 由于其易用性以及丰富的函数库,已经成为数学、自然科学和统计学的首选编程语言。Scikit-learn 通过在现有 Python

应用程序,要么被嵌入到其他软件和重用。工具箱可以在 BSD 许可下获取,所以它是完全开放和可重用的。

GitHub: https://github.com/scikit-learn/scikit-learn

随着机器学习越来越受到开发者关注,出现了很多机器学习的开源项目,在本文列举的 11 个机器学习开源项目中,无论你是 Java 爱好者还是 Python 狂人,在这里你都可以找到自己想要的机器学习开源项目。

Mahout 框架一直与 Hadoop 相关联,但旗下很多算法还可以脱离 Hadoop 运行。他们对那些可能最终迁移到 Hadoop 上的应用程序或从 Hadoop 上剥离成为独立应用程序的项目非常有用。

在最古老、最值得尊敬的机器学习库中,Shogun 创建于 1999 年,用 C++ 编写,但并不限于在 C++ 工作。由于 SWIG

3. Accord Framework/AForge.net

MLlib NumPy 库连接(也用于 scikit-learn),并且 Scala 用户可以针对 MLlib 编写代码。如果不能设置一个

自称拥有所有常见的算法和有用数据类型。与任何 Hadoop 项目一样,Java 是 MLlib 上的基本语言,但是 Python 用户可以用

Project: Accord Framework/AForge.net

Project: Shogun

Accord,一个 .Net 的机器学习和信号处理框架,是早前类似一个项目 AForge.net 的扩展。顺便说一下," 信号处理 "

Project: Mahout

虽然德高望重,Shogun 也有其他的竞争者。另一个基于 C++ 的机器学习库 Mlpack 在 2011 年出现,它宣称比其他竞争者速度更快并且更容易使用(一个更完整的 API 集)。

这里是指一系列对图像和音频的机器学习算法,如图片无缝缝合或执行人脸检测。包含一组视觉处理算法;它作用于图像流(如视频),并且可用于实现移动对象的

 

你可能感兴趣的:(值得关注的 5 个开源机器学习项目)