想提高机器学习技能?何不看看 GitHub 上最流行的开源机器学习项目呢?本文介绍了 GitHub 上最流行的 5 个开源机器学习项目。
机器学习是当前最热的技能。今年早些时候,Stack Overflow 发布了一项涉及大量开发者的调查结果,机器学习专家的收入仅次于 DevOps 专家。
机器学习正处于鼎盛时期,但对新手来说,开源通常有点让人疑惑。因此,今天,我们就来了解一下 GitHub 上最顶尖的五个开源项目,看看该领域的发展情况以及你能够帮助做些什么。毕竟,开源项目的成功取决于全世界开发者和程序员的协作!
说明:该列表指特定项目,而非库或框架的集合。因此,几个排序结果是比较随意的,全凭个人爱好。
让我们开始吧!
1. TensorFlow – ★ 76.2K
TensorFlow 排在首位丝毫不会让人惊讶。它是目前 GitHub 上最流行和杰出的机器学习项目。
TensorFlow 最初是谷歌机器智能研究组织中的谷歌大脑团队的一部分,它是一个开源的软件库,可使用数据流图进行数值计算。它具备易用的 Python 接口和简单直接的其他语言接口,来构建和执行计算图。
「我们开源 TensorFlow 是希望为世界上每个人构建一个机器学习平台。」Jeff Dean 今年早些时候说道。TensorFlow 1.0 快速、灵活,且在初始的设计中TensorFlow就是面向产品应用部署的。它还包括适合 Java 和 Go 的实验性 API、用于目标检测和定位的新型安卓 demo,以及基于相机的图像风格化。
近日,谷歌发布了 TensorFlow 1.4.0 版本。GitHub 地址:https://github.com/tensorflow/tensorflow/releases/tag/v1.4.0。
2. scikit-learn –★ 22.7K
第二个是 scikit-learn,机器学习 Python 模块。scikit 包括大量简单高效的数据挖掘和数据分析工具。scikit 的基本动机是「为了科学」(For Science)!它对不同的环境(context)都有高度的可使用性和可复用性。此外,它内建了著名的数据科学工具,如 NumPy、SciPy 和 matplotlib。
今年早些时候,我们和 Groupon 公司软件工程主管 Adam Geitgey 进行了交谈,话题关于开发者如何涉足机器学习领域。
Geitgey 说:「肯定要先学 Python。Python 是目前最流行的机器学习编程语言,适合解决大部分机器学习问题(不包含深度学习)。你只需要安装几个 Python 库:scikit-learn、NumPy 和 pandas。这些工具都是免费的,且可以很好地协同运行。」
3. PredictionIO –★ 10.6K
PredictionIO 是这个列表中的新来者,这就使得其高排名更加令人印象深刻。上个月,阿帕奇软件基金会发布了 PredictionIO。PredictionIO 建立在一个当前最佳的开源堆栈上。这个机器学习服务器的设计目的是让开发者和数据科学家可以在任何机器学习任务中创建有预测能力的引擎。
开发者可以通过全栈和可用模板创建可部署的应用,而不需要将各种底层技术拼凑起来。
PredictionIO 是直接建立在 Spark 和 Hadoop 上的,因此它允许开发者使用自定义模板快速建立和部署一个引擎作为生产就绪网页服务。它是用 Scala 编写的。
PredictionIO 专注于简化数据基础架构管理。你可以无缝地将你实现的机器学习模型纳入自己的引擎。PredictionIO 还能通过系统式处理和预制评估方法对机器学习建模进行加速。
4. SWIFT AI – ★5K
Swift AI 在 GitHub 长期备受好评。Swift AI 是一个完全用 Swift 编写的高性能深度学习库,支持所有苹果平台。这对 MacBook 用户来说是个好消息!
无可否认,Swift 的 repo 有点少,特别是跟 TensorFlow 相比。然而,Swift AI 确实为喜欢使用 Swift 编写神经网络的用户提供了引以为豪的工具。其中,NeuralNet 类包含一个全连接前馈神经网络。NeuralNet 支持深度学习,具备灵活性,并可用于性能关键应用程序。
5. GoLearn – ★4.7K
进入前 5 名的还有 GoLearn,这是一个 Go 语言的相当齐全的机器学习库。这个项目仍然处于活跃的开发状态,正在寻求对用户反馈感兴趣的开发者。如果你用过 SciPy、WEPA 或 R,GoLearn 的机器学习模型对你来说不会陌生。它的数据使用平面表表示(和电子表格类似),用于训练和预测。在开始一个新项目的时候,想要的工具总是比实际拥有的多得多。如果你希望拥有一个更好的项目,GoLearn 是一个不错的选择。
结论
不管你想要加入知名项目或还只是个新手,GitHub 上总有一个适合你的开源机器学习项目。这不仅能够丰富你的简历,对整个社区来说也是好事。所以,赶快行动吧!
原文链接:https://jaxenter.com/open-source-machine-learning-projects-138744.html