【人工智能】2018年最佳 机器学习/深度学习 开源软件奖获奖者


亚马逊、谷歌、微软、facebook——这些公司和其他许多公司都在争相创建最丰富、最容易的机器学习和深度学习库。竞争是好的!我们在机器学习领域的2018年“Bossie”获奖者包括最先进的框架、用于构建和培训模型的其他前沿工具,以及在集群中传播深度学习的平台。

目录

TensorFlow

Keras

PyTorch

fast.ai

Chainer

H20

Microsoft Cognitive Toolkit

MXNet

Featuretools

Horovod

Fabric Deep Learning(FfDL)


TensorFlow

【人工智能】2018年最佳 机器学习/深度学习 开源软件奖获奖者_第1张图片

TensorFlow自从我在2018年1月回顾了被广泛采用的深层神经网络框架以来,TensorFlow又收到了5个版本的升级,甚至更容易、更强大。主要的新特性和改进包括与Google Cloud Bigtable集成作为数据源,这是一个更好的tf.keras模块,更好的生成用于移动设备的优化模型,改进数据加载和文本处理,预取GPU内存的新数据,以及通过Google Cloud TPUs改进性能,并将eager执行模式提升到完全支持状态。您可能还记得,eager执行提供了一种命令式编程风格,它比构建和执行图形更容易理解。——马丁海勒

 

Keras

【人工智能】2018年最佳 机器学习/深度学习 开源软件奖获奖者_第2张图片

Keras就像一个深度神经网络框架一样简单,一层一行的Python代码,调用每个模块来编译和训练一个模型,使用顺序模型。Keras还通过它的功能API提供了任意拓扑的支持。Keras使用TensorFlow、Theano、和CNTK 2作为后端,并获得它们对GPU的良好支持(以及Google Cloud上的TPUs)。Keras的培训使用Numpy数组作为输入,尽管它可以通过Python生成器接口支持其他格式。Keras有各种各样的部署选项,从云服务到移动设备。——马丁海勒

 

PyTorch

【人工智能】2018年最佳 机器学习/深度学习 开源软件奖获奖者_第3张图片

PyTorch是一个高级的深层神经网络,它使用Python作为脚本语言,并使用了一个演化的Torch C/CUDA后端。Caffe2的生产特性也被纳入到PyTorch项目。PyTorch的特点是动态神经网络,这意味着网络拓扑本身可以在训练过程中从迭代到迭代训练。
为了支持动态网络,这两种网络比静态网络更容易调试和更快地迭代。PyTorch程序敏捷的创建一个图表。然后反向传播使用动态创建的图表,自动计算从保存的张量状态下的梯度。鉴于在成熟的Torch框架基础上,已经有了强大的神经网络层,优化算法和损失函数。——马丁海勒

 

fast.ai

【人工智能】2018年最佳 机器学习/深度学习 开源软件奖获奖者_第4张图片

fast.ai不仅仅是一个深度学习的MOOC;它也是一个建立在PyTorch之上的深度学习库。该fast.ai框架不仅为构建和培训模型提供了一套包装器,而且还采用了一些用于培训深度学习模型的前沿技术(如循环学习率。并为NLP问题域转移学习技术)。换句话说,fast.ai将帮助你为Kaggle的竞赛和实际的生产应用程序建立模型。最重要的是,这可能是进入深度学习的最简单的方式!

 

Chainer

【人工智能】2018年最佳 机器学习/深度学习 开源软件奖获奖者_第5张图片

Chainer是一个灵活的神经网络的Python框架。与首先定义和修复神经网络拓扑的框架不同,最后对其进行培训。Chainer使用一个逐个运行的方案。这意味着网络是通过实际的前向计算动态定义的;反向传播计算计算梯度数组,并调用优化器来查找更新后的权重。
Chainer使用CuPy作为GPU计算的后端,后者又调用CUDA和cuDNN。特别是,cupy.ndarray类是Chainer的GPU阵列实现。CuPy支持一个具有兼容接口的NumPy特性的子集。Chainer已经影响了其他最近的神经网络框架。PyTorch也使用动态神经网络,而TensorFlow的eager执行模式也是如此——马丁海勒

 

H20

【人工智能】2018年最佳 机器学习/深度学习 开源软件奖获奖者_第6张图片

当我在2017年晚些时候回顾H20.ai的无人驾驶技术时。我喜欢它是一个自动驱动的机器学习系统,它也有工程和注释功能。我解释说,它是建立在开源的H2O堆栈之上的,它为无人驾驶的Al提供了所有的机器学习,并且还提供了它自己的auto ML和数据准备模块。
H20是一个具有线性可伸缩性的分布式内存机器学习平台。它支持最广泛使用的统计和机器学习算法,包括梯度提升机、广义线性模型和深度学习。H2O支持在R、Python、Scala、Java和它自己的交互式笔记本上的编程。——马丁海勒

 

Microsoft Cognitive Toolkit

【人工智能】2018年最佳 机器学习/深度学习 开源软件奖获奖者_第7张图片

Microsoft Cognitive Toolkit(或者更简单的CNTK)—是一个深度学习工具包,它是微软服务的基础,包括Skype、Cortana、Bing和Xbox。它处理来自Python、C++或BrainScript的多维密度或稀疏数据,并包含各种各样的神经网络类型:前馈(FFN)、卷积(CNN)、递归/长短期记忆(RNN/LSTM)、批量归一化和注意顺序序列。
Cognitive Toolkit支持强化学习、生成对抗网络、监督和非监督学习、自动超参数调优,以及在GPU上添加新的、用户定义的核心组件的能力。它能够在多个GPU和机器上实现并行性,甚至可以将最大的模型应用到GPU内存中。——马丁海勒

 

MXNet

【人工智能】2018年最佳 机器学习/深度学习 开源软件奖获奖者_第8张图片

当这个深度学习框架在2016年出现时,它的有趣之处在于两个原因:它在大量的网络实例上扩展了多个GPU,这是亚马逊最首选的深层神经网络框架。但正如我所评论说的那样,MXNet的边缘很粗糙。
MXNet在2017年初迁移到Apache Software Foundation保护伞下运作,在v1.2.1中仍然被认为是“孵化”。然而,它的边缘不再是粗糙了。
MXNet拥有对设备数据结构放置的良好控制。多GPU训练、自动微分和优化的预定义神经网络层。它在Gluon中有一个易于使用的界面,可以用来快速训练。在使用Gluon之前,您可以在MXNet中编写简单的命令式代码或快速符号代码。但不能同时编译两种。——马丁海勒

 

Featuretools

【人工智能】2018年最佳 机器学习/深度学习 开源软件奖获奖者_第9张图片

Featuretools是一个用于自动化特性工程的开源Python库。如果您曾经做过任何严肃的数据科学,您就会知道手动将原始数据转换成有意义的、规范化的特性是多么的棘手和耗时。从H2O中获得的专有的无人驾驶AI暂时了自动化特征工程,几乎达到了一个Kaggle的大师水平。
Featuretools实现了深度特性的合成。您可以将原始数据与您所知道的数据结合起来,为机器学习和预测建模构建有意义的特性。特性工具提供了APl以确保只使用有效的数据进行计算,使特性向量避免常见的标签泄漏问题。——马丁海勒

 

Horovod

【人工智能】2018年最佳 机器学习/深度学习 开源软件奖获奖者_第10张图片

Horovod创建于Uber。Horovod是一种用于TensorFlow、Keras和PyTorch的分布式训练框架。Horovod的目标是使分布式的深度学习变得快速和易于使用。Horovod借鉴了百度的TensorFlow ring-allreduce算法的实现,并以此为基础。
Horovod使用Open MPI(或另一个MPI实现)来传递节点间的消息。以及Nvidia的集体通信库(NCCL),用于其高度优化的ring-allreduce版本。Horovod使用了多达512个 Nvidia Pascal GPU,在Inception V3和ResNet-101中实现了90%的扩展效率,VGG-16的扩展效率为68%。——马丁海勒

 

Fabric Deep Learning(FfDL)

【人工智能】2018年最佳 机器学习/深度学习 开源软件奖获奖者_第11张图片

Fabric Deep Learning(FfDL),发音为“fiddle”是一个深度学习平台,提供TensorFlow、Caffe、PyTorch、Keras和H2O,作为Kubernetes的服务。FfDL最初是为IBM Cloud开发的,但也可以在支持Kubernetes集群的其他云中运行,也可以在Docker通过Kubeadm-DIND在本地运行。如果您在Kubernetes中使用设备插件,并且您选择启用GPU-enabled,那么FfDL将支持GPU的深度学习框架的构建。FfDL只在MacOS和Linux下进行测试。——马丁海勒


原文:https://www.infoworld.com/article/3308398/machine-learning/the-best-open-source-software-for-machine-learning.html

你可能感兴趣的:(Machine,Learning,Deep,Learning,机器学习算法理论与实战)