原文发表于http://wenda.chinahadoop.cn/question/2745
未经本人允许,请勿转载.
在Github上排名前10位的机器学习项目包括许多库,框架和教育资源。看看别人都在用的工具,和学习的资源。
作者Matthew Mayo, KDnuggets.
开源工具在数据科学工作流程中越来越重要.
最近KDnuggets软件民意调查结果显示,73%的数据科学家使用前12个月免费的数据科学工具.这是容易理解的,因为Python和R的生态系统,是数据科学家使用的最突出最重要的工具.
以下是在Github上排名前十的机器学习项目概述.
Github已经成为事实上的开源软件交流中心,托管所有你能想到的项目.鉴于学术,科研和爱好越来越多的人采用深度学习,以及其在数据科学越来越重要,我们正在探索GitHub可用的深度学习项目.
应该指出的是,一些大多数会把比较突出的项目认为是深度学习,将不会出现在名单上,因为他们没有在Github搜索deep learning的结果中出现.
★ 7905, 4482
Caffe是一个绑定python和MATLAB的深度学习库.由 Berkeley Vision和UC Berkeley Learning Center发起,相信Caffeine是唯一一个适用于计算机视觉的应用是可以被原谅的.实际上深度学习库通用的目标是部署卷积网络,和视觉,语音以及其他应用的体系结构.
★ 4386, 697
这是马丁·多恩策划IPython notebooks的集合。涵盖主题包括:大数据,Hadoop,scikit-learn和scientific Python stack等等.涉及深度学习和框架,如TensorFlow,Theano,和Caffe都包含在一起,连同架构和概念。
★ 3924, 736
由Stanford博士生Andrej Karpathy,同时又一个很有启发性的博客,ConvNetJS 是一个JAvaScript实现的神经网络和通用模块,并且包括许多基于浏览器的例子.文档和例子众多,不要让JavaScript和神经网络的结合吓跑你,这是一个可以保证的流行和实用的项目.
★ 3852, 896
Keras是一个Python深度学习库,同时利用TensorFlow 和Theano,这意味着它可以在目前最流行的两大深度学习库运行.它是越来越多可称为高水平库的其中一个,所有这些功能相似:为了更快,更简单并且更灵活的神经网络实现抽象底层深度学习引擎.Keras支持major深度学习架构,配备了一个30秒的快速入门指南,并拥有雄厚的文档。
★ 3278, 737
作为深度学习框架,MXNet旨在灵活性和效率.同时允许命令式和symbolic 混合的编程技术来提高生产力.项目包括许多语言的组合,包括Python, R和Julia.MXNet还自带神经网络guidelines and blueprints的数组.另外注意的是,浏览器的相关项目在JavaScript中实现MXNet,并且图像分类模型可以通过这个链接测试.
★ 2253, 961
似乎是涉及广泛计算机编程主题的版本库,包含Node.Js,GoLang和深度学习.我说似乎是因为版本库在中国编写,由Google提供翻译导致更加混乱.然而有大量链接,如果你能够读写汉语,或许有一个价值隐藏其中.
★ 1824, 612
Deeplearning4j是Java和Scale开发具有工业强度的深度学习框架.作为JVM深度学习的解决方案,Deeplearning4j在空间上有明显的优势. 整合Hadoop和Spark,Deeplearning4j同样可以充分利用GPU.文档和教程也很扎实.
★ 1759, 195
这是机器学习和深度学习教程,文章和资源的策划清单.按主题组织,清单包括大量深度学习相关的类别,包括计算机视觉,增强学习和各种架构.数月已经被各大社交媒体转发,赋予丰富的内容,你可以通过这贡献.
★ 1651, 1202
这是一个MATLAB 和OctaveDeepLearnToolbox.然后,这个项目目前已经过时,不再维护.版本库确实指向Theano和TensorFlow作为最求深度学习有价值的替代品.
寻找一线希望在这这已过时,这个环节,一本书Yoshua Bengio,包括在回购作为学习深度学习架构的大赦国际建议的资源。
★ 1555, 944
这个版本库是蒙特利尔大学LISA实验室深度学习教程的集合.
这里介绍的教程将介绍一些最重要的深度学习算法,也将告诉你如何使用Theano来运行它们。 Theano是一个Python库,使得写深度学习模型很容易,并给出了在GPU上训练的选项。
这是教程链接.