深度学习最近为什么这么火
外行所见的是2016年AlphaGo 4比1 战胜李世石,掀起了一波AI热潮,DeepMind背后所用的深度学习一时间火得不得了。其实在内行看来,AlphaGo对阵李世石的结果是毫无悬念的,真正的突破在几年前就发生了。2012年,Gefferey Hinton的学生Alex使用一个特别构造的深度神经网络(后来就叫AlexNet),在图像识别的专业比赛ImageNet中,得到了远超之前最好成绩的结果,那个时候,整个人工智能领域就已经明白,深度学习的革命已经到来了。果然,之后深度学习在包括语音识别,图像理解,机器翻译等传统的人工智能领域都超越了原先各自领域效果最好的方法。从2015年起,工业界内一些嗅觉灵敏的人士也意识到,一场革命或已到来。
基本概念
机器学习与深度学习
深度学习是机器学习中的一种技术,机器学习包含深度学习。机器学习还包含其他非深度学习的技术,比如支持向量机,决策树,随机森林,以及关于“学习”的一些基本理论,比如,同样都能描述已知数据的两个不同模型,参数更少的那个对未知数据的预测能力更好(奥卡姆剃刀原理)。而深度学习是一类特定的机器学习技术,主要是深度神经网络学习,在之前经典的多层神经网络的基础上,将网络的层数加深,并辅以更复杂的结构,在有极大量的数据用于训练的情况下,在很多领域得到了比其他方法更好的结果。
机器学习与大数据
大数据:机器学习的基础,但在多数语境下,更侧重于统计学习方法
机器学习,深度学习,数据挖掘,大数据的关系可以用下图表示
资料
深度学习火起来之后,网上关于深度学习的资料很多。但是其质量参差不齐。我从2013年开始就关注深度学习,见证了它从一个小圈子的领先技术到一个大众所追捧的热门技术的过程。也看了很多资料。我认为一个高质量的学习资料可以帮助你真正的理解深度学习的本质,并且更好地掌握这项技术,用于实践。
以下是我所推荐的学习资料
视频课程
Yaser Abu-Mostafa
加州理工的Yaser Abu-Mostafa教授出品的机器学习网络课程,非常系统地讲解了机器学习背后的原理,以及主要的技术。讲解深入浅出,让你不光理解机器学习有哪些技术,还能理解它们背后的思想,为什么要提出这项技术,机器学习的一些通用性问题的解决方法(比如用正则化方法解决过拟合)。强烈推荐,吐血推荐!
课程名称:Machine Learning Course - CS 156
视频地址:Youtube链接 www.youtube.com/watch?v=mby…
或 Bilibili www.bilibili.com/video/av984…
(注:这门课程是英文讲解,其实并不算太难。如果真的不愿意听英文,可以看他的学生林田轩的课程,主要内容相近。课程名称:机器学习基石。视频地址:www.youtube.com/watch?v=nQv… )
Geoffrey Hinton
深度学习最重要的研究者。也是他和另外几个人(Yann LeCun,Yoshua Bengio等)在神经网络被人工智能业界打入冷宫,进入低谷期的时候仍然不放弃研究,最终取得突破,才有了现在的深度学习热潮。他在Coursera上有一门深度学习的课程,其权威性自不待言,但是课程制作的质量以及易于理解的程度,实际上比不上前面Yaser Mostafa的。当然,因为其实力,课程的干货还是非常多的。
课程名称:Neural Networks for Machine Learning
课程地址:www.coursera.org/learn/neura…
UdaCity
Google工程师出品的一个偏重实践的深度学习课程。讲解非常简明扼要,并且注重和实践相结合。推荐。这门课程是英文讲解,但提供中文字幕。
课程名称:深度学习
课程地址:cn.udacity.com/course/deep…
小象学院
国内小象学院出品的一个深度学习课程,理论与实践并重。由纽约城市大学的博士李伟主讲,优点是包含了很多业内最新的主流技术的讲解。值得一看。
课程名称:深度学习(第四期)
课程地址: www.chinahadoop.cn/classroom/4…
书
《Deep Learning the Book》 —— 这本书是前面提到的大牛Yoshua Begio的博士生Goodfellow写的。Goodfellow是生成式对抗网络的提出者,生成式对抗网络被Yann LeCun认为是近年最激动人心的深度学习技术想法。这本书比较系统,专业,偏重理论,兼顾实践。是系统学习深度学习不可多得的好教材。英文版见 deeplearningthebook.com,目前Github上已经有人翻译出了中文版github.com/exacity/dee…。
推荐路径
不同的人有不同的需求,有些人希望掌握好理论基础,然后进行实践,有些人希望能够快速上手,马上做点东西,有些人希望理论与实践兼顾。下面推荐几条学习路径,照顾到不同的需求。大家可以根据自己的特点进行选择。
Hard way
Yaser -> Geoffrey Hinton -> UdaCity -> 小象学院 -> Goodfellow
特点:理论扎实,步步为营。最完整的学习路径,也是最“难”的。
推荐指数 4星Good way
Yaser -> UdaCity -> 小象学院 -> Goodfellow
特点:理论扎实,紧跟潮流,兼顾实战,最后系统梳理。比较平衡的学习路径。
推荐指数 5星"Fast" way
UdaCity -> Goodfellow
特点:快速上手,然后完善理论。
推荐指数 4星"码农" way
UdaCity
特点:快速上手,注重实践。
推荐指数 3星
以上路径按照从完整到精简的顺序排列。如果要我只推荐一条路径的话,那么就是2 Good way(Yaser -> UdaCity -> 小象学院 -> Goodfellow),完整同时又兼顾效率,理论与实践并进的学习路径。强烈推荐。
今天,深度学习的框架已经较为成熟,主要有谷歌家的Tensorflow,微软的CNTK,Facebook的Caffe,等等,但是这些框架较为底层,使用不太方便。Keras作为一个更高层的,更加简单易用的框架,屏蔽了底层框架的实现细节和差异,让你基本上可以以搭积木的方式,非常快速直观地构建一个常用的深度神经网络,进行各种训练和预测,大大简化了深度学习编程的难度。Keras在业界非常受欢迎,成为做深度学习工程实践的极佳工具,其受欢迎程度,可以说把Tensorflow,Caffe这些框架都比了下去。很多深度学习的课程也都使用Keras作为学生作业的推荐框架,比如Udacity优达学城上的深度学习纳米学位课程。
PluralSight.com上有一门《Deep learning with Keras》课程,系统地介绍了Keras,包括一些深度学习的主要概念和技术。据我所知非常贴近现在业界的实战。作为之前推荐的几个资源的补充,属于偏实践课程。强烈推荐。
课程名称:Deep learning with Keras
链接:app.pluralsight.com/library/cou…