本场 Chat 主要目标是立足于前人肩膀上,从整体上来总览深度学习,图文并茂的解释深度学习概念。适合想转战深度学习的小伙伴,以及刚刚入门深度学习,却为深度学习开发流程而困惑的小伙伴们。
本场 Chat 主要内容:
相信大家已经从很多途径简单的了解了人工智能的发展史,以及人工智能与机器学习和深度学习之间的关系,所以在此我就不再重复解释浪费篇幅了。
在人工智能的大家族中,深度学习只是其中的一个分支,除了深度学习之外还有:专家控制、模糊控制、遗传算法等智能算法。而我们所说的深度学习其实也是源于人工神经网络的研究。
来自百度百科的定义:
含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
近些年来随着计算机的计算能力提升,以及互联网的发展带来海量的样本数据,神经网络也再次迎来了新的高潮,但此时的神经网络已经与上世纪刚刚提出时的神经网络今非昔比了,不仅仅在算法模型上有了质的改进,处理的深度也是越来越深,早在2014年的GoogleNet就已经超过了100层,所以将现在的神经网络称之为深度学习并不为过。
了解过深度学习的由来之后,接下来我们解释下人工智能常面临的两大问题:分类与回归。
对于之前接触过机器学习的同学来说,分类与回归作为机器学习的主要研究方向,再熟悉不过了。如果之前没有接触过机器学习或深度学习,那么也不必担心。
分类问题就是对数据划分到合适的分类中;
而回归问题就是利用计算机学习已有的数据规律,然后对未知的情况进行预测。
其实分类模型和回归模型的本质是一样的,分类模型只不过是将回归模型的输出离散化而已。
分类问题的应用场景
分类问题是用于对事物打上一个标签,结果通常为离散值。例如判断一幅图片上的动物是一只狗还是一只猫,分类通常是建立在回归之上,分类的最后一层通常要使用softmax函数进行判断其所属类别。分类并没有逼近的概念,最终正确结果只有一个,错误的就是错误的,不会有相近的概念。最常见的分类方法是逻辑回归,或者叫逻辑分类。
回归问题的应用场景
回归问题通常是用来预测一个值,如预测房价或股票等等,例如一个产品的实际价格为500元,通过回归分析预测值为495元,我们认为这是一个比较好的回归分析。一个比较常见的回归算法是线性回归算法(LR)。另外,回归分析用在神经网络上,其最上层是不需要加上softmax函数的,而是直接对前一层累加即可。回归是对真实值的一种逼近预测。
分类属于监督学习,之所以称之为监督学习,是因为这类算法必须知道预测的分类结果是什么,即目标变量的分类信息。而无监督学习的数据则是没有类别信息的,也不会给定目标值。
监督学习是机器学习中一类经典的学习方法。从名字我们可以理解到,监督学习是需要外界进行“监督”的,此处的监督并非真的需要人无时不刻的“监督”,而是需要对其学习过程进行评判,及时纠正错误的行为。对于监督学习,输入的数据不仅有机器学习的样本数据,还应该将数据的分类结果也同时附上,后面的学习流程会讲解到。
在无监督学习中,输入的是数据没有标签也没有分类结果,而是直接对输入数据集进行建模,例如聚类, “人以群分,物以类聚”便是最好的解释。我们只需要把相似度高的东西放在一起,对于新来的样本,计算相似度后,按照相似程度进行归类就好。至于那一类究竟是什么,我们并不关心。
如果说我们输入的原始数据是原材料的话,那么数据的特征便是学习过程的关键。比如我们到超市购买香蕉,首先我们需要从所有水果中挑选出哪类是香蕉?与其他水果的不同,香蕉的特征一般是弯弯的,并且大多情况下是成串售卖;然后如何从香蕉堆里挑选出可口的香蕉呢?我们知道黄色的香蕉要比青色的香蕉好吃,干净的香蕉比带斑点的香蕉好吃,这样我们便可以从水果摊位中挑选出满意的香蕉了。
在此过程中,我们便是从可口的香蕉特征出发筛选的,首先从形状我们挑选出香蕉种类,再通过颜色挑选出可口的香蕉。这中间的弯弯的的形状、成串的结构,以及黄色的颜色就是我们用到的主要依据特征。而深度学习的整个学习过程也是如此,只是这个“特征”不再需要我们规定,而是由计算机自己去学习罢了。
阅读全文: http://gitbook.cn/gitchat/activity/5b366a932dbf944d53f6ff0d