第一章 浅谈人工智能、神经网络和计算机视觉

概要:本章将对人工智能及其相关的知识进行简单介绍,对人工智能及其相关知识进行初步了解。
1.1 人工还是智能
人工智能可以细分为强人工智能和弱人工智能,弱人工智能更注重“人工”的重要性,强人工智能更注重“智能”的重要性。
1.2 人工智能的三起两落
机器学习、深度学习等技术成为人工智能的主流,再加上大数据和计算机硬件的快速发展,使人工智能再次卷土重来。
机器学习和深度学习技术具备一个共同的特点:它们都需要使用尽可能多的数据来完成对自身模型的训练,这样才能让最终输出的模型拥有强大的泛化能力。
当前在计算机视觉领域应用得最好的技术是深度学习方法。在使用深度学习方法解决计算机视觉问题的过程中,用的最多的网络架构是一种叫做卷积神经网络(CNN)的模型。
1.3 神经网络简史
生物神经元:生物神经元的信息处理流程简单来说是先通过本神经元的树突接收外部神经元传入本神经元的信息,这个信息会根据神经元内定义的激活阈值选择是否激活信息,如果输入的信息最终碑额神经元激活,那么通过本神经元的轴突将信息输送到突触,最后通过突触传递至与本神经元连接的其他神经元。
根据生物神经元产生了一个人工神经元模型M-P模型。
使用M-P模型可以构造出逻辑与门、逻辑或门和逻辑非门。
感知机:一种具有单层计算单元的神经网络模型,初衷是解决数据的分类问题,因为感知机本身就是一种能够进行二分类的线性模型。
感知机的数学表达式如下:
f(x) = sign(w ·x+b)
其中参数x为输入向 量,w为输入量对应的权重值, 偏置 w·x 是输入向量x和权重向量w的点积表示。
sign 为符号函数,当符号函数的输入值大于0时输出正1,当符号函数的输入值小于0时输出负1。
如果处于二维空间中,那么 w·x+b = 0对应的就是对输入数据进行二分类的那条直线 ,在感知机中我们也把这条直线叫作分割超平面( Separating Hyperplane)。
感知机优点:很容易处理线性可分问题;
感知机缺点:不能处理异或问题,也就是说不能处理非线性问题。所以,之后出现了能够处理非线性问题的多层感知机模型。这个新的网络层次叫作隐藏层(Hidden Layer),我们能够自定义隐藏层的层次数量,层数通常会是一层或者多层。同时,多层感知机具备了一种后向传播能力。
多层感知机的出现使神经网络模型在解决问题的能力上得到了很大的提升,而且通过累加多层感知机的网络层次,模型有了能够解决现实世界的复杂问题的能力。模型的深度是一把双刃剑,随着模型深度的不断增加,模型本身会面临许多新的问题,最典型的就是通过机械性累加得到的深层次神经网络在进行后向传播的过程中会出现梯度消失的问题,梯度消失就意味着我们搭建的神经网络模型已经丧失了自我学习和优化的能力,所以在搭建神经网络模型时并不是网络的层次越深效果就越好。对于深层次神经网络模型,我们必须又特别的优化和控制手段。
对于在深层次神经网络模型训练中出现的梯度消失问题,一种有效的解决方案,就是通过
无监督预训练对权值进行初始化
和有
监督训练微调模型

1.4 计算机视觉
让机器拥有人类一样的视觉能力就是计算机视觉诞生的初衷。
传统的计算机视觉大致分为信息收集、信息分析和信息的处理三部分内容。
1.5 深度学习+
哪些领域正在使用深度学习方法解决计算机视觉问题。
(1)图片分类:图片分类具体指的是通过使用深度学习方法让计算机能够对输入图片的信息进行分析、处理并判定图片所属的类别。
(2)图像的目标识别和语义分割
图像的目标识别(Object Recognition)和语义分割(Semantic Segmentation)可以说是图片分类的升级版本。图片的分类是指通过使用已经训练好的模型识别输入图片的特征,然后才能将这些图片归属到具体的类别中。但是,在我们实际获取到的某张图片中不仅仅有一种类别的物品,有时我们还需要对一张图片中的多个物体进行分类和识别,这时就要用到目标识别和语义分割相关的算法了。
图像的目标识别和语义分割有 个很大的区别,就是它们对在图像中识别出的目标在结果呈现上有所不同:目标识别会对识别出的类别对象用长方形进行框选并在框上打上标签名,语义分割则会对识别出的类别使用同一种像素进行标识并打上标签。
(3)自动驾驶
(4)图像风格迁移
深度学习方法能够提取图像的重要特征,所以我们可以将提取的这些特征迁移到其他图片中进行融合,达到图像风格迁移的目的,这样,混合了其他图片风格的新图片就诞生了。

你可能感兴趣的:(第一章 浅谈人工智能、神经网络和计算机视觉)