个人主页:为梦而生~ 关注我一起学习吧!
专栏:机器学习 欢迎订阅!相对完整的机器学习基础教学!
⭐特别提醒:针对机器学习,特别开始专栏:机器学习python实战 欢迎订阅!本专栏针对机器学习基础专栏的理论知识,利用python代码进行实际展示,真正做到从基础到实战!
往期推荐:
【机器学习基础】一元线性回归(适合初学者的保姆级文章)
【机器学习基础】多元线性回归(适合初学者的保姆级文章)
【机器学习基础】决策树(Decision Tree)
【机器学习基础】K-Means聚类算法
【机器学习基础】DBSCAN
【机器学习基础】支持向量机
【机器学习基础】集成学习
【机器学习 & 深度学习】神经网络简述
本期内容:卷积神经网络最常用于分析视觉图像,并广泛应用于计算机视觉、自然语言处理等领域。卷积神经网络仿造生物的视知觉(visual perception)机制构建,可以进行监督学习和非监督学习,其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化(grid-like topology)特征,例如像素和音频进行学习、有稳定的效果且对数据没有额外的特征工程(feature engineering)要求。
上一篇文章我们介绍了人工神经网络,神经网络由大量的神经元相互连接而成。每个神经元接受线性组合的输入后,最开始只是简单的线性加权,后来给每个神经元加上了非线性的激活函数,从而进行非线性变换后输出。每两个神经元之间的连接代表加权值,称之为权重(weight)。不同的权重和激活函数,则会导致神经网络不同的输出。
这一篇文章我们来了解一下更加神奇的卷积神经网络
卷积神经网络是一种前馈神经网络,受生物学上感受野(Receptive Field)的机制而提出的。在视觉神经系统中,一个神经元的感受野是指视网膜上的特定区域,只有这个区域内的刺激才能够激活该神经元。
上图给出了经典的卷积神经网络各个层级结构
上图中CNN要做的事情是:给定一张图片,是车还是马未知,是什么车也未知,现在需要模型判断这张图片里具体是一个什么东西,总之输出一个结果:如果是车 那是什么车
在泛函分析中,卷积、旋积或褶积是通过两个函数f和g生成第三个函数的一种数学运算。
在深度学习中, 对图像和滤波矩阵做内积的操作就是卷积。
给定一个输入信号序列和滤波器,卷积的输出为:(Filter: [-1,0,1])
步长是指感受野窗口每次移动的长度单位,对于2D输入来说,分为沿(向右)方向和(向下)方向的移动长度。步长会影响到输出特征图的尺寸,步长越大,输出的特征图尺寸越小,反之亦然。步长的选择需要根据实际任务需求和数据特点来决定,通常情况下,步长为1或2。
填充是指在输入高和宽的两侧填充元素(通常是0元素),以增加输出的特征图尺寸。填充的作用是控制输出特征图的尺寸,同时可以使得卷积神经网络具有更强的平移不变性。通过填充,可以在输入特征图上增加一些额外的信息,使得卷积神经网络能够更好地处理数据。
在早期的文献中,卷积一般默认为窄卷积。而目前的文献中,卷积一般默认为等宽卷积。
在卷积神经网络中,多个卷积核的作用是提取输入数据的多种局部特征。每个卷积核都可以从输入数据中提取出特定的特征,例如边缘、角点、纹理等。通过使用多个卷积核,可以同时学习多个特征,并在输出层中将这些特征结合起来进行分类或回归。
卷积核的作用类似于滤波器,可以对输入数据进行滤波操作,提取出局部特征。在卷积神经网络中,卷积核的大小和数量可以根据任务需求和数据特点进行选择和调整。通常情况下,卷积核的大小为3x3或5x5,数量可以从几十到几百不等。
使用多个卷积核可以增加神经网络的非线性表达能力,使得神经网络能够更好地学习和模拟复杂的特征。同时,多个卷积核还可以提高网络的泛化能力,使得神经网络对于不同的数据分布更加鲁棒。
卷积层虽然可以显著减少连接的个数,但是每一个特征图的神经元个数并没有显著减少。
池化层是卷积神经网络中的一种重要层,用于降低输入数据的空间维度,减少参数数量,提高模型的计算效率。
池化层通常位于卷积层之后,通过对输入数据的降采样来减小数据的空间尺寸。
池化层的操作可以分为两种:最大池化和平均池化。最大池化是从输入数据中选取固定大小的区域,取该区域中的最大值作为输出;平均池化则是计算固定大小区域的平均值作为输出。
LeNet-5 是一个非常成功的神经网络模型。
基于 LeNet-5 的手写数字识别系统在 90 年代被美国很多银行使用,用来识别支票上面的手写数字。
2012 ILSVRC winner(top 5 error of 16% compared to runner-up with 26% error)
第一个现代深度卷积网络模型
首次使用了很多现代深度卷积网络的一些技术方法
使用GPU进行并行训练,采用了ReLU作为非线性激活函数,使用Dropout防止过拟合,使用数据增强
5个卷积层、3个汇聚层和3个全连接层