【数之道 08】走进“卷积神经网络“,了解图像识别背后的原理

卷积神经网络

  • CNN模型的架构
  • Cnn 的流程
    • 第一步 提取图片特征
      • 提取特征的计算规则
    • 第二步 最大池化
    • 第三步 扁平化处理
    • 第四步 数据条录入全连接隐藏层

b站视频

CNN模型的架构

图片由像素点组成,最终成像效果由背后像素的颜色数值所决定的

【数之道 08】走进“卷积神经网络“,了解图像识别背后的原理_第1张图片
有这样的一个66的区域,0设置为黑色,1设置为白色,最终呈现的效果就很像数字7
【数之道 08】走进“卷积神经网络“,了解图像识别背后的原理_第2张图片
cnn模型可以告诉我们这样一个 6
6的像素图是不是数字7,或者返回它属于0-9的概率分别为多少
【数之道 08】走进“卷积神经网络“,了解图像识别背后的原理_第3张图片

Cnn 的流程

第一步 提取图片特征

在这个过程中,我们需要使用卷积核,也可以称为特征过滤器
【数之道 08】走进“卷积神经网络“,了解图像识别背后的原理_第4张图片

提取特征的计算规则

【数之道 08】走进“卷积神经网络“,了解图像识别背后的原理_第5张图片
垂直特征很好的被提取,而垂直特征没被提取
原因是像素图从66,降维成44,边缘特征丢失了

【数之道 08】走进“卷积神经网络“,了解图像识别背后的原理_第6张图片
为了解决边缘特征提取的问题,可以使用padding的扩充方法,66扩充为88,扩充部分的像素值设为0,
【数之道 08】走进“卷积神经网络“,了解图像识别背后的原理_第7张图片

第二步 最大池化

目的是将图片的数据进一步压缩,仅反应图中最突出的特点
【数之道 08】走进“卷积神经网络“,了解图像识别背后的原理_第8张图片
66,用22的网格分成3*3,然后提取每一部分的最大值
【数之道 08】走进“卷积神经网络“,了解图像识别背后的原理_第9张图片

第三步 扁平化处理

【数之道 08】走进“卷积神经网络“,了解图像识别背后的原理_第10张图片
把两个3*3的像素图叠加,转化成一维的数据条
【数之道 08】走进“卷积神经网络“,了解图像识别背后的原理_第11张图片

第四步 数据条录入全连接隐藏层

最终产生输出结果,扁平化之后的流程与ANN模型完全一致

【数之道 08】走进“卷积神经网络“,了解图像识别背后的原理_第12张图片
全连接隐藏层:任意一个神经元都与前后层的所有神经元相连接,来保证最终的输出值是基于图片整体信息的结果

再输出阶段:可以使用sigmoid激活函数返回0,1代表该图片是否是7的概率
也可以使用Softmax函数返回它分别属于0-9的概率

你可能感兴趣的:(cnn,人工智能,神经网络)