什么是卷积神经网络

卷积神经网络(Convolutional Neural Network, CNN)

卷积

离散卷积:

什么是卷积神经网络_第1张图片

卷积公式:
什么是卷积神经网络_第2张图片

如果有一个系统,输入不稳定,输出稳定,可以用卷积求系统存量

图像的卷积操作:

对图像的像素点,用33的矩阵(卷积核)来对原图像相乘,得到的图像外围的像素点用0表示【卷积核不一定必须是33】

图像是函数f,卷积核是函数g

什么是卷积神经网络_第3张图片

什么是卷积神经网络_第4张图片
什么是卷积神经网络_第5张图片
什么是卷积神经网络_第6张图片

什么是卷积神经网络_第7张图片
旋转180度后才是卷积核
关键:把卷积当成是过去对现在的影响,即周围像素点对当前像素点的影像,g函数就是规定了如何影响的关键

卷积神经网络

有2大特点:

  1. 能够有效的将大数据量的图片降维成小数据量
  2. 能够有效的保留图片特征,符合图片处理的原则

经典的CNN由三个部分组成:卷积层,池化层(下采样),全连接层

卷积层(提取特征):通过卷积核的过滤提取出图片中局部的特征

将图像拆分成对应的特点,被称为卷积核。然后查看被识别图像有无对应的卷积核来确认是否为目标物体,用卷积核扫描目标图得出的一个二维图为特征图。

什么是卷积神经网络_第8张图片

池化层(数据降维,避免过拟合):比如有2020的原始图片,我们对其进行池化,采样窗口为1010,最终将其下采样成为一个2*2大小的特征图

池化分为有最大池化(选择被扫描区域内的最大值)和平均池化(取被扫描区域内的平均值 等池化方式)

在处理边缘时的操作称为(Padding)
如果对图像采用最大池化,则在边缘补零来提取边缘特征,池化要求一定要保留原特征图的特征
什么是卷积神经网络_第9张图片

全连接层:输出结果

什么是卷积神经网络_第10张图片

经典的CNN并非只是上面提到的3层结构,而是多层结构

用大数据修正卷积核和全链接的行为叫机器学习

然后用算法不断修正用来处理特征数组的权链接。

得到越来越令人满意的网络。

所以甚至一开始的卷积核和权链接是随机的,只要给出的数据和反馈足够多,却仍然可以得到正确的算法网络

CNN的实际应用

  • 图像分类、检索:图像搜索
  • 目标定位检测:自动驾驶
  • 目标分割:美图秀秀,视频后期加工,图像生成
  • 人脸识别
  • 骨骼识别

参考视频:

【小动画】彻底理解卷积【超形象】卷的由来,小元老师

卷积究竟卷了啥?——17分钟了解什么是卷积

从“卷积”、到“图像卷积操作”、再到“卷积神经网络”,“卷积”意义的3次改变

How Convolutional Neural Networks work

参考文章:
这篇文章讲的太清楚了-> 卷积神经网络 – CNN
What is a Convolutional Neural Network?

你可能感兴趣的:(机器学习,cnn,深度学习,计算机视觉)