初识CNN1

深度学习可以说救了计算机视觉

卷积神经网络可以做的事情

  • 检测任务
    • 在摄像头中检测或者追踪
    • 图像遍历分割
    • 分类和检索
    • 超分辨率重构
    • 医学任务
    • 无人驾驶
    • 人脸识别

只要有特征了,还有什么东西不能做!~

GPU 图像处理单元

  • 处理图像任务
  • 做卷积
  • 做全连接
  • 做各种运算

比CPU快100倍!!

在学习阶段我们还是可以用CPU来跑代码,在实际的项目中我们推荐使用GPU来跑

但凡能跟图像搭上边的,都可用神经网络或者卷积神经网络来做

用CNN卷积神经网络来做点东西

神经网络是用来干什么的?

神经网络是用来做特征提取的

卷积神经网络CNN也是用来做特征提取的

  • 解决当前存在的问题,视频说白了就是图像的数据

如何进行特征提取?

需要的训练比较高

提出一种做卷积的特征提取方法


卷积网络和传统网络的区别

  • NN传统神经网络

    • 看起来像二维
    • 输入的东西是784像素点,是一维的列向量
  • CNN卷积神经网络

    • 像三维
    • 输入28281的长方体矩阵,三维的
    • hwc

c表示的是3维的

初识CNN1_第1张图片

整体架构

  • 输入层
    • 28281
  • 卷积层
    提取特征
  • 池化层
    压缩特征
  • 全连接层
    通过权重

初识CNN1_第2张图片

卷积做的事

把一张图像分成好多部分

  • 先把图像进行分割成一块块的小区域
  • 每个小区域的图像特征是不一样的
  • 选择一种计算方法,计算每一个区域他应该的特征值是多少

在1号区域进行特征提取特征值

使用权重参数得到特 征值

  • x1是我们拿到的当前区域
  • w1是权重参数矩阵

找到最好的权重参数矩阵
使得最后的特征提取效果最好

把绿色的东西叫做特征图


图像颜色通道

32323
图像是有通道的

  • 让每个通道的颜色单独去做计算
  • 把每个通道的结果卷积在一起

过程

  • 每个区域单独计算单独通道的值。其实是3个通道
  • 3个通道的值分别加在一起。

初识CNN1_第3张图片

  • 找一个三维的立体区域
  • 找特征值
  • 分区域对当前的数据进行特征提取

维度必须是一样的

输入的东西是7*7*3的

意思是表格的长是7
宽度是7
总共3维,3个

输入的东西中c是多少,filter中的个数 也必须和他一起对应

filter中的数据3*3*3

前面的两个3*3表示的是在原始图像中每多大的小区域选取一个特征

对应的是一个特征值

初识CNN1_第4张图片

从图片中我们可以观察到从原始图像中计算的3个不同通道的值是不一样的。

卷积核的值按权重计算

你可能感兴趣的:(神经网络,cnn,深度学习,计算机视觉)