斯坦福tensorflow教程(八) 计算机视觉和卷积网络简介

1 目录

  • 计算机视觉
  • 卷积神经网络
  • 卷积
  • 池化
  • 特征可视化

2 计算机视觉

计算机视觉发展比较早,在1966年就有相关CV的人工智能论文



计算机视觉应用雏形:


相关应用:

  • 图片分类


  • 目标识别


  • 物体标注


  • Pose 识别


  • 图标标题生成


  • 图片内容理解


  • 视觉问答



  • 图像生成


  • 迁移学习


3 卷积神经网络

我们先回顾下全连接网络:

全连接神经网络(fully connected neural network),顾名思义,就是相邻两层之间任意两个节点之间都有连接。全连接神经网络是最为普通的一种模型(比如和CNN相比),由于是全连接,所以会有更多到权重值和连接,因此也意味着占用更多到内存和计算。

image

卷积神经网络的示意图如下:


4 卷积


卷积不是一个新的概念,在很早以前的索贝算子就应用到,在影像处理及电脑视觉领域中常被用来做边缘检测

更过卷积的操作,原先写过一篇文章,这里不再赘述
卷积神经网络(CNN)介绍与实践
下面是课件对input、filter、stride之间关系总的总结:

tensorflow的卷积层:




TensorFlow的padding操作:


4 池化

池化层的作用: 1. 不变性,更关注是否存在某些特征而不是特征具体的位置。可以看作加了一个很强的先验,让学到的特征要能容忍一些的变化。2. 减小下一层输入大小,减小计算量和参数个数。3. 获得定长输出。(文本分类的时候输入是不定长的,可以通过池化获得定长输出)4. 防止过拟合或有可能会带来欠拟合。
链接:https://www.zhihu.com/question/36686900/answer/91714601


最大池化


一些卷积神经网络变体:

  • LeNet-5


  • AlexNet



  • VGGNet


  • GoogLeNet


  • ResNet


你可能感兴趣的:(斯坦福tensorflow教程(八) 计算机视觉和卷积网络简介)