深度学习(三)--卷积神经网络提升篇

卷积神经网络提升篇

AlexNet

  • 现代神经网络起源
  • 背景介绍
    • ImageNet Challenge:1000类物体,每类1000张图片
    • 传统方法思路
      • 图片特征提取
      • 机器学习分类
  • 结构
    • 五个卷积层
    • 两个全连接层
    • 八层
  • 识别率
    • 15.3%

VGG

  • AlexNet增强版
  • 参数变成AlexNet二倍
  • 识别率
    • 7.3%
  • 参数最多的就是全连接层
  • 作用
    • 结构简单
      • 同AlexNet结构类似,均为卷积层,池化层,全连接层的组合
    • 性能优异
      • 同AlexNet提升明显,同GoogleNet,ResNet相比,表现接近
  • 选择最多的基本模型
    • 方便进行结构的优化,设计,SSD,RCNN等其他任务的基本模型(base model)
  • 19层

GoogLeNet

  • 多维度识别
  • Inception module
    • 上一层结果使用多次多个大小的卷积计算,最后合并在一起输出
    • 每次卷积后都加一个1*1卷积
      • 减少参数量,进行降维
  • 结构特点
    • 参数总数5m
    • 没有全连接层
  • 识别率
    • 3.1%

ResNet

  • 机器超越人类识别
  • 结构特性
    • 152层
      • 对比VGG,层数八倍,速度更快
    • 全卷积结构FCN
      • 一般的神经网络:卷积层CNN+全连接层FC
      • 全卷积网络:没有全连接层
      • 特点
        • 输入图片无大小限制
        • 空间信息有丢失
        • 参数更少,表达能力更强
  • 为什么ResNet有效
    • 前向计算
      • 低层卷积网络高层卷积网络信息融合,层数越深,模型的表现力越强
    • 反向计算
      • 导数传递更直接,越过模型,直达各层

DeepFace

  • 结构化图片的特殊处理
  • 人脸识别
    • 通过观察人脸确定对应身份,在应用中更多的是确认(vertification)
    • 每个器官对应一个卷积核
  • 人脸识别数据结构特点
    • 结构化
      • 所有人脸,组成相似,理论上能够实现对齐
    • 差异化
      • 相同位置,形貌不同
  • 一般神经网络处理人脸识别的问题
    • 卷积核同整张图片卷积计算,卷积核参数共享,不同局部特性对参数影响相互削弱
    • 解决方法
      • 不同区域不同参数
        • 人脸对准
          • 二维对准:二维矩阵对准
          • 三维对准:三维标准模板映射,三维投影二维
  • 识别率
    • 0.408%
  • 局部卷积连接的缺陷
    • 预处理
      • 大量对准,对对准要求高,原始信息可能丢失
    • 卷积参数数量很大,模型收敛难度大,需要大量数据
    • 模型可扩展性差,基本限于人脸计算

U-Net

  • 图片生成网络
  • 通过卷积神经网络生成特殊类型的图片,图片所有pixel需要生成,多目标回归
  • 卷积-逆卷积;池化-反池化(增维)Unpooling
    • 反池化
      • 记住原有位置,不是resize
    • 逆卷积
      • 实质:有学习能力的上采样
      • 输入位置的值乘以卷积核的所有位置,得到之前的值
      • 有学习能力上采样好处是什么
        • 生成图片有更好的连贯性,有更好的空间表达能力

 

你可能感兴趣的:(神经网络,深度学习)