深度学习笔记整理(六)——深度学习的应用

1.物体识别

  • 深度学习之前:尺度不变特征变换方法和支持向量机等机器学习方法组合应用;
  • 2012年:多伦多大学研究团队提出CNN、ReLU、DropOut的使用,可以自动捕捉到多个方向的边缘和颜色渐变、网纹图案等;
  • 2013年:反卷积网络的提出,可以恢复卷积结果,直观确认训练后网络的好坏;
  • 2014年:深度神经网络的提出,22层的GoogleNet和19层的VGG。

2.物体检测

确定图像中物体的位置的方法。

分类

  • 事先限定检测对象:人脸检测、行人检测;
  • 非类别限定

对于非类别限定的物体检测,使用区域神经卷积网络R-CNN实现,一些问题和解决方法如下:

问题1:如何筛选候选区域

  • R-CNN通过selective search分割方法从图像中提取候选区域;
  • 再将候选区域作为CNN的输入。

问题2:如何去除冗余的候选区域

  • 迁移学习
  • 首先使用ImageNet数据集进行物体识别网络训练,再把训练好的网络参数作为其它网络参数初始值进行微调;
  • 通过CNN提取特征,通过SVM进行识别。

3.分割

输出每个像素所属类别的方法。

4.回归问题

应用:面部器官检测和人体姿态估计

训练时使用最小二乘误差函数,通过级联网络提高估计的准确率。

步骤:

  1. 使用针对整个脸部区域的网络和针对特定区域的网络分别检测;
  2. 初步估计各器官大概位置,独立估计各器官的位置,具有很好的稳健性;
  3. 针对各器官进行详细位置的估计。

5.人脸识别

  • 人脸对比:基于二值模式,捕捉到的人脸图像与已认证的作对比,核实是否为同一人;
  • 人脸认证:类别识别,从已登记人员中找到识别到的对象,登记规模越大,识别难度越高。

你可能感兴趣的:(机器学习&强化学习,卷积,深度学习)