基于深度学习关键点检测算法综述

    关键点检测是计算机视觉中比较重要的任务之一,当前主流的算法可总结如下:

    1、基于coordinate 

        即将卷积神经网络(CNN)的特征通过一个全连接层来回归关键点的坐标和对应的置信度信息,在对卷积

特征的利用上,逐渐由单层特征到金字塔特征转换,有代表性的算法为人脸关键点检测的PFLD算法,全称为:

PFLD:A Practical Facial Landmark Detector

     2、基于heatmap

        顾名思义,其核心思想是将输出的特征层利用卷积来得到各个关键点的置信度,即,每个通道代表了某个

关键点在输入图片上各个位置的置信度,随后在每个通道上取置信度最大值和对应位置即可;heatmap的生成

方式较多样,如使用高斯分布将距离关键点中心远的位置设置低点,呈现出辐射状。

    3、基于heatmap + offset

        该方法与2中所述方法相似,仅在回归时加入了坐标偏移量,使用这一方式可以将网络输出特征图下采样至

更小尺度,比较典型的算法为《Towards Accurate Multi-person Pose Estimation in the Wild》,其在设计

ground truth时,使用了多对一的方式,即将某一点作为中心点,半径R范围内的点用来回归该点。

 

  上述方法主要介绍了关键点检测的一些发展放向,当下关键点检测与目标框检测的任务融合是一种主流发展方

向。

 

你可能感兴趣的:(ML,AI,计算机视觉,深度学习,关键点检测,heatmap)