目标计数方法概述

目标计数方法概述

1、如何进行目标计数?

目标计数的方法主要有三类。

  1. 基于检测的方法。使用传统的基于 HOG 的检测器或基于深度学习的检测器,如 YOLO 或 RCNN。但这类方法的效果在目标场景中容易受到遮挡的严重影响。
  2. 基于回归的方法。这类方法只是从原始图像中捕获一些特征,并使用机器学习模型来映射特征和数字之间的关系。在深度学习之前,基于回归的方法是 SOTA,研究人员专注于寻找更有效的特征来估计更准确的结果。但是,当深度学习变得流行并取得更好的结果时,基于回归的方法就会受到较少的关注,因为很难捕捉到有效的手工制作的特征。
  3. 基于密度图的方法。这类方法是目前目标计数的主流方法。与基于检测的方法和基于回归的方法相比,密度图不仅可以给出目标数量,而且可以反映行人的密度分布。

2、什么是密度图?

以行人计数为例,我们使用高斯核来模拟原始图像对应位置的头部,在对图像中的所有头部执行此操作后,在由所有这些高斯核组成的矩阵中执行归一化。如下图所示:
目标计数方法概述_第1张图片

3、 如何生成密度图

  1. 固定大小的密度图。使用相同的高斯核,这种方法适用于没有严重透视失真的场景。
  2. 透视密度图。使用透视图(由行人高度的线性回归生成)生成对不同头部具有不同大小的高斯核。此方法适用于固定场景。
  3. KNN 密度图。使用 k-nearest head 生成不同大小的高斯内核到不同的 head。这种方法适用于非常拥挤的场景。MCNN中详细说明了如何生成 k-nearest density-map。

你可能感兴趣的:(论文阅读笔记,计算机视觉,深度学习,人工智能)