人流密度(crowd counting)估计方法

人流密度估计方法在深度学习起来之前主要有两种,直接估计和间接估计。近两年又有几篇做的不错的是使用cnn来进行估计。

面临的挑战

要进行准确的人流密度估计,面临了如下的难点
1.低分辨率:可以看看UCF Crowd Counting 50这个数据集,在很多密集的情况下,一个人头的pixel可能只有5*5甚至更小,这就决定了基于检测的很多方法都行不通;
2.遮挡严重:在人群中,头肩模型都难以适用更不用说人体模型,头部之间的遮挡都挺严重;
3.透视变换:简而言之就是近大远小,什么尺度的头部都可能出现。

数据集

  1. UCSD abnormal数据集,每帧画面人数11-46;
  2. Mall 数据集,每帧画面人数 13-53;
  3. PETS数据集,每帧画面人数3-40;
  4. UCF Crowd Counting 数据集,只有50张图,每张图平均人数1280人,每帧画面人数94-4543;
  5. World Expo‘10 数据集,在3980个frame中199923个annotation,属于超高密度人流。

直接估计

直接估计就是以检测为代表的,代表有counting crowed moving objects(cvpr06)还有 Counting people in the crowd using a generic head detector。基本是以检测,或检测加跟踪来进行估计。
这种方法在一些低密度且人头大小较为合适的情况下还是能得到不错的效果。但在密集人流或者透视变换严重的情况下基本无解。因此,此方法局限于低密度,弱透视的环境下。
人流密度(crowd counting)估计方法_第1张图片
人流密度(crowd counting)估计方法_第2张图片

间接估计

基本是以特征提取+回归结构。代表有 Counting people without people models or tracking(CVPR08), Learning to count objects in images(NIPS10).

CNN

后续再讲

你可能感兴趣的:(机器学习)