用于评估视觉估值技术和行人检测技术的新架构

 

        本周了解了一种新的框架,该框架是专门用于评估视觉估值技术和行人检测技术的,以证明这些技术理论上的有效性,同时该框架还提供了大量的可供测试的数据和一系列用于评估的度量标准。

该框架如果对视觉估值方法进行评估的话需要视觉估值数据集,如果对行人检测技术进行评估则需要行人检测数据集,这里主要是针对行人检测技术进行评估,对于行人检测数据集,又分为两种:二维的和三维的。

对于二维行人检测数据集需要使用二维像平面比较技术,它是通过给图像中的每个人设置一个独立的一定大小的小方盒,获得小方盒的高度数据和位置数据,并对其进行统计,根据小方盒来选择检测的人体目标,这个方法只有一个约束条件:离摄像机8m以外的将不被视为有效行人。正是这约束条件也造成该方法的一些缺点,比如说这个8m的距离标准如何得到?为什么不是5m,6m呢?如何才能精确获得高度和位置统计数据呢?还有就是这个方法是在限定检测范围的情况下进行的(如8m),这样对于检测范围内的行人数量是固定的,然后才是基于这些行人进行一系列的措施,现在如果突然改变行人的数目,那么系统又该如何响应呢?同时由于检测范围的限制也造成未检测范围的行人数据的丢失。

介于上面提出的一些问题我们又引入三维行人检测数据集,这个方法它明确提出四个评估系统的度量标准:精确度,记忆性,平均位置误差和平均高度误差。这个方法也是基于位置和高度的,不过相对于二维来说具有更多的估计方法,同时它可以自动获取未检测到的行人的三维空间位置。

    由于运动捕获系统的限制导致部分可用于弥补二维缺点的数据无法收集,因此即使采用三维技术还是无法解决二维留下的所有问题。

     

你可能感兴趣的:(框架,测试)