Crosstalk Cascades for Frame-Rate Pedestrian Detection 阅读笔记

Crosstalk Cascades for Frame-Rate Pedestrian Detection

(目的:逐步减少输入检测框数量)

介绍

(说明已存在方法很慢,引出本文的算法。略。。。)

检测速度取决于特征和分类器。

文献【4】提供了一个快速多尺度特性的优化算法:在相邻位置构建两个级联;本文的串级联算法可以提高4~30倍的速度;

Crosstalk Cascades for Frame-Rate Pedestrian Detection 阅读笔记_第1张图片

Fig.1 每个棒子代表一个级联的评估,绿球代表级联阶段的评估,红圈代表局部最大探测响应。(Left:在标准的级联方法中,每个位置都是单独分类评估的。Right:结合Crosstalk Cascades算法可以显著地减少运算量,同时要求更少的整体弱分类器的评估)

基探测器

目前,Channel features已经是最好的。一幅图像,具有相同特性的channel可以被计算出来,矩形通道区域以外的特性可以用作积分图像。在多尺度检测中。特性计算普遍基于稀疏的图像金字塔,文献【4】提到了如何计算这种通道特性。

我们重新实现这种通道特性,包括:梯度幅值 1 channel),梯度直方图(6 channel)和 LUV 颜色通道(3channels

2.1 探测器相关性

相近位置和尺度的探测器具有相关性。ROS由特性、分类器的能力以及训练数据决定。ROSk(分类能力)呈负相关。

3 soft cascades的限定

,当前分类器的分类结果受前面所有分类器结果的影响,

计算停止(拒绝当前检测数据进入下一分类器);

3.1 拒绝阈值常数

,(文中)

3.2 优化soft cascades

定义

作为窗口

的检测结果,若窗口

quasi-positive

)则

考虑加入邻域检测窗口,若

,则

4 Crosstalk Cascades

介绍四种级联的构造算法:

1soft cascades :如果样本x在第k个分类器分类结果Hk(x) 小于 per-stage分类器的拒绝阈值

(即

),就拒绝进入下一分类器,其中

2excitatory cascades :若

,评价邻域窗口

,将满足条件的xx’都划入

3 Inhibitory Cascades :若

,则x被拒绝进入下一分类器;

4Crosstalk Cascades :组合Soft cascadesExcitatory cascadesInhibitory Cascades 算法,成为Crosstalk Cascades算法。

Crosstalk Cascades算法步骤(自己整理的):

声明:

1Let Xg denote all x sampled in a grid with a step size half the size of N 

2boosted classifier H

3target QMRthe quasi miss rateγ

4Xk表示经过k级分类器的检测窗口x的集合,XK为输出的包含对象的检测窗口;

inputXk Xg H γ

初始化:Xk为所有的检测窗口x的集合,阈值θkE=θkR=θkI=0Xg

for stage k=1:K

    1)计算H(xj)xj属于Xg

        计算阈值θkE:

    其中:hjomax(H(N(xj)))

        H(xj)小于θkE,则Xk=Xk-xj-N(xj)

        更新Xg

    2)计算H(xi)xi属于Xk

        计算阈值θkR:

    其中:

        H(xi)小于θkE,则Xk=Xk-xi

    3)计算min(H(xi)/H(N(xi))),xi属于Xk;

        计算阈值θkI:

    其中:

 

        min(H(xi)/H(N(xi)))小于θkI,则Xk=Xk-xi

    4)判断Xk是否为空?是,则输出 no object

                            否,k+1,返回步骤 1;

output包含对象的检测窗口 XK

         

 

疑问:

    1)是否可以加一个ke作为Excitatory cascades最大k级分类器(已解决)

    2Xg更新?   (已解决)

    3Inhibitory Cascades的比值计算是不是增大了计算量?  (已解决)

 

分析

1三种soft cascade方法(recalibratesemi-supervisedunsupervised)的实验结果(提升速度、误差)对比;

Crosstalk Cascades for Frame-Rate Pedestrian Detection 阅读笔记_第2张图片

2对比不同γ对误差和fppi的影响;

Crosstalk Cascades for Frame-Rate Pedestrian Detection 阅读笔记_第3张图片

3对比不同大小的检测窗口对soft cascades速度提升倍数的影响;

Crosstalk Cascades for Frame-Rate Pedestrian Detection 阅读笔记_第4张图片

4对比不同方法(文献【6】中提供)、不同γcrosstalk cascades的误差和速度;

Crosstalk Cascades for Frame-Rate Pedestrian Detection 阅读笔记_第5张图片

5对比四种方法()的误差和fppi结果;

Crosstalk Cascades for Frame-Rate Pedestrian Detection 阅读笔记_第6张图片

结论

Our approach is simple and effective and achieves faster than frame-rate detection

 

疑问?

1邻域确定,

计算   (已解决)

2各阈值的计算     (已解决)

3基检测器的

    a)输入channels特征【6】;

    b)检测方法    (已解决)

4检测窗口滑动的规则    (已解决)

——————————————————————写在最后——————————————————

本文为笔者的阅读笔记,有任何错误和疑问,欢迎联系QQ邮箱:[email protected]

你可能感兴趣的:(阅读笔记)