Crosstalk Cascades for Frame-Rate Pedestrian Detection
(目的:逐步减少输入检测框数量)
1 介绍
(说明已存在方法很慢,引出本文的算法。略。。。)
检测速度取决于特征和分类器。
文献【4】提供了一个快速多尺度特性的优化算法:在相邻位置构建两个级联;本文的串级联算法可以提高4~30倍的速度;
Fig.1 每个棒子代表一个级联的评估,绿球代表级联阶段的评估,红圈代表局部最大探测响应。(Left:在标准的级联方法中,每个位置都是单独分类评估的。Right:结合Crosstalk Cascades算法可以显著地减少运算量,同时要求更少的整体弱分类器的评估)
2 基探测器
目前,Channel features已经是最好的。一幅图像,具有相同特性的channel可以被计算出来,矩形通道区域以外的特性可以用作积分图像。在多尺度检测中。特性计算普遍基于稀疏的图像金字塔,文献【4】提到了如何计算这种通道特性。
我们重新实现这种通道特性,包括:梯度幅值 (1 channel),梯度直方图(6 channel)和 LUV 颜色通道(3channels)
2.1 探测器相关性
相近位置和尺度的探测器具有相关性。ROS由特性、分类器的能力以及训练数据决定。ROS与k(分类能力)呈负相关。
3 soft cascades的限定
,当前分类器的分类结果受前面所有分类器结果的影响,
计算停止(拒绝当前检测数据进入下一分类器);
3.1 拒绝阈值常数
,(文中)
;
3.2 优化soft cascades
定义
作为窗口
的检测结果,若窗口
为quasi-positive(
)则
。
考虑加入邻域检测窗口,若
且
,则
。
4 Crosstalk Cascades
介绍四种级联的构造算法:
1)soft cascades :如果样本x在第k个分类器分类结果Hk(x) 小于 per-stage分类器的拒绝阈值
(即
),就拒绝进入下一分类器,其中
;
2)excitatory cascades :若
,评价邻域窗口
,将满足条件的x和x’都划入
;
3) Inhibitory Cascades :若
,则x被拒绝进入下一分类器;
4)Crosstalk Cascades :组合Soft cascades、Excitatory cascades和Inhibitory Cascades 算法,成为Crosstalk Cascades算法。
Crosstalk Cascades算法步骤(自己整理的):
声明:
(1)Let Xg denote all x sampled in a grid with a step size half the size of N ;
(2)boosted classifier H;
(3)target QMR(the quasi miss rate)γ;
(4)Xk表示经过k级分类器的检测窗口x的集合,XK为输出的包含对象的检测窗口;
input:Xk 、Xg、 H 、γ
初始化:Xk为所有的检测窗口x的集合,阈值θkE=θkR=θkI=0,Xg;
for stage k=1:K
1)计算H(xj),xj属于Xg;
计算阈值θkE:
其中:hjo为max(H(N(xj)));
若H(xj)小于θkE,则Xk=Xk-xj-N(xj);
更新Xg;
2)计算H(xi),xi属于Xk;
计算阈值θkR:
其中:
若H(xi)小于θkE,则Xk=Xk-xi;
3)计算min(H(xi)/H(N(xi))),xi属于Xk;
计算阈值θkI:
其中:
若min(H(xi)/H(N(xi)))小于θkI,则Xk=Xk-xi;
4)判断Xk是否为空?是,则输出 no object;
否,k+1,返回步骤 1);
output:包含对象的检测窗口 XK
疑问:
1)是否可以加一个ke作为Excitatory cascades最大k级分类器(已解决)
2)Xg更新? (已解决)
3)Inhibitory Cascades的比值计算是不是增大了计算量? (已解决)
5 分析
1)三种soft cascade方法(recalibrate、semi-supervised、unsupervised)的实验结果(提升速度、误差)对比;
2)对比不同γ对误差和fppi的影响;
3)对比不同大小的检测窗口对soft cascades速度提升倍数的影响;
4)对比不同方法(文献【6】中提供)、不同γ的crosstalk cascades的误差和速度;
5)对比四种方法()的误差和fppi结果;
6 结论
Our approach is simple and effective and achieves faster than frame-rate detection
疑问?
1)邻域确定,
计算 (已解决)
2)各阈值的计算 (已解决)
3)基检测器的
a)输入channels特征【6】;
b)检测方法 (已解决)
4)检测窗口滑动的规则 (已解决)
——————————————————————写在最后——————————————————
本文为笔者的阅读笔记,有任何错误和疑问,欢迎联系QQ邮箱:[email protected]