吴恩达深度学习-3.3目标检测

目标检测

本章讲的是,关于滑动窗口法的目标检测实现。


我们以之前的车辆检测举例,比如说我们想要检测左边这种图当中检测到是否有车辆存在的情况,那么我们需要建立一个数据集,这个数据集是那种车辆占满了图片的情况(为了检测效果好),通过训练之后,我们可以得到一个能分辨车辆是否存在的分类器。

这样的话,我们就可以输入一张图片,询问其中是否有满屏的车辆。

那么由于,我们只能检测是否有满屏的车辆,因此我们需要使用一个小的窗口,在图片上进行固定步长的滑动,来观察这个图片当中有没有哪个窗口里有车,如果有的话就证明这整个图片里是有车的。

进行了一个小窗口的滑动之后,我们需要换一个大一点的窗口,然后再进行一遍,因为有可能车辆比较大,小窗口只截取了车辆的一部分,就没有办法识别。

在这种方法当中,有几个比较矛盾的点,分别是:步长大小-分类准确率-计算时间

在之前比较古老的分类器当中,使用的都是线性回归函数,计算量非常小,因此即使使用步长很小的滑动窗口方法,计算量也不会很大。

但是现在我们使用的是卷积神经网络进行分类,因此如果把步长改的很小,那计算时间就会很长,如果改的太大,又会因为错过了最佳分类的大小而影响分类的准确率,因此十分的矛盾。

但是现在已经有了简便卷积神经网络的滑动窗口计算的方法,我们在下一节课当中会讲到。

你可能感兴趣的:(吴恩达深度学习-3.3目标检测)