目标检测

对比RCNN与faster RCNN

目标检测_第1张图片

 fastRCNN

目标检测_第2张图片 

理解fast RCNN的关键就在第三个框,经过第二步后我们得到的是图片经过卷积的feature map,此时根据selective search输出的2K个ROI,找到feature map上对应的区域,这部分ROI的大小是不一样的,而后面要连接的是全连接层,因此必须把尺寸做到一样大,所以使用了ROI pooling技术。 
从selective search到CNN提取特征,再到ROI pooling 后接全连接网络,多任务学习.

fast RCNN相较RCNN,对整张图片只进行了一次卷积操作,避免了大量的重复计算,速度和精度都有了很大的提高,但仍然很慢,并且第一步的selective search属于传统方法。 
接下来的faster RCNN把目标检测完全带入了深度学习,提出RPN网络通过深度学习的方法取代了selective search。 
目标检测_第3张图片

几乎所有的目标检测方法都会设置一个多任务的损失函数,分为两部分,一部分用来对分类做softmax损失,另一部分用来对bbox-rg做损失,学习平移量和缩放量,只是具体的损失函数需要对着各个方法的论文去看。

目标检测_第4张图片

目标检测_第5张图片 

你可能感兴趣的:(目标检测)