结合maskrcnn和yolo的优缺点,建立灵活的包含两种模型的目标检测模型 图像难度预测器

主要有两种类型的最先进的物体探测器。一方面,我们two-stage探测器,比如Faster R-CNN(基于区域的卷积神经网络)或Mask R-CNN,它们(i)使用区域提议网络在第一阶段产生兴趣区域, (ii)将区域提案发送到pipeline中以进行对象分类和边界框回归。这样的模型达到了最高的准确率,但通常较慢。另一方面,我们有YOLO(You Only Look Once)和SSD(Singe Shot MultiBox Detector)等single-stage探测器,将物体探测作为一个简单的回归问题,它将输入图像作为输入图像并学习类概率,边界框坐标。这种模型的准确率较低,但比two-stage物体探测器快得多。在本文中,我们建议使用图像难度预测器来实现目标检测中精度和速度之间的最佳平衡。将图像难度预测器应用到测试图像上,将其分解为简易图像和困难图像。一旦分离后,简单的图像将被发送到更快的single-stage探测器,而困难图像被发送到更精确的two-stage探测器。我们在PASCAL VOC 2007上进行的实验表明,使用图像难度与图像的随机分割相比毫不逊色。我们的方法是灵活的,因为它允许选择一个期望的阈值,将图像分成简单和较难。

论文名称

Optimizing the Trade-off between Single-Stage and Two-Stage Object Detectors using Image Difficulty Prediction

你可能感兴趣的:(结合maskrcnn和yolo的优缺点,建立灵活的包含两种模型的目标检测模型 图像难度预测器)