Mask R-CNN(目标检测,语义分割)测试


Kaiming He的大作Mask R-CNN( https://arxiv.org/pdf/1703.06870.pdf)已经放出来一段时间了,最近才有空进行代码学习和编译。 

图像目标检测是图像识别的核心任务之一,之前就对这以方面进行总结和测试(http://blog.csdn.net/sparkexpert/article/details/71642431)。
Mask R-CNN(目标检测,语义分割)测试_第1张图片
从上面的图可以看出,Mask R-CNN与是在Faster R-CNN之上的扩展,在每个兴趣点(Region of Interest,RoI)上加一个用于预测分割掩码的分层,称为掩码层(mask branch), 能够有效地检测图像中的目标,同时还能为每个实例生成一个高质量的分割掩码(segmentation mask)。就相当于多任务学习,掩码层只给整个系统增加一小部分计算量,所以该方法运行起来非常高效,重要的是能够同时得到目标检测和实例分割的结果。
       在COCO测试中可以看到,Mask R-CNN 在实例分割、边界框目标检测和人物关键点检测这三个难点上都获得了较好的实验效果,并且比每个现有的独立模型,包括 COCO 2016 挑战赛的获胜模型,表现都要好。
       下面进行测试(编译过程如下图所示):

Mask R-CNN(目标检测,语义分割)测试_第2张图片

第一个测试:发现结果相当好,手提包,消防水泵,包括车辆里面的人都被分割出来。

Mask R-CNN(目标检测,语义分割)测试_第3张图片

第2个测试:对近距离的分割检测结果也不错,远距离的目前还是业界难点。Mask R-CNN(目标检测,语义分割)测试_第4张图片

第3个测试:对这种室内场景的检测,效果也算不错的。旁边出来了个dining table,把台灯看出桌子了。Mask R-CNN(目标检测,语义分割)测试_第5张图片

第4个测试:客厅的检测,效果还不错,连假花都标出来了。

第5个测试:车站候车厅检测,也是近的可以,远的不行。

你可能感兴趣的:(tensorflow,图像处理)