【深度学习】目标检测网络结构MASK RCNN FPN

其相对于FASTER RCNN改进如下:

1. 分割,检测,分类同时进行

2. 引入ROI ALIGN(对分类影响不大,对分割影响大,因为ROI POOLING对应回图像中的像素会有偏差,该方法会相对准确)代替faster rcnn中的ROI POOLING

ROI ALIGN: https://www.cnblogs.com/wangyong/p/8523814.html

对于检测图片中大目标物体时,两种方案的差别不大,而如果是图片中有较多小目标物体需要检测,则优先选择RoiAlign,更精准些

3. 引入语义分割分支,实现mask和class预测关系的解耦。mask分支只做语义分割,类型预测的任务交给另一个分支(与FCN不同:FCN分类与分割同时,预测分割的时候也预测分类,不同的channel是不同的类别的分割概率)

 

 

FPN通过结合bottom-up,top-down方法获得较强的语义特征,提高目标检测和实例分割在多个数据集上面的性能表现。

FPN可以应用到前边的网络结构(fast, faster, mask rcnn)中

FPN: https://blog.csdn.net/WZZ18191171661/article/details/79494534

MAP: https://www.cnblogs.com/klitech/p/9242700.html

 

 

你可能感兴趣的:(人工智能,算法讲解,模式识别,深度学习,图像处理,机器学习,论文笔记)