对mmdetection代码设计的简单理解及代码修改

代码的整体结构及每部分含义网络上已有很多资料,这里不再赘述。但网上很少见到对mmdetection代码设计模式的讲解,所以记录一下自己的理解,及快速修改代码的方式吧(以faster-rcnn为例)。

为了更简单的理解mmdetection的设计,我打算从修改rpn proposal的采样代码说起。rpn proposal的采样目的是在一堆anchor中选择其中一部分,作为proposal,在rpn网络中用于回归bbox及正负例的分类。因此先看rpn在整个faster-rcnn流程中所处的位置:它在mmdet->models->detectors->two_stage.py中。
对mmdetection代码设计的简单理解及代码修改_第1张图片

图1
two_stage.py代表的并不是faster-rcnn,而是一个二阶段网络的训练框架。这个二阶段网络可以是cascade_rcnn,double_head_rcnn等,由于它们都是二阶段网络,因此把它们共性的部分抽取出来,写成了two_stage.py这个文件,当具体到要使用faster-rcnn时,再对two_stage.py加上faster-rcnn的配置。增加方法是在配置文件faster_rcnn_r50_fpn_1x_lvis.py(以下简称cfg文件)中,model的type设置为’FasterRCNN’。但是这个设置是怎么起作用的呢?

先看mmdet->models->detectors->faster_rcnn.py的头文件:

from ..registry import DETECTORS
from .two_stage import TwoStageDetector

这里导入了TwoStageDetector包,而TwoStageDetector正是定义在two_stage.py中的类。
再看FasterRCNN类:

@DETECTORS.register_module
class FasterRCNN(TwoStageDetector):

FasterRCNN类继承了TwoStageDetector,那就拥有了TwoStageDetector的全部属性,并且配置遵循FasterRCNN类。

再回过头看看mmdet->models->detectors->faster_rcnn.py中detectors这个文件夹。文件夹下有__init__.py文件,

__all__ = [
    'BaseDetector', 'SingleStageDetector', 'TwoStageDetector', 'RPN',
    'FastRCNN', 'FasterRCNN', 'MaskRCNN', 'CascadeRCNN', 'HybridTaskCascade',
    'DoubleHeadRCNN', 'RetinaNet', 'FCOS', 'GridRCNN', 'MaskScoringRCNN',
    'RepPointsDetector', 'FOVEA', 'GroupSoftmax', 'DCM'
]

包含了’TwoStageDetector’和’FasterRCNN’两个类。

至此对mmdetection代码设计做一个小小的总结。mmdetection先把模型抽象成一个共性结构two_stage.py,然后通过cfg文件中的字段给这个共性结构增加相应的属性,使之变成一个具体的模型,如faster-rcnn。增加相应属性的方式是:为这个属性单独写一个类,并且继承这个共性结构。为了让这个属性得以调用,还需修改当前文件夹下__init__.py文件。mmdetection这种设计非常方便,如果需要修改共性结构,则直接改two_stage.py,若要增加属性直接写一个文件,这样代码结构就十分清晰,书写方便。

除了模型代码是按上述方式设计,模型中每个模块的设计方式类似,就不举例了。

现在可以开始修改rpn proposal的采样代码了。
先看原始rpn proposal采样在cfg文件中的样子:
对mmdetection代码设计的简单理解及代码修改_第2张图片

图2

在train_cfg->rpn->sampler中,类型设置为type = ‘RandomSampler’。根据需求选择mmdet->core->bbox->samplers中相应的采样器,修改这个type字段即可。

你可能感兴趣的:(目标检测,深度学习,计算机视觉,mmdetection)