Multi-scale Interactive Network for Salient Object Detection(阅读记录)

Multi-scale Interactive Network for Salient Object Detection

1.主要贡献

•文章提出了MINet,以有效地满足SOD任务中的多尺度要求。 聚集相互作用模块可以通过相互学习的方式有效地利用相邻层的特征,而自交互模块则使网络可以自适应地从数据中提取多尺度信息,并更好地处理显著物体的尺度变化。
•文章设计了增强一致性损失函数作为辅助来推动模型一致地突出显示整个显着区域,并更好地处理由各种比例的物体引起的前后区域之间的像素不平衡问题,而无需任何后处理或 额外的参数。

Multi-scale Interactive Network for Salient Object Detection(阅读记录)_第1张图片

2.模型概括

        整个模型的结构采用的是FCN的网络结构,上面为编码器,下面时解码器,可见,该结构的独特之处在于,添加了AIM、SIM模块来获得多尺度信息,之前的方法获取多尺度的方法多考虑从使用不同空洞率的卷积入手,如ASPP结构,但是这种操作不仅会使得参数量增加,而且作者认为强行concat各种尺度的图片可能会带来噪音,作者强调引用相邻尺度的图片来扩大感受野可能更好,而且编码器解码器本身就有多尺度的信息,用多余操作执行可能导致冗余,因此,本文作者设计了AIM结构融合编码器的相邻尺度的特征来解决多尺度问题。此外,作者还提出SIM结构来提取多尺度信息。

Multi-scale Interactive Network for Salient Object Detection(阅读记录)_第2张图片

        AIM设计第一列考虑做pooling操作,第二列卷积操作并改变channel,然后就是特征组合,最后卷积处理然后再组合,为了强调当前层的特征,会有一个类似残差的操作。

Multi-scale Interactive Network for Salient Object Detection(阅读记录)_第3张图片

Multi-scale Interactive Network for Salient Object Detection(阅读记录)_第4张图片

Multi-scale Interactive Network for Salient Object Detection(阅读记录)_第5张图片

 

3.损失函数

Multi-scale Interactive Network for Salient Object Detection(阅读记录)_第6张图片

Multi-scale Interactive Network for Salient Object Detection(阅读记录)_第7张图片

        作者认为,单纯的BCEloss是有问题的,比如说前景物体与背景的比例变化,BCE对待前景和背景是没有区别的,这都是不太合理的,作者考虑一个更具有表达力的损失函数,应该在结果与预测值前景相差较大时得到最大损失,因此考虑从CEL入手。

 

4.实验结果

Multi-scale Interactive Network for Salient Object Detection(阅读记录)_第8张图片

Multi-scale Interactive Network for Salient Object Detection(阅读记录)_第9张图片

 

你可能感兴趣的:(SOD)