「论文阅读笔记」Deep Hierarchical Saliency Network for Salient Object Detection

纪念第一次写博客的我

想法很简单,记录看过的论文总结出优劣以供自己以后有想法的时候随时查阅

也算是不错的研究生生活的开端

花了一星期看了比较经典,而且是一个显著性检测的2D算法——DHSnet(Deep Hierarchical Saliency Network for Salient Object Detection)

整体结构如下图所示

整个DHSnet分为 GV-CNNHRCNN。图片先由一个简单的VGG-16处理再经过全连接层重塑成28x28大小的图片,全连接层头上的784就是28x28,这张图片被称为粗略的全局图像 SmG,值得注意的是,在VGG卷积层上的数字是特征图的分辨率大小,而不是通道数,然后从VGG的不同卷积层中抽取低级特征逐步地分层次地使用RCL(Recurrent Convolutional Layer)SmG级联融合,最后以真值重塑的不同尺寸的图片作监督,输出结果

上采样的作用是什么

举个例子 SMRCL4的尺寸是28x28,而需要与它融合的卷积层是56x56,这个时候就需要做上采样将图像分辨率放大

为什么使用RCL,使用RCL的优势是什么

不像之前的算法为了追求图像细节过分进行图像分割而导致耗时长,传统的decoder使用的卷积层参数多训练慢,该算法整合了RCL模块分层次渐进式对图像进行细节的恢复,不仅耗时短而且质量也好。在论文的另一部分专门介绍了RCL的作用,我的理解是,RCL中只涉及2个不同的卷积层,通过4次的循环调用达到效果,而不需要去增加额外卷积层导致参数过多。

论文还从 感受野的缩小可视化替换传统卷积层GPU运行时间来说明RCL的效果

「论文阅读笔记」Deep Hierarchical Saliency Network for Salient Object Detection_第1张图片

「论文阅读笔记」Deep Hierarchical Saliency Network for Salient Object Detection_第2张图片

「论文阅读笔记」Deep Hierarchical Saliency Network for Salient Object Detection_第3张图片
在这里插入图片描述

在复现代码的时候出现了 **ValueError: operands could not be broadcast together with shapes (224,224) (3,) (224,224) **

如何解决请戳这里

在这里插入图片描述

你可能感兴趣的:(阅读论文笔记)