ECCV2016
论文下载地址:Accelerating the Super-Resolution Convolutional Neural Network
代码:参考了这位同学https://blog.csdn.net/gwplovekimi/article/details/83413171
FSRCNN直接采用低分辨的图像作为输入,不同于SRCNN需要先对低分辨率的图像进行双三次插值然后作为输入;
FSRCNN在网络的最后采用反卷积层实现上采样;
FSRCNN选择更小尺寸的滤波器和更深的网络结构。
特征提取:一次用5*5卷积,因为现在输入的图片尺寸变小了。
压缩:采用小的感受野1*1节约计算能力,同时输出采用s
拓展:为了得到HR图像,那么就要进行增加扩展层,类似于压缩层的逆过程。
反卷积层:可以看成卷积的逆过程。对于卷积,如果步长为k,那么输出大小为1/k。因此反卷积另步长为k = n,那么分辨率提升n倍。因此这里卷积核取9*9。
激活函数:采用PReLU。整个架构如下
#FSRCNN
class FSRCNN(nn.Module):
def __init__(self, in_nc, out_nc, nf, nb, upscale=4, norm_type='batch', act_type='relu', \
mode='NAC', res_scale=1, upsample_mode='upconv'):##play attention the upscales
super(FSRCNN,self).__init__()
#Feature extractionn
self.conv1=nn.Conv2d(in_channels=in_nc,out_channels=nf,kernel_size=5,stride=1,padding=2)#nf=56.add padding ,make the data alignment
self.prelu1=nn.PReLU()
#Shrinking
self.conv2=nn.Conv2d(in_channels=nf,out_channels=12,kernel_size=1,stride=1,padding=0)
self.prelu2 = nn.PReLU()
# Non-linear Mapping
self.conv3=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
self.prelu3 = nn.PReLU()
self.conv4=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
self.prelu4 = nn.PReLU()
self.conv5=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
self.prelu5 = nn.PReLU()
self.conv6=nn.Conv2d(in_channels=12,out_channels=12,kernel_size=3,stride=1,padding=1)
self.prelu6 = nn.PReLU()
# Expanding
self.conv7=nn.Conv2d(in_channels=12,out_channels=nf,kernel_size=1,stride=1,padding=0)
self.prelu7 = nn.PReLU()
# Deconvolution
self.last_part= nn.ConvTranspose2d(in_channels=nf,out_channels=in_nc,kernel_size=9,stride=upscale, padding=4, output_padding=3)
def forward(self, x):#
out = self.prelu1(self.conv1(x))
out = self.prelu2(self.conv2(out))
out = self.prelu3(self.conv3(out))
out = self.prelu4(self.conv4(out))
out = self.prelu5(self.conv5(out))
out = self.prelu6(self.conv6(out))
out = self.prelu7(self.conv7(out))
out = self.last_part(out)
return out
这篇论文确实相较于srcnn逊色很多,本以为会是fast rcnn那种又快又准,结果只快不准
FSRCNN:0.25027109384536744 seconds, 3.9956671968591797FPS
origin: 0.2119568991661072 seconds, 4.7179403168014655FPS
915: 0.38688172578811647 seconds, 2.584769280489795FPS
935: 0.3359390616416931 seconds, 2.9767303483945042FPS
相比于srcnn快了很多,但是精度却下降了,是因为网络过深导致的吗?
我感觉可以把fsrcnn中的后上采样,先提纯的思想应用到srcnn935之中,然后再尝试拆分大卷积,再插入残差块。给我的思路就是后上采样的手段确实可以极大的提高速度,如何不降低精度是个问题。
# 13,13,512 -> 13,13,256 ->26,26,256
x1_in = self.last_layer1_patch(out0_branch)#通道数不变
x1_in = self.last_layer1_noline(x1_in)#通道下降
x1_in = self.last_layer1_recon(x1_in) #通道数不变
x1_in = self.last_layer1_decon(x1_in)#再上采样