tensorflow中的conv2有padding=‘SAME’这个参数。吴恩达讲课中说到当padding=(f-1)/2(f为卷积核大小)时则是SAME策略。但是这个没有考虑到空洞卷积的情况,也没有考虑到strides的情况。
查阅资料后发现网上方法比较麻烦。
手算,实验了一个早上,终于初步解决了问题。
分为两步:
中文文档中有计算公式:
输入: ( N , C i n , H i n , W i n ) (N,C_in,H_in,W_in) (N,Cin,Hin,Win)
输出: ( N , C o u t , H o u t , W o u t ) (N,C_out,H_out,W_out) (N,Cout,Hout,Wout)
H o u t = ( H i n − 1 ) s t r i d e [ 0 ] − 2 p a d d i n g [ 0 ] + k e r n e l s i z e [ 0 ] + o u t p u t p a d d i n g [ 0 ] H_{out}=(H_{in}-1)stride[0]-2padding[0]+kernel_size[0]+output_padding[0] Hout=(Hin−1)stride[0]−2padding[0]+kernelsize[0]+outputpadding[0]
W o u t = ( W i n − 1 ) s t r i d e [ 1 ] − 2 p a d d i n g [ 1 ] + k e r n e l s i z e [ 1 ] + o u t p u t p a d d i n g [ 1 ] W_{out}=(W_{in}-1)stride[1]-2padding[1]+kernel_size[1]+output_padding[1] Wout=(Win−1)stride[1]−2padding[1]+kernelsize[1]+outputpadding[1]
因为卷积后图片大小同卷积前,所以这里W_out=W_in, H_out=H_in。解一元一次方程即可。结果取ceil。
torch是先填充再卷积。conv2d的策略如此。所以我先在forward中获取上述方程需要的参数。然后使用torch.nn.functional.pad填充就好了。
然后
t2=torch.randn([1,1,4,4])
print(t2.size())
m1 = torch.nn.Conv2d(1, 1, 1, padding=(1,0))
print(m1(t2).size())
t2=F.pad(t2,(0,0,1,1))
print(t2.size())
有两个发现
这样应该就没什么问题了。
之后还需要看反卷积跟池化的pooling=’SAME’是怎么实现的。