return F.linear(input, self.weight, self.bias)
RuntimeError: mat1 and mat2 shapes cannot be multiplied (249856x224 and 256x78)
报错解释:矩阵1 和 矩阵2无法相乘。矩阵1的维度是249856x224
,矩阵2的维度是256×78
.
在init()中,我调用nn.Linear,将维度从256,变为指定的78
self.output = nn.Linear(in_features=256,out_features=78,bias=False)
所以,报错的256 × 78 指的就是self. output语句中的in_features和 output_feature
所以,我们应该使249856 × 224
变为 256 × blabla
大小的矩阵。至于这个blabla的值到底是多少,我们留给系统自己算。
改变形状的代码如下所示:我在forward()里加上一句:
out = out.view(-1,256)
out的形状改变后,继续调用self.output语句
out = out.view(-1,256)
out = self.output(out) # out:(200704,256)
out = self.relu(out)
return out