双向模型只在encoder,不在decoder(前向预测)吗?
类的继承
github页面上传只有25M
类的写法,其中继承自父类的构造方法写作
super.__init__(**kwargs)
forward方法继承自父类的forward参数写法与内部,可以重写
关于permute,view,resize(其中view只对连续变量起作用,功能相当于resize,permute相当于变量移动)
X=X.permute(idx(i),idx(j))
cat
cat((A,B),dim),dim=0,按行,dim=1,按列dim=0
注意sum的行操作导致只剩一行,列操作导致只剩一列,如
np.sum(X,axis=0)则X.shape(x,y) to X.shape(1,y)