实操的时候,前面六个代码块都正常运行,但是最后一步训练模型时报错,如图:
#训练模型
num_epochs, lr = 5, 100.0
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, batch_size, params, lr)
提示是*这个字符连接的“float”和“NoneType”的操作数类型不受支持,但是这一行代码并没有错误,GitHub下载了教学的代码,也可以顺利运行。经过从后往前的一步步排查,发现是定义模型参数时犯了个小错误:
#定义模型参数
num_inputs, num_outputs, num_hiddens = 784, 10, 256
W1 = torch.tensor(np.random.normal(0, 0.01, (num_inputs,num_hiddens)),dtype=torch.float)
b1 = torch.zeros(num_hiddens, dtype=torch.float)
W2 = torch.tensor(np.random.normal(0, 0.01,(num_hiddens,num_outputs)),dtype=torch.float)
b2 = torch.zeros(num_outputs, dtype=torch.float)
params = [W1, b1, W2, b2]
for params in params:
params.requires_grad_(requires_grad=True)
最后两行的param多打了一个s,是低级失误,但是不知道会以这种形式报错。
修改为:
params = [W1, b1, W2, b2]
for param in params:
param.requires_grad_(requires_grad=True)
运行后正常输出:
在学习过程中对每行代码的具体含义并不是很了解