parameters.requires_grad=False :误差仍然反向传播,梯度不更新

首先要明白,误差回传与否,与 requires_grad 的值没有关系,取决于 loss.backward( ) 。

再来看误差回传过程中规定是,parameters的梯度计算关闭。

param.requires_grad = False

我们要知道,param 包括的无非是 权重偏置值

而权重和偏置值的偏导值是多少并不影响误差反向传播,误差反向传播主干部分计算的是每一层激活前神经元的偏导值。

综上:

param.requires_grad = False 不影响误差反向传播的正常进行,但是权重和偏置值不更新了。

用法:冻结参数,不参与反向传播,具体实现是将要冻结的参数的requires_grad属性置为false,然后在优化器初始化时将参数组进行筛选,只加入requires_grad为True的参数

cnn = CNN() #构建网络
 
for n,p in cnn.named_parameters():
    print(n,p.requires_grad)
    if n=="conv1.0.weight":
        p.requires_grad = False
 
optimizer = torch.optim.Adam(filter(lambda p: p.requires_grad,cnn.parameters()), lr=learning_rate)

你可能感兴趣的:(机器学习,ML)