解决报错:RuntimeError: one of the variables needed for gradient computation has been modified by an inpl

今天在使用pytorch做图像分割中遇见了报错:RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation: [torch.cuda.FloatTensor [4, 64, 350, 450]], which is output 0 of ReluBackward0, is at version 3; expected version 1 instead. Hint: enable anomaly detection to find the operation that failed to compute its gradient, with torch.autograd.set_detect_anomaly(True).在这记录一下解决方法

首先理解一下报错的意思:就是pytorch在进行梯度计算的时候所需的变量已被修改了,导致无法进行梯度的计算。

这个报错的解决很简单,就是找你模型代码中含有a+=b,a*=b,a-=b改为a = a+b,a = a*b,a = a-b就可以了

为什么要这么改,其原因是python本身的问题。
先看下面的代码截图,你就会明白其中的原因了:

b = 2
id(b)
Out[4]: 2298269821264
b += 1
id(b)
Out[6]: 2298269821296
b = b+1
id(b)
Out[8]: 2298269821328

根据上面的代码可以知道无论是a+=b或者是a = a+b,都会创建一个新的对象,并未这个新的对象分配地址
对于 int、float、char、string数据类型都是上述情况

b = [0]
id(b)
Out[10]: 2298871691776
b += [2]
id(b)
Out[12]: 2298871691776
b = b+[2]
id(b)
Out[14]: 2298871786368

但是对于列表来说a+=b是未创建新的对像,对于a = a+b来说就是创建了新的对象。

对于pytorch中的张量和python中的列表一样,使用了a+=b是在原张量上进行的数据的操作,而a = a+b则是创建了一个新的对象,所以在梯度计算的时候我们需要创建一个新的对象来存储操作之后的新数据。

你可能感兴趣的:(pytorch,python)