梯度反转层(Gradient reversal layer, GRL)

GRL作用:将传入到GRL的梯度乘上一个负数,使得在GRL前后的网络的训练目标是相反的。在接入GRL以后,特征提取器就会有两个目标需要满足,第一是特征提取器需要生成能够预测出正确标签的特征,第二是i特征提取器提取的特征需要尽可能无法判断出来自哪个任务域。

如果没有接入GRL,任务判别器的优化目标是尽可能区分出特征提取器提取出来的特征是来自目标域还是源域,特征提取器优化目标是尽可能生成易于区分是来自于哪个域的特征。他们优化目标相同。

加入梯度反转层后,特征提取器的优化目标就会与任务判别器的优化目标相反,优化目标变成了需要生成尽可能无法判断来自于那个任务域的特征。

GRL在正向传播中,实现一个恒等变换,在反向传播过程中,是让梯度用了负的系数,再往上一层传播。

你可能感兴趣的:(python,自然语言处理,pytorch)