ignore_index表示计算交叉熵时,自动忽略的标签值,example:
import torch
import torch.nn.functional as F
pred = []
pred.append([0.9, 0.1])
pred.append([0.8, 0.2])
pred = torch.Tensor(pred).view(-1, 2)
label = torch.LongTensor([[1], [-1]]) # 这里输出类别为0或1,-1表示不参与计算loss。且计算平均loss的时候,reduction只计算实际参与计算的个数,这里相当于batchsize=2,但其中第index=1行为-1不参与计算loss。
#out = F.cross_entropy(pred.view(-1, 2), label.view(-1, ))
out = F.cross_entropy(pred.view(-1, 2), label.view(-1, ), ignore_index=-1)
print(out)