CONT: Contrastive Neural Text Generation

CONT: Contrastive Neural Text Generation

CONT: Contrastive Neural Text Generation_第1张图片

  1. 首先,CONT使用自己的预测中的负面例子(§3.1)来构建B集。(原因解释:Kalkstein等人[18]指出,使用不同的对比性样本有助于提高模型的泛化能力。因此,我们使用多样化的beam
    search搜索算法[49],从模型lasted
    predictions的top-K列表
    中创建对比性样本,然后将其附加到同批次的样本中,形成对比性样本。)
  2. 第二,CONT用N对对比损失(公式3)代替InfoNCE损失(公式2),该损失利用了由所有配对的序列级分数给出的更精细的监督(公式3.2)。

Given a input sequence x, the ground truth y, and a set of K contrastive samples B = {y1
, y2, · · · , yK},可以构建出多对example pairs. pairs对之间的损失函数如下:

CONT: Contrastive Neural Text Generation_第2张图片

  1. 第三,CONT将学到的相似性函数直接纳入其推理得分(§3.3)。

CONT: Contrastive Neural Text Generation_第3张图片

你可能感兴趣的:(机器学习,python,深度学习)