2020-03-30~04-05 论文笔记

Effective Search of Logical Forms for Weakly Supervised Knowledge-Based Question Answering

基于知识的问题解答(KBQA)的许多算法都依赖于语义分析,这会将问题转换为逻辑形式。当仅提供弱监督时,通常需要搜索有效的逻辑形式以进行模型训练。但是,一个复杂的问题通常会涉及巨大的搜索空间,这会产生两个主要问题:1)受计算时间和内存限制的解决方案通常会降低搜索的成功率,以及2)搜索结果会降低训练数据的质量。这两个问题导致了语义训练模型的训练不足。在这项工作中,我们提出了一种基于对问题的算子预测的弱监督KBQA的有效搜索方法。通过受预测的运算符约束的搜索空间,可以探索足够的搜索路径,可以推导更有效的逻辑形式,并且可以避免可能引起虚假逻辑形式的运算符。结果,在弱监督训练集中的大部分问题都配备了逻辑形式,而生成的可疑逻辑形式更少。这样高质量的训练数据直接有助于建立更好的语义解析模型。在最大的KBQA数据集之一(即CSQA)上的实验结果证明了我们方法的有效性:就总分而言,将精度从67%提高到72%,召回率从67%提高到72%。


整体架构

本文的做法就是,对于只有问题和答案的训练集,通过搜索一个被缩小的逻辑形式空间,来找到一个合适的逻辑形式作为训练数据,然后进行KBQA的训练。
我们提出了一种新的方法,通过对弱监督的KBQA任务的操作员预测来有效搜索逻辑形式,该方法为下游问题向逻辑形式的翻译模型训练提供了充足且优越的数据,并使训练和推理在以下情况下更有效 可能的操作员的约束。 所提出的方法简单有效,具有很大的实际应用价值。 实验结果证明了我们方法在减少虚假逻辑形式,提高搜索成功率,提高搜索效率以及提高最终答案准确性方面的有效性。

Weakly Supervised Multi-task Learning for Semantic Parsing

语义解析是一项具有挑战性且重要的任务,旨在将自然语言的感知转换为逻辑形式。现有的神经语义解析方法主要使用<问题,逻辑形式>(Q-L)对来训练序列到序列模型。但是,现有Q-L标记数据的数量有限且难以获得。我们提出了一种有效的方法,该方法充分利用了来自其他任务的标签信息来增强语义解析器的训练。我们设计了一个多任务学习模型来训练问题类型分类,实体提及检测以及使用共享编码器的问题语义解析。我们提出了一种弱监督学习方法,以基于短语的问题应该具有相同的逻辑形式和问题类型信息的思想来增强使用短语数据的多任务学习模型。最后,我们将弱监督的多任务学习方法集成到编码器-解码器框架中。在新构建的数据集和ComplexWebQuestions上进行的实验表明,我们提出的方法优于最新方法,这证明了我们方法的有效性和鲁棒性。
主要的方法就是使用多任务学习来解决标签不够的问题。
在本文中,我们提出了一种用于语义解析的弱监督多任务学习方法。 我们设计了一个多任务架构,该架构将问题类型和提及标记信息合并到语义解析器中。 为了进一步提高模型的性能和一致性,我们提出了一种弱监督的方法来增强我们的多任务学习模型。 在两个数据集上的实验表明,我们的多任务学习体系结构显着提高了基线方法的性能。 此外,我们提出的弱监督学习机制有效地提高了多任务学习模型的性能。

Weakly Supervised Semantic Parsing with Abstract Examples

从弱监督(符号)而不是强监督(程序)训练语义解析器会使训练变得很复杂,有两种方式。首先,在训练时需要探索大量的潜在节目,以找到正确的节目。其次,偶然导致正确命名的虚假程序会给训练增加噪音。在这项工作中,我们提出,在具有清晰语义类型的封闭世界中,人们可以通过使用抽象表示来显着缓解这些问题,在抽象表示中,语言表达和程序中的标记都被提升为抽象形式。我们证明了可以用一些词汇规则来定义这些抽象,并且它们导致了不同示例之间的共享,从而减轻了训练中的困难。为了测试我们的方法,我们开发了第一个用于CNLVR的语义解析器,这是一个具有挑战性的视觉推理数据集,其中的搜索空间很大,克服虚假性至关重要,因为表示法为TRUE或FALSE,因此是随机程序可能会导致正确的表示方式。我们的方法大大提高了性能,达到了82.5%的准确度,与迄今为止报告的最佳准确性相比,绝对准确度提高了14.7%。


overview

在这项工作中,我们以结构化表示作为输入,提出了第一个CNLVR数据集的语义解析器。我们的主要见解是,在封闭的,类型良好的域中,我们可以生成抽象的示例,这些示例可以帮助解决从延迟的监督训练解析器的难题。首先,我们使用抽象示例半自动生成有助于热启动我们的参数的发声程序对,从而减少了寻找具有随机参数的正确程序的艰巨搜索挑战。第二,我们专注于示例的抽象表示,它使我们能够通过在不同示例之间共享有关有前途的程序的信息来解决虚假情况并减轻搜索。我们的方法极大地提高了CNLVR的性能,建立了新的技术水平。在本文中,我们使用了手动构建的高精度词典来构建抽象示例。这适用于类型良好的域,这些域在虚拟助手用例中无处不在。在未来的工作中,我们计划扩展这项工作,并自动学习这样的词典。这可以减少人工工作,并扩展到语言方面存在很大差异的更大范围。

你可能感兴趣的:(2020-03-30~04-05 论文笔记)