NLP科普文1——应用场景

NLP(自然语言处理)分为2类:自然语言理解(NLU)和自然语言生成(NLG)。

自然语言理解(NLU)包括:文本分类、序列标注、信息抽取等任务。

自然语言生成(NLG)包括:机器翻译、对话问答系统、自动摘要等。

NLG应用场景

自动摘要

形式:给定输入的文本,输出包含输入文本关键判决信息的摘要内容。

要点:

1)模型自动生成的内容完整且精确的覆盖了原文关键信息

2)生成的内容通顺流畅

具体应用产生场景如:文章摘要生成,会议纪要生成,法律/金融(专业领域)的长文档摘要生成。


相似问生成

形式:模型针对输入问句,生成多条意思相近的问句。

一般是对有标注的数据进行语义相似度的训练。所以此解决的是“没有相关标注数据”的新场景。

一般有两种方式:1)零样本学习;2)自然语言生成技术扩充标注数据。


相似度由大到小排列。可看出,相似度最大的句子完全保留了原句的含义,较小的句子开始出现语义的发散。在实际使用中,可通过控制相似度的值来调整被选用的生成句子的多样性。

可控条件文本生成

对生成文本的感情控制、风格切换。

1)风格切换

形式:通过控制风格标签,模型可以按照原本的标题句式生成出指定语境的标题。

示例:

用新闻标题作为输入,而其对应的新闻分类作为控制条件。

2)感情控制

形式:感情迁移,目标是让模型转换输入文本的感情极性。

示例:

模型能很好地保留原本的句式结构和关键信息,但改变句子的感情极性

数学表达式生成

除了文本,还可以生成代码、SQL、数学表达式。

生成模型能够将简单的数学应用题转化为数学表达式

看图说话

形式:输入图片,输出一段描述图片的文本内容。


待补充。


学习参考:
NLG技术:文本生成技术多样化应用的探索之路https://mp.weixin.qq.com/s/tQ1dHjNnTQTfy7TyxA5Skg

你可能感兴趣的:(NLP科普文1——应用场景)