NLP-实体&关系联合抽取-2022:UIE(通用信息抽取模型)【Prompt第四范式】【信息抽取{实体关系抽取、中文分词、精准实体标。情感分析等}、文本纠错、问答系统、闲聊机器人、定制训练】

论文GitHub源码

UIE(Universal Information Extraction):Yaojie Lu等人在ACL-2022中提出了通用信息抽取统一框架UIE。该框架实现了实体抽取、关系抽取、事件抽取、情感分析等任务的统一建模,并使得不同任务间具备良好的迁移和泛化能力。为了方便大家使用UIE的强大能力,PaddleNLP借鉴该论文的方法,基于ERNIE 3.0知识增强预训练模型,训练并开源了首个中文通用信息抽取模型UIE。该模型可以支持不限定行业领域和抽取目标的关键信息抽取,实现零样本快速冷启动,并具备优秀的小样本微调能力,快速适配特定的抽取目标。

NLP-实体&关系联合抽取-2022:UIE(通用信息抽取模型)【Prompt第四范式】【信息抽取{实体关系抽取、中文分词、精准实体标。情感分析等}、文本纠错、问答系统、闲聊机器人、定制训练】_第1张图片
UIE的优势

  • 使用简单:用户可以使用自然语言自定义抽取目标,无需训练即可统一抽取输入文本中的对应信息。实现开箱即用,并满足各类信息抽取需求。
  • 降本增效:以往的信息抽取技术需要大量标注数据才能保证信息抽取的效果,为了提高开发过程中的开发效率,减少不必要的重复工作时间,开放域信息抽取可以实现零样本(zero-shot)或者少样本(few-shot)抽取,大幅度降低标注数据依赖,在降低成本的同时,还提升了效果。
  • 效果领先:开放域信息抽取在多种场景,多种任务上,均有不俗的表现。

参考资料:
起底NLP“大一统”模型:UIE统一信息抽取框架背后的技术本质、收益辨析及几点思考
综述|信息抽取的"第二范式"
GitHub:通用信息抽取 UIE(Universal Information Extraction)
PaddleNLP通用信息抽取技术UIE【一】产业应用实例:信息抽取{实体关系抽取、中文分词、精准实体标。情感分析等}、文本纠错、问答系统、闲聊机器人、定制训练
PaddleNLP–UIE(二)–小样本快速提升性能(含doccona标注)
uie模型微调个人总结
信息抽取新SOTA: UIE–首个结构化生成式信息抽取预训练语言模型,一统信息抽取四大任务
信息抽取大一统:百度中科院发布通用抽取模型UIE,刷新13个IE数据集SOTA!
PaddleNLP之UIE信息抽取小样本进阶(二)[含doccano详解]

你可能感兴趣的:(#,中文分词,人工智能,自然语言处理)