一个刷新认知的信息抽取开源工具 实体抽取

信息抽取是一个行业应用价值很高的技术,却因为任务难度大,落地成本居高不下。

像金融、政务、法律、医疗等行业,有大量的文档信息需要人工处理,比如政务人员处理市民投诉,工作人员需要从中快速提取出被投诉方、事件发生地点、时间、投诉原因等结构化信息,非常费时费力。若信息抽取技术能低成本、高性能的实现落地,可以大大提升诸多行业的生产效率,节约人力成本。

如今这个想法,迎来了史无前例的可能性。

话不多说,直接上代码,上效果!

可以抽取时间 时间名称 人物地点等 !!

配库

pip install paddlenlp -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn

代码:

from pprint import pprint
from paddlenlp import Taskflow
#pip install paddlenlp -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn
#pip install --user jupyterlab -i https://pypi.tuna.tsinghua.edu.cn/simple

schema = ['时间', '选手', '赛事名称'] # Define the schema for entity extraction
ie = Taskflow('information_extraction', schema=schema)
pprint(ie("2月8日上午北京冬奥会自由式滑雪女子大跳台决赛中中国选手谷爱凌以

你可能感兴趣的:(自然语言处理-nlp-NLP,python,自然语言处理,命名实体识别,信息抽取,事件抽取)