基于深度学习的实体关系抽取

本项目针对舆情食品安全领域进行实体关系的抽取,工程主要分为爬虫、数据清洗、数据标注、模型的训练、模型的预测,关系抽取采用的是TextCNN。下面介绍下工程的开发逻辑。

1、介绍下整体的工程架构

基于深度学习的实体关系抽取_第1张图片

2、介绍下爬虫和数据处理部分,都放在data目录下面:

基于深度学习的实体关系抽取_第2张图片

3、针对清洗后的数据,需要进行数据的标注,后面提供给深度学习模型训练:

基于深度学习的实体关系抽取_第3张图片

4、定义CNN模型网络结构:

基于深度学习的实体关系抽取_第4张图片

5、进行模型的训练,最终的准确率在训练集和测试集上达到75到80左右

基于深度学习的实体关系抽取_第5张图片
6、模型的预测结果如下所示:
基于深度学习的实体关系抽取_第6张图片
总结:从从抽取结果看,效果是可以的,需要数据集的可以邮我:[email protected],欢迎三连呀!后面会有更多落地的NLP实战。欢迎关注公众号(微信搜索公众号即可,不定期推送干货喔):知识图谱NLP

你可能感兴趣的:(机器学习,人工智能,深度学习)