中文文本数据逻辑性分析库

项目作者:刘焕勇

项目地址: 

https://github.com/liuhuanyong/ComplexEventExtraction

项目介绍

原始项目名为ComplexEventExtraction,即中文复合事件抽取,包括条件事件、因果事件、顺承事件、反转事件。个人觉得可以用于识别文本中是否存在逻辑表达,统计文本中的各种逻辑表达的句子数。

事件类型

项目地址https://github.com/liuhuanyong/ComplexEventExtraction 项目介绍很详细,感兴趣的一定要去原项目看一下。

中文文本数据逻辑性分析库_第1张图片

如果我会知识图谱(比如社交网络分析)可视化技能,就能根据分析出的条件、因果、顺承、反转的数据结构,可视化一段文本的知识图谱。图片是刘焕勇别的项目绘制出来的。

1、反转事件图谱

中文文本数据逻辑性分析库_第2张图片

2、条件事件图谱

中文文本数据逻辑性分析库_第3张图片

安装方法

项目地址

https://github.com/liuhuanyong/ComplexEventExtraction 

项目介绍很详细,感兴趣的一定要去原项目看一下。

^_^这是大邓封装的库,可以命令行安装

pip3 install https://github.com/thunderhit/eventextraction/archive/master.zip

使用

3.1 主函数

from eventextraction import EventsExtraction
extractor = EventsExtraction()
content = '虽然你做了坏事,但我觉得你是好人。一旦时机成熟,就坚决推行'
datas = extractor.extract_main(content)
print(datas)

运行结果

[{'sent': '虽然你做了坏事,但我觉得你是好人', 'type': 'but', 'tuples': {'pre_wd': '虽然', 'pre_part': '你做了坏事,', 'post_wd': '但', 'post_part ': '我觉得你是好人'}},
{'sent': '一旦时机成熟,就坚决推行', 'type': 'condition', 'tuples': {'pre_wd': '一旦', 'pre_part': '时机成熟,', 'post_wd': '就', 'post_part ': '坚决推行'}}]

3.2  统计

from eventextraction import EventsExtraction
extractor = EventsExtraction()
content = '虽然你做了坏事,但我觉得你是好人。一旦时机成熟,就坚决推行'
datas = extractor.extract_main(content)
print(extractor.stats(datas))

运行结果

{'but': 1, 'condition': 1, 'seq': 0, 'more': 0, 'other': 0}

近期文章

Python核心技术与实战

Python全栈-60天精通之路

Python网络爬虫与文本数据分析

Python数据分析相关学习资源汇总帖

漂亮~pandas可以无缝衔接Bokeh

综述:文本分析在市场营销研究中的应用

Lazy Prices公司年报内容变动碰上股价偷懒

用python帮你生产指定内容的word文档

2020年B站跨年晚会弹幕内容分析

YelpDaset: 酒店管理类数据集10+G

NRC词语情绪词典和词语色彩词典

Loughran&McDonald金融文本情感分析库

中文文本数据逻辑性分析库_第4张图片

你可能感兴趣的:(中文文本数据逻辑性分析库)