知识图谱-知识抽取(三):非结构化数据【DeepDive:基于远程监督的“关系抽取”】【斯坦福开发的开源知识抽取系统,通过弱监督学习,从非结构化的文本中抽取结构化的关系数据 】

deepdive是由斯坦福大学InfoLab实验室开发的一个开源知识抽取系统。它通过弱监督学习,从非结构化的文本中抽取结构化的关系数据 。是目前人工智能学习领域的一个热门项目。原文见

http://deepdive.stanford.edu/

一、DeepDive 用来做什么?

DeepDive是一个从暗数据(dark data)中提取价值的系统。

与暗物质(dark matter)一样,暗数据是隐藏在文本、表格、图形和图像中的大量数据,缺乏结构,因此基本上无法通过现有软件处理。

DeepDive通过从非结构化信息(文本文档)创建结构化数据(SQL表)并将这些数据与现有的结构化数据库集成,帮助揭示暗数据。

DeepDive用于提取实体之间复杂的关系,并对涉及这些实体的事实进行推断。

DeepDive帮助用户处理各种各样的暗数据,并将结果放入数据库。

有了数据库中的数据,人们可以使用各种标准工具来使用结构化数据;例如,可视化工具(如Tableau)或分析工具(如Excel)。




参考资料:
DeepDive 简介
Deepdive学习小记(第一节:简介)
deepdive介绍与安装

你可能感兴趣的:(#,KG/构建,人工智能,知识图谱,DeepDive)