Competent Triple Identification for Knowledge Graph Completionunder the Open-World Assumption

摘要

现有知识图(KGs)的有用性和可用性大多受到限制,因为与现实世界中日益增长的事实相比,知识是不完整的。现有的基于本体的KG补全方法大多基于封闭世界假设,其中KG是固定的。在这些方法中,定义了实体和关系,并且不容易添加新的实体信息。相反,在开放世界的假设中,实体和关系没有预先定义。因此,有很大的空间来寻找新的实体信息。尽管如此,在开放世界假设下的知识获取是具有挑战性的,因为大多数可用的知识都是嘈杂的非结构化文本格式。然而,开放信息提取(OpenIE)系统可以提取三元组,即(头部文本;文本的关系;尾文本),从原始文本没有任何预先指定的词汇。这样的三元组中含有对千克无关紧要的噪声信息,因此,要将这样的三元组用于KG补全任务,需要从提取的三元组集中识别出KG的胜任三元组。在本文中,我们提出了KGs的胜任三重识别(CTID)模型,并提出了两种特征,即基于语法和基于语义的特征,用于从先进的OpenIE系统提取的三重集合中识别胜任三重。我们研究了这两种类型的特征,并测试了它们的有效性。研究发现,在识别胜任组方面,所提特征的性能比ReVerb系统的性能好20%左右。

1.介绍

知识图(KG)是知识库(KB)的多关系有向图表示。在KG中,我们可以用三元组格式表示知识[头实体h,关系r,尾实体t],它表示实体-实体关系。KGs被广泛用于各种与人工智能相关的任务,如网页搜索、问题回答、实体链接和自然语言处理。kg的例子包括Wikidata[1]、Y A G O[2]和Freebase[3]。虽然kg被广泛使用,但随着数据的指数级增长,现有的kg大多是有噪声和不完整的。有关KG的可用知识落后于可用数据,而可用数据正在快速增长。研究人员旨在通过预测实体之间存在的各种关系来提高KG的准确性和可靠性&#

你可能感兴趣的:(知识图谱的文本动态补全,知识图谱,人工智能)