KGQA概览

符号说明

符号 说明 备注
E \mathcal{E} E 所有实体的集合
L \mathcal{L} L 所有literal值的集合 三元组(姚明,身高,2.26m)中的2.26m就是literal,它不算实体。
P \mathcal{P} P 所有关系的集合 关系既可以是连接两个实体的关系,如国籍,也可以连接实体和literal之间的关系,如上一行所示。
t t t t ∈ E × P × ( E ∪ L ) t\in \mathcal{E}\times\mathcal{P}\times(\mathcal{E}\cup\mathcal{L}) tE×P×(EL) t t t代表一个事实三元组,三元组指的就是(实体,关系,实体(或者是literal))
K \mathcal{K} K 所有三元组的集合 K \mathcal{K} K就是知识图谱
q q q 自然语言表达的句子 也就是用户的query
A \mathcal{A} A 所有答案的集合 答案指的就是q对应的答案,包含三部分:(1)所有的实体、加上所有的literal;(2)所有聚集函数的计算结果;(3){True,False}。聚集函数的计算结果指的是形如:“成龙主演了多少部电影” 这句话,答案应该是sum成龙主演的所有电影(注:每一个电影在KG中是一个实体)。
F \mathcal{F} F 所有的formal queries的集合 formal query指的是形如SPARQL这种可以查询、操控知识图谱的语言。KGQA的做法就是将q解析成对应的formal query,进而从KG中找出答案
a ∈ A , f ∈ F a\in \mathcal{A},f\in \mathcal{F} aAfF 单个答案、单个formal query 举例:q=“What is the birthplace of Westworld’s writer?”,那么对应的SPARQL语句 f f f=“SELECT ?uri WHERE {?x ex:writer ex:Westworld.?x ex:bornIn ?uri}”,对应的答案 a a a=“Chicaga”。

语义解析(Semantic parser)

KGQA就是一个语义解析任务,将用户问题q解析成对应的formal query。

Full supervised vs weak supervised

Full supervised

完全监督形式的KGQA。完全监督指的是数据集中每一个样本包含三部分:(q、 f f f a a a),形如:
KGQA概览_第1张图片

Weak supervised

弱监督形式下每一个q没有对应的 f f f

流程

如下图所示,测试集中的一个问题:“我是李小龙是哪一年出版的?”。
KGQA概览_第2张图片
测试过程是对问题进行语义解析,找出实体I Am Bruce Lee和关系release year。然后到KG中找出三元组(I Am Bruce Lee,release_year, 2012),返回答案。

你可能感兴趣的:(KGQA,知识图谱,人工智能,自然语言处理)