ATOMIC:An Atlas of Machine Commonsense for If-Then Reasoning

AAAI 2019.2

简单介绍

包含87万条推理常识的知识图谱,和基于本体论分类条目的kg相比,这个知识库专注于“如果…那么…”关系的知识。

9种类型的因果联系来区分原因-效果、主体-主题、自愿-非自愿、行动-心理状态。

通过生成式训练,模型可以从kg中获取简单的常识推理能力。

构建这个常识kg的动机

人类在观察事件的一个小片段时,能够轻松地推理出事件的前因后果。

(图片的呈现信息,是一个人;而一段话的呈现信息,似乎不是很够。所以如果能够像人一样知道前因后果,相当于可以根据一段文字推理出内容,形容一个生动的故事。)

比如:事件“x防御了y的攻击”,我们能够马上推理出

x的动机是“保护自己”、

x这么做的先决条件是接受了一定的防身技巧、

x可能的特点是强壮勇敢。

事件的结果可能是:

x会感觉生气并报警、

y可能会觉得害怕并想要逃走。

形象的表达

正是由于人类具备常识推理的能力,才能通过一部2个小时的电影理解一个长达几个月的故事。而这种能力对于当代的AI系统而言则是欠缺的,因为这些系统是在任务驱动的数据集上训练的,没怎么接触过常识。所以作者提出了ATOMIC常识图谱,目标是做到大规模、高覆盖和高质量。

架构

3大类型组成的9个关系和877k的(事件、关系、事件)三元组构成。分别是:

  1. 事件导致心理状态:(同 event2mind)

    1. x intent:x为什么想发起这次事件
    2. x reaction:x在此次事件之后的感受
    3. other reaction:其他人在这次事件之后的感受
  2. 事件导致事件

    1. x need:x需要干什么才能导致这次事件
    2. effect on x:这次事件对x的影响(和x reaction 有点像,区别在于心理状态和事件)
    3. x want:x在这次事件之后想干什么
    4. other want:其他人在这次事件之后想干什么
    5. effect on other:这次事件对其他人的影响
  3. 事件导致表象人格(事件发生后别人是如何看待该主体的,比如x报警则别人会认为x是一个负责懂法的人)

    1. x attribute:别人会如何看待x

以上层级也可以通过另一个层级结构来描述:

  1. causes、agent: x intent、x need
  2. effects、agent:effect on x、x want、x reaction
  3. effects、theme:other reaction、other want、effect on other
  4. stative:x attribute

这种层级结构主要关注原因、效果和状态。每个分类又可以根据推理发生在主体(自己)还是主题(他人)继续划分。

标注完成后的知识库一共含有300k个节点,24k个事件。

标注结果的内部一致率是86%。

自动生成

拿80%的数据训练一个seq2seq生成模型,去测试集上生成9个关系,用bleu或人工判断生成的效果如何。由于这些关系有层级结构,所以衍生出在同一个大类中复用同一个encoder,针对小类采用不同的decoder的各种模型变种。

人工评测结果,大部分关系的准确率在50%左右。

资料

论文概要:原子因果常识图谱
论文全文、数据、demo、slide

你可能感兴趣的:(论文,知识图谱)