知识图谱之知识表示

先上两个狠全面的综述或者叫总结:

  • 《知识表示学习研究进展》
  • 基于翻译模型(Trans系列)的知识表示学习

然后是清华大学开源OpenKE:知识表示学习平台

“表示学习旨在将研究对象的语义信息表示为稠密低维实值向量,知识表示学习主要是面向知识图谱中的实体和关系进行表示学习。使用建模方法将实体和向量表示在低维稠密向量空间中,然后进行计算和推理。”

知识表示的几个代表模型:距离模型、单层神经网络模型、能量模型、双线性模型、张量神经网络模型、矩阵分解模型和翻译模型等。

对常用模型进行简要概括:)

距离模型:

结构表示(structured embedding, SE)将头实体向量Lh和尾实体向量Lr通过关系r的两个矩阵投影到r的对应空间中,然后在该空间中计算两投影向量的距离。这个距离反映了两个实体在关系r下的语义相关度,他们的距离越小,说明两个实体存在这种关系。SE为每个三元组(h, r, t)定义了如下损失函数:

翻译模型:

TransE模型将知识库中的关系看做实体间的某种平移向量(平移不变现象普遍存在于词向量空间,词汇的语义关系和句法关系中)。对于每个三元组(h, r, t),TransE用关系r的向量Lr作为头实体向量Lh和尾实体向量Lt之间的平移,也可以将Lr看作从Lh到Lt的翻译。对于每个三元组(h, r, t),TransE希望,TransE模型定义了如下损失函数,即向量Lh+Lr和Lt的L1或L2距离。在实际学习过程中,为了增强知识表示的区分能力,TransE采用最大间隔方法,定义了如下优化目标函数

---------------------------------------------------------------------------------------------

后续有非常多以TransE为基础的扩展模型,TransH, TransR, TransD ...

具体还是看论文比较好:)

 

你可能感兴趣的:(NLP)