融合多源信息的知识表示学习方法

融合多源信息的知识表示学习方法_第1张图片

公众号 系统之神与我同在

近年来,基于深度学习的表示学习方法在语音识别、图像分析和自然语言处理领域获得了广泛的关注。表示学习旨在将研究对象的语义信息表示为稠密低维实值向量,在该低维向量空间中,两个对象的距离越近则说明其语义相似度越高。而知识表示学习,顾名思义,是面向知识库中的实体和关系进行表示学习。该方向最近取得了重要进展,可以在低维空间中高效计算实体和关系的语义联系,有效解决数据稀疏问题,使知识获取、融合和推理性能得到显著提升。
融合多源信息的知识表示学习方法_第2张图片
融合文本和知识图谱的知识学习表示方法:

如果仅仅利用知识图谱的三元结构信息进行表示学习,数据稀疏问题严重,尚有大量与知识有关的其他信息没有得到有效利用。可以从两个方向解决这个问题:1.利用知识库中的其他信息,如实体和关系的描述信息等。2.利用知识库外的海量信息,如互联网文本等包含大量与知识库实体和关系有关的信息。

融入文本描述的优势:

1.可以发掘实体间的语义相关性,精确的语义表述能够提升三元组的可区分性。
2.可以解决zero-shot问题。

实体的描述文本:

将所有三元组的“属性-属性值”或“关系-实体提及”都拼成一个字符串,当作该实体的文本描述。由于 type 字段,义项描述和摘要字段的信息更重要,描述文本中都按照 type、义项描述、摘要和其他三元组的顺序进行拼接。
融合多源信息的知识表示学习方法_第3张图片
融合多源信息的知识表示学习方法_第4张图片
融合多源信息的知识表示学习方法_第5张图片
融合文本和知识图谱的知识表示学习方法可以做到:

1.得到实体向量
2.得到词向量
3.词向量和实体向量之间可以计算相似度
4.实体向量和实体向量之前可以计算相似度

融合多源信息的知识表示学习方法_第6张图片

知识表示学习的应用:
实体链接中的应用:

实体链接,就是把文本中的实体指称链接到知识图谱对应的实体上的任务。

Knowledge Graph(知识图谱):一种语义网络,旨在描述客观世界的概念实体及其之间的关系。

Mention(提及、实体指称):自然文本中表达实体的语言片段。

Entity(实体):实体是知识库的基本单元,也是文本中承载信息的重要语言单位,由多个三元组组成。
融合多源信息的知识表示学习方法_第7张图片
难点:

Mention Variations:同一entity有不同的mention。(<李白>:青莲居士、李太白)

**Entity Ambiguity:**同一mention对应不同的entity。(“李白”:王者荣耀中李白的技能;李白和杜甫并称为什么?)
![在这里插入图片描述](https://img-blog.csdnimg.cn/7a6d7bc6bfcf42acbab366e247dba523.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBATmVjdGhlcg==,size_20,color_FFFFFF,t_70,g_se,x_16
融合多源信息的知识表示学习方法_第8张图片

实体推荐中的应用:

实体推荐,就是根据给定的实体,推荐一系列相关实体。
融合多源信息的知识表示学习方法_第9张图片
实体推荐冷启动问题:如何寻找实体的相关实体?

**方案:**通过百科页面、关系三元组、经过实体链接处理的新闻中的共现实体对,经过类别过滤,作为正样本进行训练。
融合多源信息的知识表示学习方法_第10张图片
融合多源信息的知识表示学习方法_第11张图片
知识补全中的应用:

知识图谱补全(Knowledge Graph Completion,KGC)目前主要被抽象成一个预测问题,即预测出三元组中缺失的部分。
融合多源信息的知识表示学习方法_第12张图片
融合多源信息的知识表示学习方法_第13张图片

你可能感兴趣的:(人工智能,自然语言处理,知识表示学习方法)