知识图谱内容梳理

一.《面向知识图谱构建的知识验证方法研究》的阅读笔记

 读文献后的笔记,方便自己记录。

读面向知识图谱构建的知识验证方法研究 - 豆丁网 (docin.com)


1.1 需要了解的知识点:

1.搜索引擎的工作原理是:采用制定好的搜索策略,通过用户搜索词自动生成搜索的计算机程序。

字符串匹配查询:

语义搜索:

2.PageRank算法对搜索出相关信息进行筛选和处理,快速返回与搜索词最相关网页

3.语义网

4.知识图谱能让搜素引擎更能理解查询词语义

5.NELL,TextRunner不断从web抽取出新的知识来构建知识库。NELL,OPENIE这些是信息技术抽取技术以及

6.知识验证:

7.实体解析:两个实体是否只想真实世界同一个对象(多数据源)

8.实体解释的研究方向就两个:(1)面对数据源采用实体解析技术时,如何有效避免实体之间匹配的指数式增长 (2)尽量减少对训练数据集的高度依赖,开发无监督学习的试题解析模型

9.实体解析模型:Fellegi-Sunter,通过匹配实体的属性集计算两个实体相似度得分(匹配决策)

10.权重的实体解析技术,大数据MapReduce框架和两层相关性聚类。

11.Singla等人提出了一整套的实体解析模型,基于马尔科夫逻辑网,通过构建带有权重一阶逻辑规则与搞笑的推理算法实现实体解析过程。

12.MLNs的推理以及学习的性能

13.shuangpu Jiang提出了MLNS模型对NELL系统抽取出来的新知识进行验证,根据权重去验证。

14.Namata等人突出 实体关系预测。

15.Memory等人提出构建概率软逻辑模型,选择可信度更高的知识集。

16.贝叶斯方法的知识验证,主要解决面向多数据源知识融合时选取最正确知识问题

17.基于贝叶斯概率图模型来计算真是可信度

18.ETCLBoot算法

19.实体解析和知识验证模型构建

1.2 相应的架构

知识图谱内容梳理_第1张图片

 

知识图谱内容梳理_第2张图片

知识图谱内容梳理_第3张图片

 

知识图谱内容梳理_第4张图片

 

相似度:比较相似程度(去重)。 合并过程。

二.实践的流程

图谱(0-1)生产过程:

1.调研实体(对应关系,属性),架构设计(确定实体的结构)

2.数据获取 (实体识别,意图识别)

3.数据清洗,数据对比(整理成想要的三元组)     缺失项的处理:数值型(有算法)

4.数据入库(将数据存入到图谱数据库中)

5.知识图谱的更新迭代

应用过程

1.根据不同的业务场景,对数据库的数据做一些索引

2.实体识别,意图识别应用于 聊天机器人

3.关系的推理过程

数据清洗预处理的项

知识图谱的数据库:neo4j,gr,快速入门:将 Gremlin API 与 Python 配合使用 - Azure Cosmos DB | Microsoft Learn

上面的内容根据面向知识图谱构建的知识验证方法研究 - 豆丁网 (docin.com)

你可能感兴趣的:(Knowledeg,Graph,知识图谱,人工智能)