知识图谱学习笔记七(语义搜索)

语义搜索

         背景:互联网从仅包含网页和网页之间超链接的文档万维网转变成包含大量描述各种实体与实体之间丰富关系的语义万维网。以谷歌为代表的各大搜索引擎公司通过构建知识图谱来改善搜索质量,从而开启了语义搜索之路。

      文档检索与语义检索的不同:语义搜索是需要处理更细粒度的结构化语义数据。

      语义搜索系统基本框架:查询构建、查询处理、结果展示、查询优化、语义模型、资源及文档等。

结构化的查询语言

         语义搜索的核心关键在于查询的构建和理解。查询语言:SPARQL语言。

          SELECT : 返回知识图谱中图模式匹配具体结构给用户的形式。

          ASK:主要用于测试知识图谱中是否存在满足给定查询约束条件的数据。

          CONSTRUCT:主要用于将图模式匹配结果生成新的RDF图。

          DESCRIBE:用于查询与指定IRI相关的数据。

          INSERT:  将新的RDF三元组插入已有的RDF图中。

          DELETE:将RDF图中已有的某些三元组删除。

语义数据搜索

         链接数据比较成熟的语义搜索主要包括:面向本体的搜索引擎、面向实体的搜索引擎、面向细粒度数据Web的搜索引擎。

        以上的搜索引擎均包括:三元组存储、索引构建、查询处理及排序等

语义搜索的交互范式

         该范式是为了用户直观的、透明的、易用的方式对数据进行查询与浏览。

        常见的交互范式主要包括:关键词查询、自然语言查询、分面查询、表单查询、可视化查询以及混合方式查询等。

      基于关键词的知识图谱语义搜索方法

            1.基于关键词直接在知识图谱搜索答案

                     该查询的关键在于索引的创建,索引方式:关键词倒排索引、摘要索引、路径索引

            2.基于关键词生成结构化的查询

                     该查询主要包括三个步骤:关键词映射、候选结构化查询构建、候选结构化查询排序

      基于分面的知识图谱语义搜索

              分面可理解为是一种属性或者一组分类体系;

      基于表示学习的知识图谱语义搜索

            利用表示学习技术改善语义搜索质量,通过机器学习技术将知识图谱中的实体与关系映射到连续低维的向量空间中,同时保持原有知识图谱的基本结构与性质。

开源工具实践

       Elasticsearch搭建一个简易的实体语义搜索引擎。

        

你可能感兴趣的:(人工智能,知识图谱)