JSON-LD 和知识图谱

JSON-LD 正式推荐标准2020年7月发布

2020年7月16日,W3C JSON-LD 工作组发布三份正式推荐标准(W3C Recommendation):

  • JSON-LD 1.1 语法(JSON-LD 1.1)定义了一种基于 JSON 的格式来序列化关联数据。该语法的目的是轻松地集成到已经使用 JSON 的部署系统中,并提供从 JSON 到 JSON-LD 的平滑升级路径。它主要支持在基于 Web 的编程环境中使用关联数据,创建可互操作的 Web 服务,并且能够在基于 JSON 的存储引擎中存储关联数据。

  • JSON-LD 1.1 处理算法和 API(JSON-LD 1.1 Processing Algorithms and API)定义了一组用于 JSON-LD 文档编程转换的算法。根据已定义的转换进行重组数据通常会极大地简化其使用。此外,该文档还为开发者提出了一个应用编程接口(API)。

  • JSON-LD 1.1 框架(JSON-LD 1.1 Framing)允许开发人员通过示例查询并强制将特定的树布局添加到 JSON-LD 文档中。

JSON是一种用于表示Web对象的简单语言。链接数据(Linked Data)是一种描述不同文档或网站上的内容的方法。Web资源是使用IRI描述的,通常是可取消引用的实体,可用于查找更多信息,从而创建“知识网络”。JSON-LD旨在成为一种简单的发布方法,不仅可以表达JSON中的链接数据,还可以向现有JSON添加语义。

已经有多种主流语言支持:

  • java
  • python
  • javascript
  • PHP等

JSON-LD表示和存储知识

JSON-LD开始是用于表示网页的内容和层次化的嵌套的结构,是一种资料模型。个人不准确的理解,之后这种能力被用来定义语义网络,逐渐延伸到知识图谱应用。

知识图谱的知识,通常有两类表示模型:

  1. <源实体-关系-目标实体> 模型
  2. <实体-属性-属性值> 模型

两种都可以表示为三元组,采用图结构存储:

  • 节点:储存“实体”,和“属性值”
  • 边 :储存“关系”,和“属性”

知识图谱的四种存储格式:

  1. N-Triples (.nt) :每行一个三元组,实体、关系都是最完整的格式
  2. Turtle (.ttl) :在开头先定义了前缀,三元组要短很多
  3. JSON-LD (.json) :即本次发布的标准,包含层次化的可嵌套结构
  4. RDF/XML (. RDF),或RDFa :全称(RDF attribute),设计提供了一套属性,可以用于在XML(及其方言,也包括HTML)中携带元数据。可以等价表示层次化的可嵌套结构。

可见,利用JSON-LD可以:

  • 存储和表示三元组形式的知识,以及多个三元组组成的知识
  • 输出为网页的元数据,优化SEO,百度、google都支持
  • 支持网页关系的深入搜索,以及基于搜索的推理

进一步,JSON-LD可以作为知识图谱的输入、输出形式,与图数据库一起作为知识计算的载体,承载知识计算。

你可能感兴趣的:(AI和KBQA)