OpenKG数据逐一截图说明

目录

数据格式总览

第一页

OMAHA术语集样例 

webdatacommons数据集

中文症状库 热门

快雨-证券数据api

基于limes的中文知识图谱融合实战演练教程

国内主要中文百科知识图谱之间的链接数据集 热门

中文百科知识图谱Zhishi.me-提供Dump 热门

 Zhishi.me 热门

清华大学-科技知识图谱 热门

北京大学中文百科知识图谱-PKU-PIE 知识库 热门

 

 

中文百科知识图谱-zhOnto-提供Dump 热门

基于CNSchema的城市知识图谱(交通数据) 热门

空气质量语义描述

第二页

OpenStreetMap和Wikidata的实体链接数据集(部分国外区域)

百科人物概念与实例 热门

KG-Buddhism

音乐知识图谱 热门

日本餐厅数据 热门

 

 天气语义数据 热门

XLORE双语百科知识图谱 热门

 影视双语知识图谱 热门

中医医案知识图谱 热门

第三页

YAGO多语言知识库(包含中文) 热门

 

Microsoft Concept Graph

 

城市内涝语义数据 热门

BabelNet-多语言百科字典和语义网络 热门

中国旅游景点知识图谱 热门

人物类RDF知识 热门

疾病术语集 热门

 

 Linked Open Schema

 MulType

观测指标标识符逻辑命名与编码系统 

乳腺癌临床试验语义标注 

 第四页

Music 热门

新三板企业数据

 

突发事件知识图谱 热门

Clinga 热门

Zhishi.lemon

herbnet

 第五页

结论


数据格式总览

OpenKG共有86个数据集。

首先,我们看一下其格式的标签列表。

OpenKG数据逐一截图说明_第1张图片

可能与三元组相关的标签(一个数据集可能有多个标签)的总计数为 51,不算特别多,所以我打算把每个数集看一下,看看有没有 满足大小在 1G-10G

 

所有数据集共有5页。

下面图片中红框为可能符合要求的,其余   绿框内为格式或大小肯定不符合要求的。

第一页

OpenKG数据逐一截图说明_第2张图片

OpenKG数据逐一截图说明_第3张图片

OpenKG数据逐一截图说明_第4张图片

  下面我们一一来看第一页有可能可用的数据集

OMAHA术语集样例 

OpenKG数据逐一截图说明_第5张图片

OpenKG数据逐一截图说明_第6张图片

 下载后发现大小只有15k。

 

webdatacommons数据集

 

OpenKG数据逐一截图说明_第7张图片

没有rdf格式的数据。 

 

中文症状库 热门

OpenKG数据逐一截图说明_第8张图片

进行下载后总大小只有10M

快雨-证券数据api

OpenKG数据逐一截图说明_第9张图片

 

基于limes的中文知识图谱融合实战演练教程

OpenKG数据逐一截图说明_第10张图片

是一个教程,测试数据大小28M。

 

国内主要中文百科知识图谱之间的链接数据集 热门

 

OpenKG数据逐一截图说明_第11张图片

 

OpenKG数据逐一截图说明_第12张图片

上图中可以看到四个文件的大小。

 

中文百科知识图谱Zhishi.me-提供Dump 热门

 OpenKG数据逐一截图说明_第13张图片

大小2.64G

下载解压后打开发现有非常多的压缩文件,数据都压扁了:

OpenKG数据逐一截图说明_第14张图片

OpenKG数据逐一截图说明_第15张图片

打开看文件内容

OpenKG数据逐一截图说明_第16张图片

 Zhishi.me 热门

 

OpenKG数据逐一截图说明_第17张图片

OpenKG数据逐一截图说明_第18张图片

对里面的所有可获取文件进行下载,发现和上一个数据集是一样的。

清华大学-科技知识图谱 热门

OpenKG数据逐一截图说明_第19张图片

 

OpenKG数据逐一截图说明_第20张图片

北京大学中文百科知识图谱-PKU-PIE 知识库 热门

 

OpenKG数据逐一截图说明_第21张图片

OpenKG数据逐一截图说明_第22张图片

 分别点击三个浏览

OpenKG数据逐一截图说明_第23张图片

OpenKG数据逐一截图说明_第24张图片

OpenKG数据逐一截图说明_第25张图片

尝试右击,没有反应

 

 

中文百科知识图谱-zhOnto-提供Dump 热门

基于CNSchema的城市知识图谱(交通数据) 热门

 

OpenKG数据逐一截图说明_第26张图片

数据是按月份归档的,浏览第一个:

OpenKG数据逐一截图说明_第27张图片

 

尝试下载或另存为这个文件,发现是禁止的:

OpenKG数据逐一截图说明_第28张图片

 

空气质量语义描述

OpenKG数据逐一截图说明_第29张图片

除了本体描述都是JSON-LD

 

第二页

http://www.openkg.cn/dataset?_res_format_limit=10&page=2

 

OpenStreetMap和Wikidata的实体链接数据集(部分国外区域)

OpenKG数据逐一截图说明_第30张图片

 

OpenKG数据逐一截图说明_第31张图片

OpenKG数据逐一截图说明_第32张图片

浏览数据集:

OpenKG数据逐一截图说明_第33张图片

发现 subject一直是主语,没有作为object,往下继续浏览这个文件也是。 下面检查一个ttl中的subject是否会是另一个文件的object:

OpenKG数据逐一截图说明_第34张图片

包含的主语有  , 宾语均为属性。

OpenKG数据逐一截图说明_第35张图片

包含的主语有: 包含的主语有  , 实体宾语有

OpenKG数据逐一截图说明_第36张图片

没有实体宾语。

 

OpenKG数据逐一截图说明_第37张图片

至此所有ttl文件,检查完毕,只有sameas 关系连接了两个实体,但是只有一跳。

 

百科人物概念与实例 热门

OpenKG数据逐一截图说明_第38张图片

三个文件加起来不到100M。

 

KG-Buddhism

 

OpenKG数据逐一截图说明_第39张图片

只有API,没有下载,且triple总数为 324,911,非常小。

音乐知识图谱 热门

OpenKG数据逐一截图说明_第40张图片

 

OpenKG数据逐一截图说明_第41张图片

网页数据无法下载或复制,且数据加载很快,估计不超过10M。

 

日本餐厅数据 热门

OpenKG数据逐一截图说明_第42张图片

 

 天气语义数据 热门

OpenKG数据逐一截图说明_第43张图片

浏览第一个,下载下来是owl,且瞬间就下载下来了。

 

XLORE双语百科知识图谱 热门

 

OpenKG数据逐一截图说明_第44张图片

 影视双语知识图谱 热门

 

OpenKG数据逐一截图说明_第45张图片

只有样例数据,尝试进入门户(查询系统),看是否开放源数据:

OpenKG数据逐一截图说明_第46张图片

结果无法访问。

 

中医医案知识图谱 热门

OpenKG数据逐一截图说明_第47张图片

 

OpenKG数据逐一截图说明_第48张图片

OpenKG数据逐一截图说明_第49张图片

该网站不提供下载。

 

第三页

http://www.openkg.cn/dataset?_res_format_limit=10&page=3

YAGO多语言知识库(包含中文) 热门

OpenKG数据逐一截图说明_第50张图片

OpenKG数据逐一截图说明_第51张图片

最后链接到yago官网,yago源数据集都是压扁的,且非常大。

 

Microsoft Concept Graph

OpenKG数据逐一截图说明_第52张图片

 

 

OpenKG数据逐一截图说明_第53张图片

对数据进行下载:

大小为300M

OpenKG数据逐一截图说明_第54张图片

谓语都是数字

 

城市内涝语义数据 热门

 

OpenKG数据逐一截图说明_第55张图片

 

BabelNet-多语言百科字典和语义网络 热门

OpenKG数据逐一截图说明_第56张图片

OpenKG数据逐一截图说明_第57张图片

搜索网站,没有下载。

 

中国旅游景点知识图谱 热门

OpenKG数据逐一截图说明_第58张图片

 

 

人物类RDF知识 热门

OpenKG数据逐一截图说明_第59张图片

OpenKG数据逐一截图说明_第60张图片

文件瞬间打开,且subject不出现在object中。

 

疾病术语集 热门

 

OpenKG数据逐一截图说明_第61张图片

 

 Linked Open Schema

 

OpenKG数据逐一截图说明_第62张图片

 

 

 MulType

 

OpenKG数据逐一截图说明_第63张图片

 OpenKG数据逐一截图说明_第64张图片

 OpenKG数据逐一截图说明_第65张图片

 OpenKG数据逐一截图说明_第66张图片

OpenKG数据逐一截图说明_第67张图片

宾语全部都是属性

观测指标标识符逻辑命名与编码系统 

 

OpenKG数据逐一截图说明_第68张图片

 

乳腺癌临床试验语义标注 

 

OpenKG数据逐一截图说明_第69张图片

OpenKG数据逐一截图说明_第70张图片

 第四页

http://www.openkg.cn/dataset?_res_format_limit=10&page=4

 

Music 热门

11.4M

新三板企业数据

 

OpenKG数据逐一截图说明_第71张图片

点击进去后是API文档:

OpenKG数据逐一截图说明_第72张图片

 

突发事件知识图谱 热门

300kb不到

Clinga 热门

OpenKG数据逐一截图说明_第73张图片

 

OpenKG数据逐一截图说明_第74张图片

OpenKG数据逐一截图说明_第75张图片

OpenKG数据逐一截图说明_第76张图片

OpenKG数据逐一截图说明_第77张图片

OpenKG数据逐一截图说明_第78张图片

 详细阅读文件后,找不到多跳关系。

 

Zhishi.lemon

OpenKG数据逐一截图说明_第79张图片

 

跟之前的zhime差不多

 

herbnet

 

OpenKG数据逐一截图说明_第80张图片

 门户无法打开:

OpenKG数据逐一截图说明_第81张图片

 第五页

 

OpenKG数据逐一截图说明_第82张图片

 OpenKG数据逐一截图说明_第83张图片

 

 

你可能感兴趣的:(知识图谱,知识图谱)