知识图谱(RDF)大型数据集 网络下载资源整合

不定期更新

 

一、DBPedia

简介:

DBpedia 是一个很特殊的语义网应用范例,它从维基百科(Wikipedia)的词条里撷取出结构化的资料,以强化维基百科的搜寻功能,并将其他资料集连结至维基百科。透过这样的语意化技术的介入,让维基百科的庞杂资讯有了许多创新而有趣的应用,例如手机版本、地图整合、多面向搜寻、关系查询、文件分类与标注等等。DBpedia 同时也是世界上最大的多领域知识本体之一,也是 Linked Data 的一部分,美国科技媒体 ReadWriteWeb 也将 DBpedia 选为2009 年最佳的语义网应用服务。

DBpedia 2014 版的资料集拥有超过458万的物件,包括144万5000人、73万5000个地点、12万3000张唱片、8万7千部电影、1万9000种电脑游戏、24万1000个组织、25万1000种物种和6000个疾病。其资料不仅被BBC、路透社、纽约时报所采用,也是Google、Yahoo等搜寻引擎检索的对象。

下载地址:https://wiki.dbpedia.org/develop/datasets/downloads-2016-10

 

二、YAGO

简介:

YAGO (Yet Another Great Ontology) is an open source knowledge base developed at the Max Planck Institute for Computer Science in Saarbrücken. It is automatically extracted from Wikipedia and other sources.

As of 2012, YAGO3 has knowledge of more than 10 million entities and contains more than 120 million facts about these entities. The information in YAGO is extracted from Wikipedia (e.g., categories, redirects, infoboxes), WordNet (e.g., synsets, hyponymy), and GeoNames. The accuracy of YAGO was manually evaluated to be above 95% on a sample of facts.[To integrate it to the linked data cloud, YAGO has been linked to the DBpedia ontology[6] and to the SUMO ontology.

YAGO3 is provided in Turtle and tsv formats. Dumps of the whole database are available, as well as thematic and specialized dumps. It can also be queried through various online browsers  and through a SPARQL endpoint hosted by OpenLink Software. The source code of YAGO3 is available on GitHub.

YAGO has been used in the Watson artificial intelligence system.

下载地址:https://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/downloads/

 

三、wikipedia

简介:就不用多说了。

英文版的下载链接:https://dumps.wikimedia.org/enwiki/

 

四、PDD

简介:

一个国内团队开发的医疗相关数据集,PDD Graph is a Patient-Disease-Drug Graph, Bridging MIMIC-III and Linked Data Cloud.

下载链接:http://kmap.xjtudlc.com/pdd/index.html#Introduction

你可能感兴趣的:(RDF数据集)