点击上方,选择星标或置顶,每天给你送干货!
阅读大概需要25分钟
跟随小博主,每天进步一丢丢
作者:husthuke
编辑:zenRRan 稍有改动
https://github.com/husthuke/awesome-knowledge-graph
导读
理论及论文
图谱及数据集
工具及服务
白皮书及报告
机构及人物
视频课程
专栏合集
评测竞赛
项目案例
推广技术文章
理论及论文
知识图谱构建技术综述
https://github.com/husthuke/awesome-knowledge-graph/blob/master/paper/%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E6%9E%84%E5%BB%BA%E6%8A%80%E6%9C%AF%E7%BB%BC%E8%BF%B0_%E5%88%98%E5%B3%A4.caj
知识图谱技术综述
https://github.com/husthuke/awesome-knowledge-graph/blob/master/paper/%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E6%8A%80%E6%9C%AF%E7%BB%BC%E8%BF%B0.pdf
知识图谱研究综述
https://github.com/husthuke/awesome-knowledge-graph/blob/master/paper/%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E7%A0%94%E7%A9%B6%E7%BB%BC%E8%BF%B0-%E6%9D%8E%E6%B6%93%E5%AD%90.pdf
知识图谱研究进展
https://github.com/husthuke/awesome-knowledge-graph/blob/master/paper/%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E7%A0%94%E7%A9%B6%E8%BF%9B%E5%B1%95_%E6%BC%86%E6%A1%82%E6%9E%97.caj
医学知识图谱构建技术与研究进展
https://github.com/husthuke/awesome-knowledge-graph/blob/master/paper/%E5%8C%BB%E5%AD%A6%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E6%9E%84%E5%BB%BA%E6%8A%80%E6%9C%AF%E4%B8%8E%E7%A0%94%E7%A9%B6%E8%BF%9B%E5%B1%95_%E8%A2%81%E5%87%AF%E7%90%A6.caj
命名实体识别-NER
ATOMIC: An Atlas of Machine Commonsense for If-Then Reasoning
知识库问答-KBQA
Learning Sequence Encoders for Temporal Knowledge Graph Completion
图谱及数据集
中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用,包括了众多的数据集以及工具。
官网地址:http://openkg.cn/
领域知识图谱
学术知识图谱AceKG
最新发布的Acemap知识图谱(AceKG)描述了超过1亿个学术实体、22亿条三元组信息,涵盖了全面的学术信息。具体而言,AceKG包含了61,704,089篇paper、52,498,428位学者、50,233个研究领域、19,843个学术研究机构、22,744个学术期刊、1,278个学术会议以及3个学术联盟(如C9联盟)。
同时,AceKG也为每个实体提供了丰富的属性信息,在网络拓扑结构的基础上加上语义信息,旨在为众多学术大数据挖掘项目提供全面支持。
访问地址:http://acemap.sjtu.edu.cn/
数据集
https://rajpurkar.github.io/SQuAD-explorer/
YAGO
YAGO是由德国马普研究所研制的链接数据库。YAGO主要集成了Wikipedia、WordNet和GeoNames三个来源的数据。YAGO将WordNet的词汇定义与Wikipedia的分类体系进行了融合集成,使得YAGO具有更加丰富的实体分类体系。YAGO还考虑了时间和空间知识,为很多知识条目增加了时间和空间维度的属性描述。目前,YAGO包含1.2亿条三元组知识。YAGO是IBM Watson的后端知识库之一。由于完成的YAGO数据集过于庞大,在使用过程中经常会选取其中一部分进行,比如可以抽取中带有时间注释(time annotations)的部分形成YAGO11k数据集。
完整数据集下载地址:
https://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/downloads/
WikiData
WikiData的目标是构建一个免费开放、多语言、任何人或机器都可以编辑修改的大规模链接知识库。WikiData由维基百科于2012年启动,早期得到微软联合创始人Paul Allen、Gordon Betty Moore基金会以及Google的联合资助。WikiData继承了Wikipedia的众包协作的机制,但与Wikipedia不同,WikiData支持的是以三元组为基础的知识条目(Items)的自由编辑。一个三元组代表一个关于该条目的陈述(Statements)。
WikiData中文部分-截至2017.01:
http://openkg.cn/dataset/http-pan-baidu-com-s-1c2ovnks
NLPCC 2017 KBQA
该任务来自NLPCC 2017评测任务,开放域问答评价任务主要包括三项子任务,基于知识库的问答(kbqa),基于文档的问答(dbqa),和基于表的问答(tbqa)。kbqa的任务是基于知识库的中文问题回答。dbqa的任务是通过选择一个或多个句子从一个给定的文档,作为答案回答中文问题。tbqa的任务是一个全新的QA任务,旨在通过从收集的表格中抽取一个或多个表回答英语问题。
下载链接:
https://biendata.com/ccf_tcci2018/datasets/tcci_tag/11
GDELT
GDELT(Global Database of Events, Language, and Tone)是最大的综合人类社会关系数据库,以100多种语言监控来自每个国家几乎每个角落的广播、印刷和网络新闻,并确定推动我们全球社会的人、地点、组织、主题、来源、情感、计数、报价、图像和事件每天的每一秒,它的全球知识图将世界的人,组织,地点,主题,计数,图像和情感连接到整个地球上的单一整体网络。为整个世界的计算创建一个免费的开放平台。
下载链接:https://www.gdeltproject.org/
ICEWS
ICEWS(Integrated Crisis Early Warning System)捕获和处理来自数字化新闻媒体,社交媒体和其他来源的数百万条数据,以预测,跟踪和响应世界各地的事件,主要用于早期预警。该数据集在知识图谱领域主要用于动态事件预测等动态图谱方面。
下载链接:https://dataverse.harvard.edu/dataverse/icews
OAG
OAG(Open Academic Graph包含来自MAG的166,192,182篇论文和来自AMiner的154,771,162篇论文,并生成了两个图之间的64,639,608个链接(匹配)关系。它可以作为研究引文网络,论文内容等的统一大型学术图表,也可以用于研究多个学术图表的整合。
下载链接:https://www.aminer.cn/open-academic-graph
工具
根据知识图谱的通用基本构建流程为依据,每个阶段都整理部分工具。
知识建模
知识抽取
Deepdive
知识推理
官网地址:
http://deepdive.stanford.edu/
Github地址:
https://github.com/HazyResearch/deepdive
知识表示
OpenKE
清华大学NLP实验室基于TensorFlow开发的知识嵌入平台,实现了大部分知识表示学习方法。
官网地址:
http://openke.thunlp.org/
Github地址:
https://github.com/thunlp/OpenKE
知识融合
白皮书及报告
CCKS2018-知识图谱发展报告
https://github.com/husthuke/awesome-knowledge-graph/blob/master/report/CCKS2018-%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E5%8F%91%E5%B1%95%E6%8A%A5%E5%91%8A.pdf
机构及人物
本部分介绍在知识图谱领域前沿研究或者有一定影响力的机构以及个人。
机构人物
李娟子:清华大学网页
http://keg.cs.tsinghua.edu.cn/persons/ljz/
刘知远:清华大学网页
http://nlp.csai.tsinghua.edu.cn/~lzy/
知乎主页
https://www.zhihu.com/people/zibuyu9/activities
漆桂林:东南大学网页
https://cse.seu.edu.cn/2019/0103/c23024a257135/page.htm
肖仰华:复旦大学网页
http://gdm.fudan.edu.cn/GDMWiki/Wiki.jsp?page=Yanghuaxiao
刘康:中科院网页
http://people.ucas.ac.cn/~liukang
刘挺:哈工大网页
http://homepage.hit.edu.cn/liuting
王昊奋
视频课程
知识图谱
https://www.chinahadoop.cn/course/1048
贪心学院知识图谱课程
知识图谱的技术与应用
https://www.greedyai.com/course/19/summary/introduce
教你搭建一个工业级知识图谱系统
https://www.greedyai.com/course/30/summary/knowledgeMapProject
炼数成金知识图谱课程
CSDN视频课
知识图谱系统架构剖析
https://edu.csdn.net/course/detail/10286
AI开发者大会——知识图谱专题
https://edu.csdn.net/course/detail/10284
专栏合集
评测竞赛
瑞金医院MMC人工智能辅助构建知识图谱大赛
https://tianchi.aliyun.com/competition/introduction.htm?spm=5176.100066.0.0.457933afBacvqN&raceId=231687
CCKS 2018 面向中文电子病历的命名实体识别
https://www.biendata.com/competition/CCKS2018_1/
CCKS 2018 面向音乐领域的命令理解任务
https://www.biendata.com/competition/CCKS2018_2/
CCKS 2018 微众银行智能客服问句匹配大赛
https://www.biendata.com/competition/CCKS2018_3/
CCKS 2018 开放领域的中文问答任务
https://www.biendata.com/competition/CCKS2018_4/
CCKS 2017 问题命名实体识别和链接任务
https://www.biendata.com/competition/CCKS2017_1/
CCKS 2017 面向电子病历的命名实体识别
https://www.biendata.com/competition/CCKS2017_2/
会议交流及讲座
AICon 2017知识图谱技术实践
https://aicon2017.geekbang.org/training/1
AICon 2018知识图谱深度培训
https://aicon2018.geekbang.org/training/1315
BDTC
BDTC 2018 医疗知识图谱的构建和应用
https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E5%8C%BB%E7%96%97%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E7%9A%84%E6%9E%84%E5%BB%BA%E5%92%8C%E5%BA%94%E7%94%A8.pdf
BDTC 2018 从知识图谱到人工智能:产品演进路径上的思考
https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E4%BB%8E%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E5%88%B0%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD-%E4%BA%A7%E5%93%81%E6%BC%94%E8%BF%9B%E8%B7%AF%E5%BE%84%E4%B8%8A%E7%9A%84%E6%80%9D%E8%80%83.pdf
BDTC 2018 基于cnSchema的大规模金融知识图谱实战
https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E5%9F%BA%E4%BA%8EcnSchema%E7%9A%84%E5%A4%A7%E8%A7%84%E6%A8%A1%E9%87%91%E8%9E%8D%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E5%AE%9E%E6%88%98.pdf
[BDTC 2017 Event Extraction from Texts](./conference/Event Extraction from Texts.pdf)
BDTC 2017 知性会话:基于知识图谱的人机对话系统方法与实践
https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E7%9F%A5%E6%80%A7%E4%BC%9A%E8%AF%9D-%E5%9F%BA%E4%BA%8E%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E7%9A%84%E4%BA%BA%E6%9C%BA%E5%AF%B9%E8%AF%9D%E7%B3%BB%E7%BB%9F%E6%96%B9%E6%B3%95%E4%B8%8E%E5%AE%9E%E8%B7%B5.pdf
BDTC 2017 基于图的海量知识图谱数据管理
https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E5%9F%BA%E4%BA%8E%E5%9B%BE%E7%9A%84%E6%B5%B7%E9%87%8F%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E6%95%B0%E6%8D%AE%E7%AE%A1%E7%90%86.pdf
CSDN AI 2018 医疗知识图谱的敏捷构建和实践
https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E5%8C%BB%E7%96%97%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E7%9A%84%E6%95%8F%E6%8D%B7%E6%9E%84%E5%BB%BA%E5%92%8C%E5%AE%9E%E8%B7%B5.pdf
CSDN AI 2018 知识图谱的表示和推理
https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E7%9A%84%E8%A1%A8%E7%A4%BA%E5%92%8C%E6%8E%A8%E7%90%86.pdf
CSDN AI 2018 大规模通用知识图谱构建及应用
https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E5%A4%A7%E8%A7%84%E6%A8%A1%E9%80%9A%E7%94%A8%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E6%9E%84%E5%BB%BA%E5%8F%8A%E5%BA%94%E7%94%A8.pdf
CSDN AI 2018 大规模通用知识图谱构建及应用
https://github.com/husthuke/awesome-knowledge-graph/blob/master/conference/%E5%A4%A7%E8%A7%84%E6%A8%A1%E9%80%9A%E7%94%A8%E7%9F%A5%E8%AF%86%E5%9B%BE%E8%B0%B1%E6%9E%84%E5%BB%BA%E5%8F%8A%E5%BA%94%E7%94%A8.pdf
其他
知识图谱中的深度学习技术应用概述
https://v.qq.com/x/page/i0700c29hw1.html
2018云栖大会上海-人工智能专场
https://yunqi.youku.com/2018/shanghai/review?spm=a2c4e.11165380.1076033.1
AI研习社-知识图谱的嵌入:更好更快的负采样
http://www.mooc.ai/open/course/640
项目案例
https://github.com/lemonhu/stock-knowledge-graph.git
医疗领域知识图谱
农业领域知识图谱
使用爬虫获取Wikidata数据构建
https://github.com/CrisJk/Agriculture-KnowledgeGraph-Data.git
佛学知识图谱
知识工程领域知识图谱
推广技术文章
构建 LinkedIn 知识图谱
https://www.infoq.cn/article/constructing-linkedin-knowledge-map
2017
阿里知识图谱首次曝光:每天千万级拦截量,亿级别全量智能审核
百度王海峰:知识图谱是 AI 的基石
https://www.infoq.cn/article/2017/11/Knowledge-map-cornerstone-AI
哈工大刘挺:从知识图谱到事理图谱
智能导购?你只看到了阿里知识图谱冰山一角
https://www.csdn.net/article/a/2017-12-08/15937080
2018
张伟博士:阿里巴巴百亿级别的三元组知识图谱掌舵者
https://www.shangyexinzhi.com/article/details/id-28524/
知识图谱在互联网金融行业的应用
上交大发布知识图谱AceKG,超1亿实体,近100G数据量
知识图谱数据构建的“硬骨头”,阿里工程师如何拿下?
https://yq.aliyun.com/articles/544941
这是一份通俗易懂的知识图谱技术与应用指南
https://www.jiqizhixin.com/articles/2018-06-20-4
一文揭秘!自底向上构建知识图谱全过程
https://102.alibaba.com/detail?id=134
健康知识图谱,阿里工程师如何实现?
https://102.alibaba.com/detail?id=176
为电商而生的知识图谱,如何感应用户需求?
https://yq.aliyun.com/articles/632483
肖仰华谈知识图谱:知识将比数据更重要,得知识者得天下
https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/83451280
知识图谱在旅游领域有哪些应用?携程度假团队这样回答
快手结合知识图谱进行多模态内容理解
https://www.infoq.cn/article/2018/09/Multimedia-Understanding-AI
腾讯互娱刘伟:知识图谱让AI更有学识
美团大脑:知识图谱的建模方法及其应用
https://tech.meituan.com/2018/11/01/meituan-ai-nlp.html
美团餐饮娱乐知识图谱——美团大脑揭秘
https://tech.meituan.com/2018/11/22/meituan-brain-nlp-01.html
人力资源知识图谱搭建及应用
https://www.jiqizhixin.com/articles/2018-11-23-3
2019
大众点评搜索基于知识图谱的深度学习排序实践
https://www.infoq.cn/article/JZ_qdBDiMc1pHpBMDR2Q
知识图谱已成AI下一风口,但你知道它进展到哪了吗?
https://36kr.com/p/5170293
下一代 AI 系统基石:知识图谱将何去何从?
https://www.infoq.cn/article/DCf3GUp_alTIMuyxYWl3
阿里巴巴电商认知图谱揭秘
https://www.secrss.com/articles/9743
阿里小蜜:知识结构化推动智能客服升级
https://www.infoq.cn/article/ocHiWF5rKuaBDxM5S28x
方便交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。
记得备注呦
推荐阅读:
【ACL 2019】腾讯AI Lab解读三大前沿方向及20篇入选论文
【一分钟论文】IJCAI2019 | Self-attentive Biaffine Dependency Parsing
【一分钟论文】 NAACL2019-使用感知句法词表示的句法增强神经机器翻译
【一分钟论文】Semi-supervised Sequence Learning半监督序列学习
【一分钟论文】Deep Biaffine Attention for Neural Dependency Parsing
详解Transition-based Dependency parser基于转移的依存句法解析器
经验 | 初入NLP领域的一些小建议
学术 | 如何写一篇合格的NLP论文
干货 | 那些高产的学者都是怎样工作的?
一个简单有效的联合模型
近年来NLP在法律领域的相关研究工作
让更多的人知道你“在看”