Datafun Talk2021 知识图谱交流会回顾

1. 知识图谱与图数据库

存成关系型数据可的问题:

Datafun Talk2021 知识图谱交流会回顾_第1张图片

Datafun Talk2021 知识图谱交流会回顾_第2张图片

Datafun Talk2021 知识图谱交流会回顾_第3张图片

知识图谱存储

Datafun Talk2021 知识图谱交流会回顾_第4张图片

Datafun Talk2021 知识图谱交流会回顾_第5张图片

2. 企业知识图谱构建技术与挑战

少样本关系抽取

增量关系抽取

主动学习

3. 从零样本做中文知识标注与挖掘(百度)

百科知识树(通用知识)

文本标注挖掘(应用百科知识树)

4. 图谱问答在小爱场景的应用

4.1 整体架构

Datafun Talk2021 知识图谱交流会回顾_第6张图片

4.2 信息抽取

  1. 关系抽取

Datafun Talk2021 知识图谱交流会回顾_第7张图片

吴京主演战狼,吴京也导演了战狼

基于指针网络的关系抽取模型:

Datafun Talk2021 知识图谱交流会回顾_第8张图片

PSO模型(先抽取P,再抽取s和o)

Datafun Talk2021 知识图谱交流会回顾_第9张图片

两种模型召回,然后接入到判别模型里面进行判断

2. 事件抽取

Datafun Talk2021 知识图谱交流会回顾_第10张图片

4.3 图谱问答

· 文法解析

· 槽位提取

· 图谱问答

5. 美团大脑: 美食领域知识图谱构建及应用进展

5.1 标签图谱

数据来源:美团点评的评论内容(非结构化自然语言数据,但是有海量的信息存储其中)

Datafun Talk2021 知识图谱交流会回顾_第11张图片

1. 标签挖掘: 更多的类似于属性级的观点抽取,跳字标签,就是属性和观点词中间有上下文。 这里把属性词和修饰词(观点词)都当成ner来抽取。

Datafun Talk2021 知识图谱交流会回顾_第12张图片

2. 标签关系

标签同义词挖掘

Datafun Talk2021 知识图谱交流会回顾_第13张图片

无监督场景下,加入对比学习。 让相似的样本距离更靠近,不同的样本距离更远。在实验效果上,可以去的类似于sentence bert的效果

Datafun Talk2021 知识图谱交流会回顾_第14张图片

标签上下位挖掘

类似于标签同义词挖掘

3. 图谱打标

商户打标(商户和用户打标签关联)

POI兴趣点,一般指地理位置

Datafun Talk2021 知识图谱交流会回顾_第15张图片

判别模型:

Datafun Talk2021 知识图谱交流会回顾_第16张图片

4. 应用

4.1 知识问答

Datafun Talk2021 知识图谱交流会回顾_第17张图片

4.2 补充召回

Datafun Talk2021 知识图谱交流会回顾_第18张图片

5. 知识图谱表示学习

把tag和poi都作为节点,表示成向量,边就是二者的相似度。表示出来以后,可以直接计算tag和poi之间的相似度

Datafun Talk2021 知识图谱交流会回顾_第19张图片

6. 图谱应用于推荐

Datafun Talk2021 知识图谱交流会回顾_第20张图片

5.2 菜品知识图谱构建

  1. schema层

Datafun Talk2021 知识图谱交流会回顾_第21张图片

2. 菜名理解

Datafun Talk2021 知识图谱交流会回顾_第22张图片

Datafun Talk2021 知识图谱交流会回顾_第23张图片

3. 深度学习模型泛化inference

知识挖掘&显式推理

Datafun Talk2021 知识图谱交流会回顾_第24张图片

4. 多模态+结构化 预训练&推理

帮助更好的识别菜品信息

Datafun Talk2021 知识图谱交流会回顾_第25张图片

query1: 商户标签怎么定的

人工筛选,人工check

query2:同义词负样本怎么构建?

一开始有一些初始overlap数据,进行标注.

后面用模型预测置信度在0.5附近的样本,送给人工标注

query3:标签图谱存储工具

开源的图数据库

query4: 打标工具:

自己搭建

你可能感兴趣的:(小罗学习NLP,知识图谱,人工智能,自然语言处理)