阿里 新零售领域的多模态知识图谱的建设与应用

阿里 新零售领域的多模态知识图谱的建设与应用_第1张图片
原文出处 datafun talk 作者 阿里高级算法工程师徐国海 由本知乎号根据阅读整理

公众号 系统之神与我同在

1.知识图谱简介:

知识图谱(Knowledge Graph)是对现实世界中的实体、概念及其之间关系的刻画和描述,知识图谱的经典结构是三元组,三元组的内容包括实体、类型、属性、关系等等。一个简单的知识图谱示例如下:

阿里 新零售领域的多模态知识图谱的建设与应用_第2张图片
知识图谱的典型应用包括:搜索推荐、智能问答、决策分析、智能创作等等。从应用种类来看,分为:

·原图应用:查询图谱后获取相关信息,结果基本满足应用需求。例如:搜索、推荐、问答等等。
·算法赋能:从图谱上获取信息后,作为下游任务模型的输入,联合建模完成应用需求。例如:决策分析、智能创作、认知计算

其应用形态包括以下几种:

·业务应用:自营业务 + 数据 + 算法(e.g., 阿里的商品知识图谱)
·知识中台:平台/第三方业务 + 数据 + 服务(e.g., 百度的知识图谱)
·解决方案,算法 + 工具化 + 实施(e.g., 阿里云、华为云)

2.领域知识图谱建设与应用
新零售场景下的业务问题主要是:如何有效连接用户和商品。用户通过搜索、与客服对话来获得商品信息。其核心问题是:1.需要从用户问题推理用户诉求,2.需要回答用户对商品具体信息的咨询,3.推荐商品时给出解释性推荐理由,促进成交转化。

阿里 新零售领域的多模态知识图谱的建设与应用_第3张图片
阿里 新零售领域的多模态知识图谱的建设与应用_第4张图片
为了解决上述问题,需要以用户和商品为基础,构建以POI为中心的领域知识图谱:
阿里 新零售领域的多模态知识图谱的建设与应用_第5张图片
一个POI知识图谱的技术路径举例如下:
阿里 新零售领域的多模态知识图谱的建设与应用_第6张图片
POI知识图谱的关键技术在于:

1.短语挖掘:通过远程监督获取种子短语,Wide and Deep 特征 + 随机森林分类器,Viterbi句子解码 + EM 框架,BERT MLM语言模型过滤(可选)。
阿里 新零售领域的多模态知识图谱的建设与应用_第7张图片
其技术特色为:1.不需要人工标注,2.跨多个行业通用,3.挖掘的短语准确率高。
阿里 新零售领域的多模态知识图谱的建设与应用_第8张图片
2.实体识别:远程监督:基于词典回标;引入外部知识:Lexicon自动短语挖掘和属性PV类型;使用CNN-CRF / FLAT-CRF、BERT-BILSTM-CRF;
阿里 新零售领域的多模态知识图谱的建设与应用_第9张图片
其技术特色为:1. 利用远程监督降低标注量、2.2. 引入外部知识提升准确率。
阿里 新零售领域的多模态知识图谱的建设与应用_第10张图片
**3.关系抽取:**采用BILSTM + GCN + CNN / BERT + FC + softmax + Entity + 分隔符(Knowledge) / K-BERT + ConceptNET + HowNET
阿里 新零售领域的多模态知识图谱的建设与应用_第11张图片
其技术特色为:1.远程监督降低标注量、2. 引入外部知识提高效果(实体知识、边界信息、三元组知识库)

阿里 新零售领域的多模态知识图谱的建设与应用_第12张图片
应用思路:

阿里 新零售领域的多模态知识图谱的建设与应用_第13张图片
实际应用——导购推荐:基于领域知识优化粗召阶段

阿里 新零售领域的多模态知识图谱的建设与应用_第14张图片
实际应用——卖点生成
阿里 新零售领域的多模态知识图谱的建设与应用_第15张图片
3. 多模态知识图谱建设与应用

直播场景的业务问题:在直播场景,通过丰富的信息和多样化的模态,让用户快速认知商品,激发兴趣。例如打造以虚拟人为主的智能直播间和真人直播的智能助理。
阿里 新零售领域的多模态知识图谱的建设与应用_第16张图片
目标:面向直播场景,构建以内容为中心,包含商品丰富的素材且具有不同模态表达的多模态知识图谱Multi-modal Knowledge Graph (MKG)。

核心要素:Concepts: 商品Aspect,Modals: 文本、图像、视频。

MKG的关键技术路径:

·文本知识挖掘
·图片处理
·多模态融合
阿里 新零售领域的多模态知识图谱的建设与应用_第17张图片

关键技术:图文匹配

多模态预训练 & 预测:
阿里 新零售领域的多模态知识图谱的建设与应用_第18张图片
pre-training阶段的输入格式:
在这里插入图片描述
Finetune阶段:
在这里插入图片描述
MKG的知识沉淀:阿里 新零售领域的多模态知识图谱的建设与应用_第19张图片
MKG的应用:虚拟主播-图文剧本生成

依靠MKG生成剧本,并搭配相应的图片。

阿里 新零售领域的多模态知识图谱的建设与应用_第20张图片
MKG的应用:虚拟主播-短视频生成

包括规划路径、组织图片、生成剧本。
阿里 新零售领域的多模态知识图谱的建设与应用_第21张图片
MKG的应用:智能辅播-商品展示
阿里 新零售领域的多模态知识图谱的建设与应用_第22张图片

你可能感兴趣的:(知识图谱,人工智能,自然语言处理)