技术动态 | AIGC时代知识图谱技术的发展与最佳实践

转载公众号 | DataFunTalk


技术动态 | AIGC时代知识图谱技术的发展与最佳实践_第1张图片

2023年3月18日,DataFunSummit2023:知识图谱在线峰会将如约而至。本次峰会由2位主席与3位专家团成员和6位论坛出品人精心策划而成,共包含了:统一知识表示与复杂推理、大规模知识图谱构建与更新、海量知识存储与计算、知识问答与推荐、知识图谱与AIGC、最佳行业知识图谱实践等6大论坛,邀请20余位来自一线的知识图谱专家学者,进行深度分享交流。本次峰会将全程直播,欢迎大家扫码免费报名收看:

技术动态 | AIGC时代知识图谱技术的发展与最佳实践_第2张图片

识别二维码,免费报名

▌峰会日程

技术动态 | AIGC时代知识图谱技术的发展与最佳实践_第3张图片

▌峰会组织

40e467c06edbef679943a4f230127fb2.png

621236e41e7d45d455220a29a2a5f8e5.png

峰会主席

b6dedf354c6a9f65c854344f495e0ed4.png

b753fe7748f19aad67130224bf48976b.png

学术主席:刘铭 哈尔滨工业大学 教授、博士生导师

个人介绍:刘铭,教授/博士生生导师,哈尔滨工业大学计算学部。先后主持国家重点研发计划项目(课题)、国家自然科学基金、中国博士后科学基金特别资助、中国博士后科学基金面上资助一等资助、黑龙江省面上基金、教育部协同育人项目多项基金项目。获黑龙江省科学技术一等奖,哈尔滨市科技成果,第六届全国青年人工智能创新创业大会一等奖。近年来以第一作者或通讯作者发表 CCFA/B 类论文20余篇,包括 TKDE、TOIS、KAIS、IJCAI、ACL 等知名学术刊物或会议上,英文译著一部。担任 NLPCC2020、CCKS2020 知识图谱领域主席,CCKS2019 出版主席、CCKS2021 评测主席、CCKS2022 讲习班主席和 CCKS2023 程序委员会主席。

工业主席:王士进 科大讯飞 AI研究院 常务副院长

个人介绍:王士进博士,科大讯飞研究院常务副院长、认知智能国家重点实验室副主任。他带领团队陆续开展了自然语言处理、智慧教育、人机交互等技术方向研究,取得一系列国际领先的研究成果,获得30余项国际比赛冠军,在 TASLP、AAAI、ACL、KDD、SIGIR 等人工智能领域国际顶级期刊和会议上发表论文50余篇,申请了专利80余项,同时还承担了国家重点研发计划、863、973等多项国家重点研发计划工作,获安徽省科技进步一等奖、吴文俊人工智能科技进步奖一等奖等奖项。

08c2f2d2dee104b059c9fada31414c95.png

5a869e4ce5916b3cee9f41a3be6c79f4.png

专家评审团

d8b9375a507223ddae796ba67dc6d067.png

ab117b6757062a08f53eeebe007eed47.png

洪春涛 蚂蚁集团 图数据库负责人

个人介绍:洪春涛博士于2011年毕业于清华大学计算机系,主要从事并行计算和高性能计算研究;后加入微软亚洲研究院从事分布式系统和大规模机器学习研究;2016年联合创建了北京费马科技有限公司,研发了TuGraph图数据库;2020年加入蚂蚁集团,目前主持蚂蚁图数据库研发。

彭卫华 华为终端 智能决策首席专家

个人介绍:曾在百度、阿里、腾讯等互联网企业工作,长期从事搜索、推荐、自然语言处理、知识图谱等研究工作,在ACL、EMNLP、COLING、KBS等知名学术会议&期刊发表论文20余篇,有着十余年的工业界实战经验。

王昊奋 同济大学 百人计划、特聘研究员、博士生导师

个人介绍:王昊奋,同济大学百人计划,特聘研究员,博士生导师。长期在一线人工智能公司担任CTO之职。他是全球最大的中文开放知识图谱联盟OpenKG发起人之一。他负责参与多项国家级AI相关项目,发表100余篇AI领域高水平论文,被引用次数达到2600余次,H-index达到23。他构建了全球首个可交互养成的虚拟偶像—“琥珀·虚颜”;所构建的智能客服机器人已累计服务用户超过10亿人次。目前,他担任中国计算机学会术语工委副主任,SIGKG主席,上海秘书长,中国中文信息学会理事,语言与知识计算专委会副秘书长,上海市计算机学会自然语言处理专委会副主任,上海交通大学AI校友会秘书长等社会职位。

▌详细介绍

3542e16e81d28f8e0d41fd3e51eb6dc0.png

d4387900d344ed10a3d3a4883ce8cfc9.png

① 统一知识表示与复杂推理

a4b2c3db3fdcf0b0ed4805bdc091eb1b.png

f7efa820fb625681268344476976e9fd.png

2023年03月18日

论坛名称:统一知识表示与复杂推理

出品人:商超

09:00 - 12:30

09:00

Opening

出品人:商超

Amazon 应用科学家

09:05

浅谈知识图谱的关联视角和因果视角

清华大学 长聘副教授

崔鹏

09:45

基于知识的神经符号结合的离散推理研究

京东科技 算法科学家

鲍军威

10:25

知识图谱和自然语言处理

OPPO研究院 高级研究员

杨栋

11:05

基于图神经网络的知识图谱推理

第四范式 算法科学家

张永祺

11:45

隐式图神经网络的介绍与进展

新加坡国立大学 博士研究生

刘俊成

出品人:商超 Amazon 应用科学家

个人介绍:商超,现就职于 Amazon,担任应用科学家,之前就职于京东硅谷研究院。他的研究主要集中在图神经网络和自然语言处理,近期致力于知识图谱表征学习和基于知识图谱的问答系统设计等相关研究。

崔鹏 清华大学 长聘副教授

个人介绍:崔鹏,清华大学计算机系长聘副教授,博士生导师。研究兴趣聚焦于大数据驱动的因果推理和稳定预测、大规模网络表征学习等。2016年开始将因果统计思想与机器学习框架进行融合性研究,提出并发展了因果启发的稳定学习理论方法体系,在智慧医疗、互联网经济等场景取得显著应用价值。在数据挖掘及人工智能领域顶级国际会议发表论文100余篇,先后5次获得国际会议或期刊论文奖,并先后两次入选数据挖掘领域顶级国际会议KDD最佳论文专刊。担任IEEE TKDE、ACM TOMM、ACM TIST、IEEE TBD、KAIS等国际期刊编委。曾获得国家自然科学二等奖、教育部自然科学一等奖、CCF-IEEE CS青年科学家奖;入选中组部万人计划青年拔尖人才,ACM杰出科学家。

演讲题目:浅谈知识图谱的关联视角和因果视角(The "Correlation" and “Causality” Perspectives of Knowledge Graph)

演讲提纲:As a structured semantic knowledge base, the current knowledge graph is often used to represent the "correlation" relationship between entities in the physical world. Many studies focus on the completion of missing facts of the knowledge graph, which is treated as a collection of facts in applications. How to advance from fact completion to fact reasoning is an important fundamental problem for in-depth analysis and utilization of knowledge graph. This talk will introduce the perspective of "causality" based on the knowledge graph's correlation expression, provide an explanation for the correlation relationship among entities by discovering the causal relationship and pattern at the conceptual layer of the knowledge graph, and achieve traceable intelligent reasoning for unknown environments and unseen entities.

鲍军威 京东科技 算法科学家

个人介绍:鲍军威,哈尔滨工业大学博士学位,13年NLP从业经验,2011-2018于微软亚洲研究院联培,2019-至今作为算法科学家就职于京东科技。主要研究方向为自然语言处理,对话问答,文本生成、预训练语言模型等,曾获多项对话问答Leaderboard第一名,已发表论文20余篇。曾参与微软小冰、Bing的知识问答系统研发,主持京东商品自动营销文案写作项目研发,参与京东零售、京东金融智能客服相关系统研发,目前主要从事基于言犀平台的京东自研大模型的研发。

演讲题目:基于知识的神经符号结合的离散推理研究

演讲提纲:在需要推理的问答领域,传统基于符号的语义解析式离散推理方法具有更好的可解释性,而近几年的基于神经网络的端到端式离散推理方法在性能上取得更好的成绩。因此,如何将神经符号两类方法结合,研究具有可解释且高性能的离散推理能力的问答系统成为本领域的一大研究方向。本演讲主要介绍我们在基于无结构化文本知识、文本与结构化表格混合知识的离散推理型问答研究方面的工作,包括引入离散操作来提高神经网络方法性能、基于神经网络预测可执行的逻辑表达式等方法,引导大家持续推动基于知识的神经符号结合的离散推理研究。

听众收益:

1. 如何引入符号化的离散操作来提高神经网络的推理性能?

2. 基于神经网络生成逻辑表达式的性能到底如何?

3. 基于大模型的零样本/少样本推理现状如何?

杨栋 OPPO研究院 高级研究员

个人介绍:杨栋,OPPO研究院语音语义部融智Lab高级算法研究员。他毕业于香港城市大学博士,现在主要研究方向是自然语言处理,图学习网络,预训练模型,网络研究和应用,致力于使用简单方法解决复杂的实际问题。近期,他主责部门知识增强预训练模型和知识图谱多跳逻辑推理等算法开发。主导构建预训练模型CHAOS, 登顶CLUE 三大榜单。在知识图谱多跳推理上,提出GammaE 模型,论文被EMNLP2022 会议Oral Presentation 录取。

演讲题目:知识图谱和自然语言处理

演讲提纲:杨栋,OPPO 研究院语音语义部融智 Lab 高级算法研究员。他毕业于香港城市大学博士,现在主要研究方向是自然语言处理,图学习网络,预训练模型,网络研究和应用,致力于使用简单方法解决复杂的实际问题。近期,他主责部门知识增强预训练模型和知识图谱多跳逻辑推理等算法开发。主导构建预训练模型 CHAOS, 登顶 CLUE 三大榜单。在知识图谱多跳推理上,提出 GammaE 模型,论文被EMNLP2022 会议Oral Presentation 录取。

听众收益:

1. 介绍预训练大模型 CHAOS

2. 介绍知识图谱逻辑推荐

张永祺 第四范式 算法科学家

个人介绍:张永祺博士于2020年加入第四范式科学技术部,现担任算法科学家,负责机器学习和知识图谱相关的研究工作。工作期间他开展了多个知识图谱学习相关工作,在链接预测、实体对齐等任务基线上达到国际领先水平,取得大规模生物知识图谱预测任务ogbl-biokg第一名的成绩,并以第一作者在TPAMI, VLDB Journal,NeurIPS, WWW, ACL, ICDE等人工智能领域顶级会议期刊发表近10篇高水平论文。他于2020年在香港科技大学获得博士学位,2015年在上海交通大学获得学士学位。

演讲题目:基于图神经网络的知识图谱推理

演讲提纲:知识图谱作为一种特殊的结构化数据,启发了如搜广推医疗金融等诸多领域下游应用,对数据挖掘和机器学习具有重要意义。近年来,随着图神经网络(GNN)的发展,越来越多的GNN应用于知识图谱推理场景,获得了出色的推理效果。本次分享从信息聚合到子图学习两代技术的角度,介绍GNN在知识图谱推理领域的发展和重要工作,展示当前GNN+KG的重要应用场景,对当前子图学习技术优势及其瓶颈进行讨论。

听众收益:

1. 知识图谱上的图神经网络建模有何特殊之处?

2. 知识图谱推理有哪些重要应用?

3. 图神经网络知识推理的难点在哪?

刘俊成 新加坡国立大学 博士研究生

个人介绍:新加坡国立大学博士研究生,研究方向为图神经网络,文章发表于NeurIPS, WWW, KDD, AAAI, VLDB等顶会。

演讲题目:隐式图神经网络的介绍与进展

演讲提纲:本次演讲主要介绍隐式图神经网络,以及目前的进展。包含两篇NeurIPS的论文具体介绍。

听众收益:

1. 什么是隐式图神经网络?

2. 图神经网络如何获取长距离依赖?

3. 现有隐式图神经网络的缺陷是什么?

技术动态 | AIGC时代知识图谱技术的发展与最佳实践_第4张图片

识别二维码,免费报名,预约本论坛直播

055e5235b601b790107470b8bf5cd831.png

298f3823671eea6fb9392f9f22cc1c1c.png

② 大规模知识图谱构建与更新论坛

93cc06bc987fb48f4488497694702878.png

abade797cbddd85b7cfae0acc31839bc.png

2023年03月18日

论坛名称:大规模知识图谱构建与更新

出品人:胡芳槐

09:00 - 12:00

09:00

Opening

出品人:胡芳槐

PlantData CTO

09:05

Shopee 多语言商品知识图谱技术构建方法和应用

Shopee,Listing Team Leader

张亦弛

09:45

基于知识图谱的数字化知识管理新实践

PlantData 海乂知 CKO

夏敬华

10:25

电力行业知识资源建设及场景化应用

英大传媒 编审

张涛

11:05

知识图谱和图计算在翼支付风控的应用

翼支付 风险管理部总监

徐德华

出品人:胡芳槐 PlantData CTO

个人介绍:博士,PlantData CTO。10年知识图谱研究及产业化经验,数个国家级项目骨干成员,ISWC、CCKS2017等国际会议、顶级期刊发表多篇论文及实战报告,知识图谱全生命周期理论提出者。国内最早研究中文知识图谱构建并进行产业化探索,于2012年谷歌提出知识图谱概念之前即发布了基于中文百科的通用知识图谱(SSCO);多次受邀参与行业顶级交流报告,于CCKS2017知识图谱实战报告,首次提出了行业知识图谱的生命周期并逐步成为业界的标准,迭代研发了适用于千亿级别三元组存储以上的知识图谱数据存储套件,设计了面向企业级复杂数据场景的统一知识表示方法。现任PlantData CTO,已与中国电科、中航工业、国家电网、华为、招商证券、中国银行、中信建投等数家行业标杆企业达成合作。

张亦弛 Shopee,Listing Team Leader

个人介绍:张亦弛,现任电商平台 Shopee Marketplace Intelligence Listing 商品算法负责人,服务全球十余个市场的商品智能化识别,工作研究方向为电商领域知识图谱构建、自然语言处理和多模态技术在电商业务中的应用等。毕业于伦敦大学,学术论文曾发表在 BMVC / EMNLP / WSDM / CVPR 等国内外会议和期刊,出版专著一部。

演讲题目:Shopee 多语言商品知识图谱技术构建方法和应用

演讲提纲:

1. 商品知识图谱简介:电商商品知识图谱概要和应用场景(ToB&ToC)

2. Shopee 商品知识图谱的构建:Shopee 商品知识图谱构建技术,包括知识建模技术、知识获取技术、知识融合技术和知识推理技术等。通过自动化的实体挖掘、实体抽取、实体链接等,实现了在全球十多个多语言市场真实商品语料上的技术沉淀,并通过这些技术首次在工业界搭建和实现了整个市场全自动化标准产品库(SPU)的数据生产和应用。

3. Shopee 商品知识图谱的应用:Shopee 电商知识图谱生产的标准产品库(SPU),重点应用在比价营销会场,其应用场景还涉及商家系统、运营系统以及面向消费系统的智能化。所涉及到的核心技术,在全球十多个不同语言市场的商品发布服务中,商品属性服务准确率达到 95%+,在运营系统中对于商品同款的识别服务准确率达到 85%+,在面向消费者搜索系统的商品导航应用准确率达到99%。

4. 商品知识图谱的未来:随着 Shopee 海外市场的深耕,精细化地提升知识图谱技术在各个市场和混合语言环境下的识别水平,不断通过新技术突破业界识别水平的天花板,让 Shopee 的商品系统更加智能,商家的全球化经营更加便捷,消费者购买体验更佳。

听众收益:

1. 了解到商品知识图谱技术在全球多语言市场应用的实际经验;

2. 了解到商品知识图谱技术在工业界应用的挑战和难点;

3. 了解到如何管理技术项目打造知识图谱技术,服务于自己的业务应用。

夏敬华 PlantData 海乂知 CKO

个人介绍:同济大学博士后,海乂知CKO,中国知识管理主要倡导和推动者,中国知识管理国家标准主要参与制订者,在知识管理、知识图谱、人工智能应用等方面具有丰富经验,曾为数百家企业提供企业数智化转型培训、咨询和系统实施落地。

演讲题目:基于知识图谱的数字化知识管理新实践

演讲提纲:数字化转型浪潮下,组织知识同样需要数字化转型,传统知识管理存在“重沉淀、轻应用”、“多人工、少智能”等问题,难以满足数字化时代的知识管理要求。基于知识图谱的数字化知识管理,不仅实现知识采集、加工、存储、共享等过程的智能化支撑,更将知识和业务、岗位、用户行为特征等有效关联,构建场景驱动的知识应用,可以显著提升知识业务粘性、加深知识应用深度、增强知识服务能力。

徐德华 翼支付 风险管理部总监

个人介绍:翼支付风险管理部总监,模型团队负责人,负责支付、电商、金融、通讯反诈等风控模型体系建设。

演讲题目:知识图谱和图计算在翼支付风控的应用

演讲提纲:

1. 图谱简介

2. 翼支付风控知识图谱“云篆”简介

3. 图计算在风控业务中的应用

张涛 英大传媒 编审

个人介绍:全国新闻出版行业领军人才。长期从事电力图书策划出版工作,探索传统出版数字化转型。7次获得中国出版政府奖图书提名奖、国家出版基金等国家级奖项,主持数字平台获得3项国家奖项和荣誉,15次获得全国优秀畅销图书奖、中国电机工程学会科普作品奖等省部级奖励。

演讲题目:电力行业知识资源建设及场景化应用

演讲提纲:结合电力行业知识资源类型和应用场景,利用知识图谱技术,实现多源数据的融合和关联,为个人成果汇总、岗位培训、知识学习、信息情报收集等应用场景提供支撑和共享平台。

技术动态 | AIGC时代知识图谱技术的发展与最佳实践_第5张图片

识别二维码,免费报名,预约本论坛直播

2c3d44641f9be55d766b55175fc4940f.png

6dc6b94616daec4c3fefce0e2875e376.png

③ 海量知识存储与计算论坛

4f7c38cc55807872d2ad3c6f200ea975.png

81e78ece55a5b6a24142b52d140c2a0d.png

2023年03月18日

论坛名称:海量知识存储与计算

出品人:林恒

09:00 - 12:00

09:00

Opening

出品人:林恒

蚂蚁集团 图数据库开源负责人

09:05

基于图数据库的知识图谱存储技术及实践

创邻科技 CTO

周研

09:45

蚂蚁金融场景下图表融合分析语言实践

蚂蚁集团 技术专家

彭志伟

10:25

图数据库查询与算法正确性验证

Ultipa CEO

孙宇熙

11:05

图数据库 NebulaGraph 的得失思考

vesoft 社区 PMC

吴敏

出品人:林恒 蚂蚁集团 图数据库开源负责人

个人介绍:2016年联合创立费马科技,主要负责图计算架构与解决方案;2018年10月于清华大学获得博士学位,研究方向为超大规模异构图计算;2020年12月起加入蚂蚁集团,目前负责 TuGraph 开源图数据库。

周研 创邻科技 CTO

个人介绍:浙江创邻科技有限公司联合创始人。分布式数据处理领域技术专家、Apache 开源项目贡献者、图数据库和图计算领域专家、Galaxybase 图数据库产品研发负责人。

演讲题目:基于图数据库的知识图谱存储技术及实践

演讲提纲:

1. RDF 和属性图

2. 图数据库存储的核心目标

3. 图数据库存储的主流方案

4. Galaxybase 图数据库应用实践

听众收益:

1. 图数据库和关系型数据库存储的本质区别是什么?

2. 常见图数据库存储技术方案有哪些?

彭志伟 蚂蚁集团 技术专家

个人介绍:蚂蚁图计算GeaFlow DSL方向负责人,Apache Calcite/Hudi Commiter,多年实时计算和分布式SQL引擎研发经验,目前专注图计算DSL研发方面工作.

演讲题目:蚂蚁金融场景下图表融合分析语言实践

演讲提纲:蚂蚁金融风控等场景对图计算提出了多样化的计算需求,包括实时图计算、离线图仿真等。如何通过一套图分析语言来满足不同场景下的图计算需求是我们面临的重要挑战。我们从实际的业务场景出发,提出并实现了一套图表融合的分析语言,很好的解决了复杂图计算需求,降低了用户使用图计算的门槛。本次分享将介绍图表融合DSL的设计、复杂图查询的分布式化、查询优化以及相关应用务场景介绍等多方面的内容。

听众收益:

1. 了解图计算的典型使用场景

2. 了解图分析语言的现状和面临的挑战

3. 了解蚂蚁图表融合 DSL 解决方案

孙宇熙 Ultipa CEO

个人介绍:高性能计算与存储系统专家、大数据专家、数据库专家及学者;毕业于清华大学计算机科学与技术系和圣塔克拉拉大学计算机工程系;现任Ultipa CEO;曾任EMC(易安信)亚太研发集团 CTO 和中国研究院院长、哈尔滨工业大学客座教授、中国电子学会云计算专家委员会委员、收藏家,哈佛大学美术馆亚洲艺术鉴赏委员会理事;技术科普作家,著有《图数据库原理、架构与应用》《图算法(筹)》《云计算与大数据》《软件定义数据中心》《大数据分析》《银行数字化转型》《程序员生存手册》(The 99 Points of Launching High-Tech Business)等多部中外科技畅销书。

演讲题目:图数据库查询与算法正确性验证

演讲提纲:

· 面对市场上不断涌现的图数据库、知识图谱产品,你想知道它们底层的实现逻辑吗?

· 不同厂家推出的纷繁复杂的评测报告,你知道如何精准地解读吗?

· 你知道如何选型图数据库并进行结果正确性验证码?(显然结果出现错误并非个例,而这会造成一系列问题)

本讲座以无保留、系统化、直观清晰的方式向听众介绍图查询结果的正确性验证方法。

验证方式主要分为三个部分(步骤):

1. 溯源验证:如何通过对源数据下钻来进行结果正确性验证

2. 工具验证:如何通过不同的命令号、可视化操作界面进行验证

3. 编程验证:如何通过图查询与操作语言来进行各类查询(包含算法)的实现与白盒化验证。

掌握这些验证方法后,你会发现很多厂家的图技术产品的查询与分析的实现逻辑、结果,甚至数据建模与入图方式都存在一些问题,而有些问题是根本性与灾难性的,另一些则是需要作为bug来修复—— 而你此时对于图数据库的知识掌握相信已经超越大多数人了。

听众收益:

1. 你知道如何验证图查询与操作的结果是否正确吗?

2. 你知道怎么去分析和评价每家图数据库厂商的评测结果吗?

3. 你知道每个图查询与操作背后的原理与拆解吗?

4. 你知道如何评价与选型图数据库吗?

5. 深入浅出带你揭开图数据库的迷雾

吴敏 vesoft 社区 PMC

个人介绍:吴敏,本科及博士毕业于浙江大学。先后任阿里云计算有限公司 OSS/BatchCompute 研发工程师和蚂蚁金服 Geabase 研发工程师。目前在 VESOFT 欧若数网,历任社区产品总监, 社区 PMC。

演讲题目:图数据库 NebulaGraph 的得失思考

演讲提纲:

1. 图领域的概况

2. NebulaGraph 的概况

3. 演进与尝试

听众收益:

1. 对于图领域的一些概况介绍

2. 软件架构的演进

3. 开源软件商业化的得失

技术动态 | AIGC时代知识图谱技术的发展与最佳实践_第6张图片

识别二维码,免费报名,预约本论坛直播

95f0bcf9398b3c8b4cbf2d87d256afbc.png

796fdaa4b150f8b3eda822226054c9ee.png

④ 知识问答与推荐论坛

d961324c32a4961a05b5a04615b8070b.png

26a495d22d322c71297db7f6ffca1c05.png

2023年03月18日

论坛名称:知识问答与推荐

出品人:杜振东

14:00 - 17:00

14:00

Opening

出品人:杜振东 云问科技 NLP 研究院负责人

14:05

电网主设备知识计算关键技术及工程应用

国网智能电网研究院 计算及应用研究所认知计算技术总监

张强

14:35

标准数字化关键路径--标准知识图谱的构建与应用

中国电子技术标准化研究院 标准创新服务中心 副主任

王立玺

15:05

招聘平台下的对话机器人技术实践

58同城 AI Lab 算法资深工程师

桑海龙

15:35

LBS 场景下数据图谱在搜索推荐的应用

货拉拉 算法工程师

赵骥

16:05

基于知识图谱、NLP与大模型技术的企业智能搜索与知识应用平台建设

百度智能云AI应用产品部 解决方案总监

李亮

16:35

基于知识增强和预训练大模型的 Query 意图识别

阿里巴巴 算法工程师

江悦

出品人:杜振东 云问科技 NLP 研究院负责人

个人介绍:云问科技NLP研究院负责人,拥有8年机器学习与文本挖掘相关技术经验,6年中文自然语言处理相关项目实战经验。编写书籍《会话式AI》、《人工智能实践录》与《江苏省新兴产业战略丛书-人工智能分册》;参与制定国家人工智能标准化总体组《人工智能标准化与开源研究报告》、《人工智能-术语》、《人工智能-情感计算用户界面框架》;参与制定中国电子工业标准化技术协会《信息技术 人工智能 智能助理智能能力等级评估》;入选国家标准委人工智能专家及AIIA人工智能技术专家。参与百万级用户金融资讯新闻推荐项目,作为算法主要负责人及整体框架设计者,主导全新智能新闻推荐系统的落地,并优化线上推荐算法,整体线上相较原有系统精度提高10%。主要设计面向任务驱动的多轮对话引擎,主导参与搭建NLP底层能力平台,为企业提供底层能力的服务输出。参与多家企业问答机器人系统、知识图谱系统搭建,针对集团型知识管理与问答效果优化有丰富实战经验。

王立玺 中国电子技术标准化研究院 标准创新服务中心 副主任

个人介绍:王立玺,中国电子技术标准化研究院标准创新服务中心标准智能服务研究室负责人/高级工程师。长期从事电子信息技术领域标准科研工作,主持了“电子信息领域标准大数据公共服务平台”、“面向疫情防控和复产复工的标准知识图谱智能服务平台研发和应用”等多项省部级科研项目。近年来,主要致力于标准数字化、标准知识图谱相关理论、技术、应用研究,突破了一系列关键技术。授权《标准知识图谱构建、标准查询方法及装置》等标准知识图谱相关专利5项,软件著作权十余项。

演讲题目:标准数字化关键路径--标准知识图谱的构建与应用

江悦 阿里巴巴 算法工程师

个人介绍:2020年毕业于南京大学,同年加入阿里巴巴担任算法工程师,在企业智能事业部负责搜索 Query 理解相关工作。

演讲题目:基于知识增强和预训练大模型的 Query 意图识别

演讲提纲:

1. 基于知识增强和预训练大模型的 Query 意图识别的场景

2. Query 意图识别架构介绍

3. 基于知识增强和预训练大模型的 Query 意图识别

4. 总结&思考

听众收益:

1. 了解企业级搜索的 QP 建设

2. 如何基于知识增强进行超短文本 Query 的意图识别

3. 基于预训练大模型的 Query 意图识别实践

李亮 百度智能云AI应用产品部 解决方案总监

个人介绍:从事电网和发电行业信息化工作10+年,具有丰富的电网调度、电力交易、发电场站智慧化建设整体规划和项目管理经验,目前主要负责百度知识中台在能源方向的整体解决方案。

演讲题目:基于知识图谱、NLP与大模型技术的企业智能搜索与知识应用平台建设

演讲提纲:

1. 百度对知识中台的理解和观点

2. 百度知识中台整体解决方案

3. 基于知识中台的应用场景

听众收益:

1. 如何通过知识体系建设助力企业数字化转型

2. 知识中台重要建设过程和核心技术点

3. 知识中台的典型应用场景和行业案例

张强 国网智能电网研究院 计算及应用研究所认知计算技术总监

个人介绍:国网智能电网研究院,计算及应用研究所认知计算技术总监,国家电网有限公司“电力超融合智能计算及应用技术科技攻关团队”成员。长期从事电力领域自然语言处理、知识图谱及认知计算研究,作为项目负责人承担国网公司总部科技项目10余项、牵头公司标准1项。近5年来,在国内外核心刊物会议上发表EI检索论文20余篇,获授权国内发明专利3项、软件著作权多项。中国电机工程学会、中国人工智能学会及中国计算机学会会员。牵头电力自然语言处理大规模预训练模型研发,并在2022年“Wave Summit AI大模型 智领未来”技术论坛上做“电力自然语言处理大模型”主题演讲,牵头能源语义搜索、电网设备知识计算引擎研发,系统已在国网公司“两库一平台”完成部署,并向公司全网提供设备知识搜索问答计算服务,有效的提升了电力领域信息检索问答的效率。

演讲题目:电网主设备知识计算关键技术及工程应用

演讲提纲:

1. 基本情况介绍

2. 电网主设备知识计算关键技术及工程应用:项目背景、技术难题、关键步骤、创新点、知识产权、行业评价与影响、应用推广与经济社会效益

3. 未来展望

听众收益:

1. 机器解析加工海量非结构化设备运检资料

2. 机器关联理解零散碎片化设备运检知识

3. 机器精准适配多场景设备运检业务

桑海龙 58同城 AI Lab 算法资深工程师

个人介绍:桑海龙,58同城 TEG-AI Lab 算法资深工程师,智能客服算法负责人,2019年10月加入58同城,一直从事智能客服算法研发工作,本硕毕业于哈尔滨工业大学,2017年7月毕业后校招加入猎豹移动,从事对话算法工作。

演讲题目:招聘平台下的对话机器人技术实践

演讲提纲:微聊和电话是58同城招聘平台上 C 端求职者和 B 端招聘者的关键连接手段,C 会主动给 B 发起微聊,系统也会通过微聊渠道把一些B端职位推送给 C 端用户(称为反向邀约)。我们将对话机器人应用在上述场景,当 B 不在线时和 C 多轮对话,进行人岗匹配和求职意向判断,若 C 高意向,会利用智能双呼能力(即先由机器人智能外呼提醒 B,B 若同意转接 C,机器人自动外呼 C,然后 BC 电话直连)来促成 BC 的电话连接。本次分享将围绕对话机器人技术在招聘平台的应用展开,包括 QABot 自动问答、TaskBot 多轮引导、对话完成后用户求职意向识别等算法,以及智能双呼能力的应用;此外,我们在问答、求职意向识别等场景实验了 ChatGPT 的应用效果,并与线上模型进行了对比。

听众收益:

1. 招聘场景下对话机器人技术体系的构建

2. 对话机器人中各技术模块的实现

3. ChatGPT 技术的相关探索实验

赵骥 货拉拉 算法工程师

个人介绍:多年 LBS 场景搜索推荐经验。

演讲题目:LBS 场景下数据图谱在搜索推荐的应用

演讲提纲:

1. 介绍 LBS 场景下数据图谱

2. 介绍 LBS 数据图谱在搜索应用

3. 介绍 LBS 数据图谱在推荐应用

听众收益:

1. 了解 LBS 数据图谱价值

2. 了解 LBS 场景搜索推荐利用数据图谱优化应用

技术动态 | AIGC时代知识图谱技术的发展与最佳实践_第7张图片

识别二维码,免费报名,预约本论坛直播

807032a21c7b310af510a787843c08fa.png

04e20f68b7253f81322010cc104cee11.png

⑤ 知识图谱与AIGC论坛

9aa75045764be84d916be81d543f6fa1.png

0fb18187da1cb76835aae0990bfd1e3e.png

2023年03月18日

论坛名称:知识图谱与AIGC

出品人:付瑞吉

14:00 - 17:00

14:00

Opening

出品人:付瑞吉 快手 MMU 知识图谱中心负责人

14:05

面向结构化数据的文本生成技术研究

哈尔滨工业大学 副教授/博导

冯骁骋

14:45

知识桥接的文本生成算法

南京航空航天大学 教授

李丕绩

15:25

AIGC 时代的多模态知识工程思考与展望

复旦大学 研究员、博导

李直旭

16:05

神经网络大模型 ⊕ 知识图谱 ⊕ 强化学习 = AGI(通用人工智能)

达观数据 副总裁

王文广

出品人:付瑞吉 快手 MMU 知识图谱中心负责人

个人介绍:快手 MMU 知识图谱中心负责人,本硕博毕业于哈工大,中科大博士后,高级工程师。曾担任科大讯飞 AI 研究院副院长,获吴文俊人工智能科技进步奖一等奖。研究方向包括知识图谱、智慧教育等,在 ACL、EMNLP、Coling、IJCAI、TASLP 等国际会议和期刊上发表学术论文多篇,申请(获得)国家发明专利50余项。在科大讯飞期间,曾研发智能评阅技术,在多地中高考、CET 等大规模考试阅卷中应用;主持研发的个性化学习技术应用于讯飞学习机等多款教育产品中。2021 年加入快手,主持研发业界首个亿级别多模态短视频百科体系“快知”。

冯骁骋 哈尔滨工业大学 副教授/博导

个人介绍:冯骁骋,哈尔滨工业大学计算学部社会计算与信息检索研究中心副教授、博导。智能科学与技术系副主任,中文信息处理黑龙江省重点实验室主任助理。研究兴趣包括自然语言处理、文本生成、机器翻译等。在ACL、AAAI、IJCAI、TKDE、Chinese Science等CCF A/B类国际会议及期刊发表论文30余篇。据Google学术统计,论文引用数量超过2800次,一篇论文入选Paper Digest EMNLP 2020 Top Ten 高引论文。担任NIPS、ICML、AAAI、IJCAI、ACL等国际会议程序委员会高级/普通成员;兼任鹏城国家实验室双聘副研究员、中国中文信息学会自然语言生成与智能写作专委会副秘书长、中国计算机协会哈尔滨YOCSEF副主席等。与华为、腾讯、科大讯飞、微软等国际一流互联网公司保持长期科研合作关系。

演讲题目:面向结构化数据的文本生成技术研究

演讲提纲:近年来,随着深度学习方法的快速发展,文本生成技术也由科学研究走向了实际应用。目前,文本生成任务形式相对多样,包括:自动文摘、对话生成、风格迁移、结构化数据描述生成和多模态数据描述生成等,各个任务之间既存在一些任务驱动的特殊表示和规则也包含相对通用的技术路线和方法。本次讲解将在简要介绍文本生成任务的基础上重点围绕面向结构化数据的文本生成技术进行讲解,包括结构化数据的建模,知识的引入和不同知识的使用方式。期望本次报告对知识驱动的文本生成技术感兴趣的相关听众有所帮助。

李丕绩 南京航空航天大学 教授

个人介绍:李丕绩,南京航空航天大学计算机科学与技术学院/人工智能学院教授,博士生导师,2021年度南京航空航天大学"长空学者"获得者。香港中文大学博士,曾任腾讯AI Lab自然语言处理中心高级研究员。研究方向主要为自然语言处理,包括预训练模型、文本摘要、文本生成和对话系统。曾经在相关领域顶级会议如ACL、EMNLP、SIGIR等发表学术论文60余篇。多次受邀担任ACL、EMNLP、EACL、IJCAI等会议的领域主席。在工业界工作期间负责了多个语言理解、文本生成和智能对话相关重要项目的算法研发和产品发布,有丰富的科研落地实践经验。主持或参与多项国家自然科学基金、CCF-腾讯犀牛鸟基金、CCF-智谱大模型基金等项目。

演讲题目:知识桥接的文本生成算法

演讲提纲:虽然基于神经网络的对话系统已经取得了很大的进步,但是现有模型的成功仍然建立在基于大量训练数据的模式刻画和描述上面,在一些特定的应用场景中表现出知识表达运用和逻辑推理能力较弱的缺点,从而导致模型可解释性差、可控性低、容错能力弱等特点。调研发现,通过向神经网络中融入符号化的知识可以缓解上述这些问题,增强对话生成的质量。所以,我们探索了神经符号计算方式来进一步提升对话系统性能的可行性,具体包括开放文本到符号知识的抽取生成、符号语义表示学习和推理模型、符号推理约束的可控解码等策略。实验也表明所探究思路确实在对话系统和文本生成任务中能取得不错的结果。

李直旭 复旦大学 研究员、博导

个人介绍:李直旭,复旦大学计算机科学技术学院研究员、博士生导师,上海市数据科学重点实验室主任助理,复旦大学知识工场实验室执行副主任,曾兼任科大讯飞苏州研究院副院长,博士毕业于澳大利亚昆士兰大学,主要研究方向为认知智能与知识工程、多模态知识图谱、大数据分析与挖掘等。在领域主流期刊和国际会议上发表论文150余篇,主持十余项国家和省部级科研项目。

演讲题目:AIGC 时代的多模态知识工程思考与展望

演讲提纲:ChatGPT 的火爆出圈使得 AI 生成(AIGC)技术受到了全社会前所未有的广泛关注。此消彼长之下,传统的知识工程遭受了诸多质疑。在多模态智能领域,AIGC 的能力不断提升,多模态知识工程工作应该何去何从?是否仍有价值?在本次分享中,讲者将探讨当前 AIGC 技术耀眼“光芒”背后的“暗面”,思考与展望 AIGC 时代的多模态知识工程研究。

听众收益:

1. AIGC 时代的知识工程是否仍具价值?

2. 多模态知识工程工作应何去何从?

3. 多模态智能的实现路在何方?

王文广 达观数据 副总裁

个人介绍:王文广,达观数据副总裁,高级工程师,人工智能标准编制专家,自然语言处理和知识图谱著名专家,《知识图谱:认知智能理论与实战》作者,专注于AI 大工程、知识图谱、认知智能、自然语言处理、图像与语音分析、大数据和图分析等人工智能方向。现在是上海市人工智能标准化技术委员会委员,上海科委评审专家,中文信息学会(CIPS)语言与知识计算专委会委员,中国计算机学会(CCF)高级会员,中国人工智能学会(CAAI)深度学习专委会委员。曾获得多个国际国家级、省部级、地市级奖项,拥有数十项人工智能领域的国家发明专利和会议、期刊学术论文。在达观数据致力于将自然语言处理、知识图谱、计算机视觉和大数据技术产品化,以OCR、文档智能处理、知识图谱、RPA等产品服务于金融、智能制造、贸易、半导体、汽车工业、航空航天、新能源、双碳等领域。

演讲题目:神经网络大模型 ⊕ 知识图谱 ⊕ 强化学习 = AGI(通用人工智能)

演讲提纲:以人为本AGI :就是以人类为中心的通用人工智能,或者说人工智能是以服务人类为目的的,有名的“机器人三定律”说的也是这个。人工智能发展至今,已经出现了能够将神经网络大模型、知识图谱 、强化学习三者融合的系统(产品),而这已经隐隐散发出一点 AGI 的曙光,或者称之为婴儿期的 AGI。在这个节点往后,类似军备竞赛一样的投入研究和持续发展,曙光终究会成为朝阳,而婴儿也会茁壮成长!本次演讲围绕 神经网络大模型 ⊕ 知识图谱 ⊕ 强化学习 = AGI 方面的观点和思考,与大家一起交流。

听众收益:

1. ChatGPT、Google Bard 等AI 江湖的倚天屠龙记

2. AGI 曙光初现

3. AGI 范式探讨

技术动态 | AIGC时代知识图谱技术的发展与最佳实践_第8张图片

识别二维码,免费报名,预约本论坛直播

6736d6698a17a7868f21647aac9f06cd.png

d5c1d4c96c652d6ec26b2e2cf9b021e1.png

⑥ 最佳行业知识图谱实践论坛

96ab383863be13ba11683ef535decf89.png

c9cf815daa84cb88ae0a48f5e8836b08.png

2023年03月18日

论坛名称:最佳行业知识图谱实践

出品人:孙常龙 达摩院

14:00 - 17:00

14:00

Opening

出品人:孙常龙

达摩院 资深算法专家

14:05

电信网络运营事件知识图谱构建

中国电信研究院 智行云网大脑技术负责人

孙佩霞

14:45

金融知识图谱的推理与应用

蚂蚁集团 算法专家

赵登

15:25

企业知识图谱的构建及业务应用

达摩院 算法专家

宋凯嵩

16:05

知识图谱在法律领域的研究与实践

达摩院 高级算法工程师

赵新颜

出品人:孙常龙 达摩院 资深算法专家

个人介绍:孙常龙,现任达摩院-语言技术实验室-应用算法 团队负责人。拥有多篇授权专利,在顶级会议发表论文30余篇,承担国家科技部重点研发项目多项,带领团队在多项的国内外评测比赛中获得第一名,获得2022年世界互联网领先科技成果奖、2022年度高等学校科学研究优秀成果奖(科学技术)科技进步一等奖。研究方向包括机器学习、自然语言理解、文档理解等。在技术赋能业务方面,深入司法、通信、互联网等垂直领域的智能化建设,首创了司法全流程智能化审判系统,该智审模式2022年纳入社科院《法制蓝皮书》,已经落地多家法院。

孙佩霞 中国电信研究院 智行云网大脑技术负责人

个人介绍:主要负责网络运营知识图谱建设,图谱检索,推荐,对话机器人,网络运营大模型相关技术架构。参与过IEEE P2807知识图谱国际标准撰写。国家知识图谱标准撰写,AIIA大模型,智能决策标准撰写。

演讲题目:电信网络运营事件知识图谱构建

演讲提纲:介绍电信网络运维领域事件知识图谱构建,知识图谱检索推荐,知识交互等应用。主要内容包括:

1. 电信网络运营场景介绍

2. 网络运营知识图谱构建

3. 网络知识图谱业务应用

4. 展望

听众收益:

1. 通过网络运营事件知识图谱刻画运维全周期,提升运维效率,并实现知识结构化沉淀。

2. 探索网络场景和知识图谱进一步结合使用,提升网络自智水平。

赵登 蚂蚁集团 算法专家

个人介绍:博士,负责蚂蚁集团知识图谱平台算法能力建设和业务支持。

演讲题目:金融知识图谱的推理与应用

演讲提纲:知识图谱作为一种新的数据管理模式越来越受到行业的重视,它通过图结构与知识语义对客观世界进行建模,定义实体之间的语义关联,提供辅助的推理和决策,与金融、公安等领域的结合创造了巨大的市场空间。过去几年,蚂蚁知识图谱平台结合金融多元业务场景构建领域知识图谱,围绕控风险、促增长核心命题持续和业务深度合作,在这个过程中也沉淀了支撑多业务领域的企业级知识图谱架构和算法推理工具。主要内容包括:

1. 介绍知识图谱的业界发展趋势;

2. 介绍蚂蚁知识图谱的核心能力;

3. 介绍蚂蚁金融知识图谱在各个场景中的应;

4. 对蚂蚁知识图谱未来发展的展望。

听众收益:

1. 了解金融知识图谱的特点和核心能力

2. 了解金融知识图谱如何在各领域发挥应用价值

宋凯嵩 达摩院 算法专家

个人介绍:东北大学计算机软件与理论专业博士,18年加入阿里巴巴达摩院(杭州)科技有限公司,从事情感分析、内容审核、知识图谱等相关技术的研究和产品研发。独立或合作在 AAAI、IJCAI、SIGIR、WWW、TKDE 等顶级学术会议和期刊发表论文30余篇。

演讲题目:企业知识图谱的构建及业务应用

演讲提纲:通过整合企业及企业关联信息,挖掘海量互联网数据,运用智能分析算法,构建企业知识图谱,全方位洞悉企业信息,帮助企业在风险控制、企业营销、市场监测等领域打造智能企业级应用。

听众收益:

1. 企业图谱的特点?

2. 如何构建企业图谱?

3. 如何把企业图谱应用在下游业务?

赵新颜 达摩院 高级算法工程师

个人介绍:阿里巴巴达摩院高级算法工程师,博士毕业于中国科学技术大学,研究方向为知识图谱,自然语言生成,对话系统,在CCF A类会议,SCI 1区期刊发表相关论文多篇。

演讲题目:知识图谱在法律领域的研究与实践

演讲提纲:法律知识图谱是指一个包含海量法律相关实体和关系的结构化知识库,可以建模不同案件之间、当事人之间深层次的关联关系。本报告将探讨如何利用自然语言处理技术对海量裁判文书进行处理和分析,将分析结果转化为图谱中的实体和关系,构建起法律知识图谱;并阐述并图游走算法和图表示算法其在类案推荐、律师推荐、知识推理等具体场景中的应用方式。同时,报告将介绍图谱存储和可视化交互的相关工具。

听众收益:

1. 法律图谱的特点;

2. 如何构建法律图谱;

3. 图游走和图表示算法的研究与应用

技术动态 | AIGC时代知识图谱技术的发展与最佳实践_第9张图片

识别二维码,免费报名,预约本论坛直播


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

技术动态 | AIGC时代知识图谱技术的发展与最佳实践_第10张图片

点击阅读原文,进入 OpenKG 网站。

你可能感兴趣的:(知识图谱,AIGC,人工智能)