横空出世一周年,百度ERNIE再夺权威语义评测5项世界冠军


近日,全球规模最大的语义评测比赛 SemEval 2020 结果出炉,百度基于飞桨平台自研的语义理解框架 ERNIE 一举斩获 5 项世界冠军,囊括视觉媒体的关键文本片段挖掘、多语攻击性语言检测和混合语种的情感分析。

横空出世一周年,百度ERNIE再夺权威语义评测5项世界冠军_第1张图片

SemEval 是全球范围规模最大、参赛人数最多的权威语义评测竞赛。其由国际计算语言学协会(Association for Computational Linguistics, ACL)的 SIGLEX 主办。自 2001 年起,SemEval 已成功举办十四届,在业界和学术界具有极高影响力。此次 SemEval 将和自然语言处理领域的顶级会议 COLING 联合举办。

ERNIE 是此次五项世界冠军背后的「趁手利器」。去年,ERNIE先后完成两版重大升级。ERNIE 1.0 提出知识增强的语义表示模型,而 ERNIE 2.0 则构建了持续学习语义理解框架,在中英文 16 个任务上超越业界最好模型

此后,ERNIE 模型再次改进,以历史上首次超越 90 大关的成绩登顶自然语言处理领域最权威的 GLUE 评测榜单。本次比赛,ERNIE 再度创新,再立战功,夺得五项世界冠军。

 

让 AI 更懂「轻重」视觉媒体的关键文本片段挖掘

 

该任务由美国休斯顿大学、Adobe 美国研究院联合举办,旨在自动挖掘海报、广告、传单等视觉媒体中文本的关键片段,对其进行重点设计,提升宣传效果。由于人们对于同一文本重要内容的判断不一致,在没有唯一标准的情况下,该任务存在极大的难度。

百度 ERNIE 团队采用多种技术手段解决这个难题:首先 ERNIE 模型作为语义信息提取模块,对各片段重要性进行建模;然后针对关键片段标准不统一的问题,设计了更贴近目标的 5 Label 的 Pairwise 损失函数;最后从数据出发构造了多种针对性的语义特征以及数据增强策略,最终以 5 项指标全部第一的成绩获得冠军

横空出世一周年,百度ERNIE再夺权威语义评测5项世界冠军_第2张图片

比赛中,主办方 Adobe 希望将赛题的解决方案应用于 Adobe Spark,赋予其海报自动设计能力,以达到更好的宣传效果。如下图所示的「ERNIE」、「轻重」的黑白效果就是自动挑选的结果。百度 ERNIE 团队采用 ERNIE 让 AI 更懂文字的「轻重」,释放广大视觉设计者的劳动力,使其能够更专注于对核心内容的设计。

此外,该项技术已应用于百度搜索,能够动态分析出用户查询内容中的重要片段,使其返回更精准的搜索结果,让百度更懂您。

横空出世一周年,百度ERNIE再夺权威语义评测5项世界冠军_第3张图片

 

让世界更有 AI,多语攻击性语言检测

 

该任务由多个国家的研究机构联合举办。其中包括了英国剑桥大学、美国 IBM 研究院、以及来自德国、丹麦、卡塔尔的多所著名大学和研究院。该任务包含了三个子任务:

第一个子任务是在对英语、丹麦语、希腊语、阿拉伯语和土耳其语等包含五种语言的社交媒体进行攻击性检测。百度 ERNIE 团队构建了大规模的多语预训练模型,充分挖掘海量的多语无监督文本,用相同的模型来学习所有语种的语义表示,使模型具备跨语言的理解和分析能力。

同时,采用 Multi-lingual Fine-tuning 的方法,利用其他语言的知识辅助建模,最终以五项语言平均分第一名的成绩取得冠军。

另外两个任务是在英语环境中对攻击性语言的类型和目标分别进行更加精细化的分析。百度 ERNIE 团队通过数据蒸馏的技术,从更多无监督的网络文本中学习多种模型的 Soft Label,分别以 F1 超过第二名 1.0% 和 4.4% 的绝对优势取得了冠军。

横空出世一周年,百度ERNIE再夺权威语义评测5项世界冠军_第4张图片

随着网民人数的不断增加,网民态度立场不同、文化水平及道德素质参差不齐的状况便摆在我们面前。网络暴力和网络人身攻击现象由此而生。政府、社交网站、搜索引擎、兴趣社区都在大力研究如何检测出社交媒体攻击性行为,帮助人们构建一个更加和谐友爱的网络环境。百度的研究者也希望通过这一技术,能够让世界充满 AI,少一些偏见。

 

让 AI 更有情感,混合语种的情感分析

 

该任务的主办方包括谷歌研究院、美国休斯敦大学以及印度的多所高校等。在比赛中,主办方搜集了源于社交网络的语料片段,测试参赛者对于相关语料片段的情感分析能力。这些语料中都包含一种特殊的语言现象:语码混用——即一段语料中同时混有多种语言。主办方致力于探索时下的 AI 技术对于这一类新问题的解决能力。

不同于传统的情感分析,随着互联网上的内容越来越丰富,夹杂着不同语种的内容不断产生。这些内容中可能混合着中文、英文等多种语言。针对此类文本内容,传统的基于单语语料的情感分类模型已经无法发挥作用。

针对此问题,百度的研究者首先利用 ERNIE 进行 Zero-Shot 情感分类。为了充分利用多语种语料的信息,还引入了基于对抗学习的多语种模型,进一步地提升了多语种情感分析的效果。最终在印度语/英语混合任务上以 F1 值超过第二名 1.9% 的绝对优势获得第一。

横空出世一周年,百度ERNIE再夺权威语义评测5项世界冠军_第5张图片

随着 AI 技术日新月异的发展,已经逐渐的走进千家万户。在解决日常生活需求之余,让 AI 可以更通情达理、更知性,并感知用户的喜怒哀乐、提供贴心的服务,也是一个有温度的 AI 应该达成的目标。百度始终希望通过 AI 让复杂的世界有更多的贴心。

百度 ERNIE 团队在 SemEval 2020 取得五项世界冠军并非偶然,这得益于团队在语义理解领域的深厚积累。目前,ERNIE 语义理解技术已广泛地应用于百度内外多个产品和技术场景,在百度搜索、小度音箱、信息流推荐等一系列产品应用中发挥了重要作用,大幅提升了产品的技术效果和用户体验,逐步赋能各行各业。

赋予机器「认知」能力,是人工智能中最具挑战的问题。自然语言处理是认知智能中的重要领域。深入理解语言,让机器具备人类的思考和理解能力意义重大。

百度在自然语言处理领域已有二十年的积累与沉淀,具备了最前沿、最全面、最领先的技术布局,不仅专注于前瞻技术探索,更致力通过技术应用解决实际问题。而飞桨是目前国内自主研发、开源开放、功能最完备的产业级深度学习平台,集深度学习核心框架、基础模型库、端到端开发套件、工具组件和服务平台于一体,服务于150多万开发者,正与合作伙伴一起帮助越来越多的行业完成 AI 赋能。

点击“阅读原文”,即可查看ERNIE的开源代码~

END

你可能感兴趣的:(横空出世一周年,百度ERNIE再夺权威语义评测5项世界冠军)