阿里AI获NLP顶会比赛冠军,达摩院计划推出首个通才型AI医生

12月24日消息,在自然语言处理(NLP)领域顶级会议EMNLP 2019上,阿里AI获得微生物群落信息抽取比赛(BB Task)“关系和实体联合抽取”任务冠军,相关技术已被用于搭建医疗领域通用知识图谱。阿里巴巴达摩院计划推出业内首个掌握全域医疗知识的通才型AI医生。

EMNLP由国际语言学会(ACL)下属的 SIGDAT 小组主办,阿里AI参加的BioNLP工作坊旨在解决生物医学领域的NLP问题,BB Task(Bacteria Biotope Task)是其重点赛事。

BB Task要求参赛者从论文、病例、网页等非结构化文本中抽取与微生物有关的知识。在最考验综合实力的关系和实体联合抽取任务中,阿里AI名列全部三项评测第一。

阿里AI获NLP顶会比赛冠军,达摩院计划推出首个通才型AI医生_第1张图片

不管对人类还是AI,医疗都是高难度学科,微生物更是典型的细分领域,可供AI学习的资源非常有限。但唯有攻克低资源语料领域,AI医生才有可能成为通才。

达摩院医疗AI团队设计了基于BERT的多任务学习模型,借助大规模语料对关系和实体进行建模,再通过大规模语料与低资源语料之间的知识迁移,提升AI对低资源语料的信息抽取能力。

达摩院正在研发业内首个涵盖所有科室知识的医疗领域知识图谱。知识图谱是描述真实世界各种实体/概念及其关系的语义网络图。通俗地说,将真实世界的知识以机器能够理解的方式存储到计算机中,就是知识图谱。

信息抽取是搭建知识图谱的关键一步。真实世界的医学知识散布于科学论文、医疗病例、新闻报道等文本,AI通过从中抽取实体、关系、属性等知识要素来学习知识。

阿里AI获NLP顶会比赛冠军,达摩院计划推出首个通才型AI医生_第2张图片

用上医疗知识图谱的对话机器人(骨科)

阿里AI获NLP顶会比赛冠军,达摩院计划推出首个通才型AI医生_第3张图片

用上医疗知识图谱的对话机器人(乳腺外科)

知识要素常以三元组方式表示,比如「实体1-关系-实体2」「实体-属性-属性值」等。比如,比尔盖茨、美琳达夫妇的关系,用三元组表示就是「比尔盖茨-夫妻-美琳达」,比尔盖茨和巴菲特的关系则是「比尔盖茨-合作伙伴-巴菲特」。懂得这些之后,AI就能回答“比尔盖茨的夫人是谁”之类的问题。

基于知识图谱这一核心技术,达摩院未来还将推出智能医疗保健辅助系统“健康智能导引”,开辟AI时代的健康管理新模式。

目前,阿里巴巴已与多个知名药企及互联网医疗平台达成合作,人们很快就能体验到由达摩院医疗知识图谱支持的智能医疗对话系统。

你可能感兴趣的:(产品见闻)