图谱实战 | 医学知识图谱的价值与应用场景

转载公众号 | OMAHA联盟


随着技术的进步和市场的逐渐成熟,人工智能在医疗等领域的应用日益广泛和深入。而知识图谱技术作为一种从海量文本和图像中抽取结构化知识的手段,正在成为推动人工智能发展的核心驱动力之一。

  ◆  ◆

知识图谱概述

知识图谱是一种用图模型来描述知识和建模世界万物之间的关联关系的技术方法,由节点和边组成,节点表示实体(entity)、概念(concept)或属性值(value);边表示实体的属性(property)或实体间的关系(relation),三元组是知识图谱的基本表示形式。在逻辑上可将知识图谱分为模式层和数据层,模式层一般指Schema,是知识图谱的概念模型和逻辑基础,是数据层的规范约束;数据层主要由一系列的事实组成,主要基于模式层定义的模型构建数据,以三元组形式存储。以二甲双胍为例,其部分知识图谱示例如图1。

图谱实战 | 医学知识图谱的价值与应用场景_第1张图片

图1 二甲双胍部分知识图谱示例

知识图谱按领域可分为通用知识图谱和领域知识图谱,医学知识图谱是一种重要的领域知识图谱,它在语义搜索、知识问答和临床决策支持等智慧医疗领域都有很好的发展前景。

  ◆  ◆

医学知识图谱的应用场景

1. 语义搜索。语义搜索不拘泥于用户所输入请求语句的字面本身,而是透过现象看本质,准确地捕捉到用户所输入语句后面的真正搜索意图,从而更准确地返回最符合用户需求的搜索结果。将知识图谱应用于搜索是当前实现语义搜索的有效解决方案,知识图谱描述了事物的分类、属性和关系,具有丰富的语义信息,可以为语义搜索提供极大的底层支持。基于医学知识图谱的语义搜索目前被用于医学百科知识、临床指南/文献、医学健康资讯、医疗保健信息等内容的推荐。

2. 知识问答。基于知识库的问答(Knowledge-Based Question Answering,KBQA)也称知识问答,主要依托于大型的知识库,将用户的自然语言问题转化成结构化查询语句,直接从知识库中导出用户所需的答案。KBQA已经成为各种智能问答系统的标准组件配置,知识图谱由于具有知识丰富、结构化程度高和易于推理等特点,是KBQA的知识库中最重要组成部分之一。

医学知识较其他领域相比专业性更高,非专业人士很难通过自主理解一堆资源文档,来精准地找到相关问题的答案。因此,基于医学知识图谱的KBQA可以帮助患者更加快捷、便利地获得问题的答案,适用于医学知识科普、智能导诊、自诊等领域。

3. 临床决策支持。临床决策支持(Clinical Decision Support,CDS)是指运用相关的、系统的临床知识和患者基本信息及病情信息,向临床医务工作者提供加强医疗相关的决策和行动的信息,提高医疗质量和医疗服务水平。具有临床决策支持功能的系统,称为临床决策支持系统(Clinical Decision Support System,CDSS),一般由知识库、推理机和人机交互接口三个部分组成,其中知识库是核心。

医学知识图谱中包含丰富的医学基础知识,可以作为CDSS知识库中的重要组成部分,它为CDSS的推荐结果提供了可解释的依据,能够协助系统从辅助诊断、治疗方案推荐、合理用药检测等方面为临床医务人员提供决策支持。

随着技术和行业的发展,目前知识图谱也被应用于辅助药物研发、公共卫生事件的预警场景中。

1. 药物研发。近年来,人工智能辅助药物研发逐渐成为研究的热点。知识图谱可应用于药物研发的知识的聚类分析,帮助提出新的可以被验证的假说,从而加速药物研发的过程,降低研发成本。

2. 公关卫生事件应对。在流行病学调查和疫情发生事件的分析和预警等公共卫生事件场景中,知识图谱采用图存储数据的理念可以起到非常大的帮助。例如,利用知识图谱的形式可以直观地表示流行病调查中的人员分布、人员活动轨迹、发病时间等信息,基于图展示出的信息可以更方便的用于病例之间相关性的分析,更快地分析和梳理出感染源头。另外,对疫情发生事件的脉络进行分析,通过找到多个事件存在的因果关系,构建疫情相关事件知识图谱,帮助发现潜在的公共威胁,从源头上预防和降低舆情风险。

  ◆  ◆

“汇知”医学知识图谱

“汇知”医学知识图谱(Wisdomed Medical Knowledge Graph,简称“汇知”图谱)致力于建立符合中文环境下的规范、共享、易用、动态、系统的医学知识图谱。以满足临床智慧诊疗的知识应用需求为切入点,围绕“诊前-诊中-诊后”流程开展疾病、药品、检验检查、手术操作四大细分领域知识图谱构建,为医疗领域提供广泛的知识支撑。

1 | “汇知”图谱的构建

“汇知”图谱基于临床指南、临床路径、药品说明书、医学书籍和医学文献等高质量医学资源,采用机器+人工方式进行构建,专家全流程参与,严格把关数据质量,真实还原医学知识。同时,“汇知”图谱与“七巧板”术语集建立映射关系,实现数据的标准化,从而促进知识更深度地应用。

图谱实战 | 医学知识图谱的价值与应用场景_第2张图片

图2 “汇知”图谱总体架构

2 | “汇知”图谱资源

“汇知”图谱根据不同领域划分,可分为疾病、药品、手术操作和检验检查四大知识图谱。目前已发布疾病和药品知识图谱,共计11.7万实体、91.4万三元组,后续将发布手术操作和检验检查知识图谱。

■  疾病知识图谱:以疾病为中心,链接超过3万种疾病的临床表现、科室、相关检查、治疗方式、症状等核心关系。共包含7.5万实体,34.5万三元组。为辅助诊疗、知识问答等系统的研发提供高质量、结构化知识库基础,助力疾病诊疗水平的提升。

■  药品知识图谱:以药品为中心,链接超过2.3万种药品的适应证、适用人群、禁忌证、禁忌人群等核心关系,共包含4.8万实体,59.0万三元组。为助力临床合理用药等场景提供可靠的智能引擎。

图谱实战 | 医学知识图谱的价值与应用场景_第3张图片

图3 “汇知”医学知识图谱示例

3 | “汇知”图谱获取方式

感兴趣的读者可以登录HiTA知识服务平台(hita.omaha.org.cn)下载知识图谱样例数据体验,也可以加入OMAHA获取全量“汇知”图谱资源。

图谱实战 | 医学知识图谱的价值与应用场景_第4张图片

(“汇知”图谱资源)

图谱实战 | 医学知识图谱的价值与应用场景_第5张图片

(样例数据)

注:部分内容节选自《imit白皮书第二十二期发布:医学知识图谱:医学人工智能的基石》


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

图谱实战 | 医学知识图谱的价值与应用场景_第6张图片

点击阅读原文,进入 OpenKG 网站。

你可能感兴趣的:(大数据,编程语言,python,人工智能,java)