【会议笔记】第五届中国健康信息处理大会(CHIP2019)Day01

Day01 前沿讲习班

第一天的前沿讲习班邀请了几位企业的大牛来讲解工业界的知识图谱或者生物信息的进展方式

倪渊 平安医疗 “基于知识图谱的智能临床辅助决策技术和实践”

【会议笔记】第五届中国健康信息处理大会(CHIP2019)Day01_第1张图片

  • 医生辅助决策场景

首先介绍了医生辅助的决策场景,从病人主诉开始,医生会询问病人的其他症状,然后进行检查检验,医生诊断,医生治疗,诊疗结束后,会据证搜索,临床证据分析,医生还会分析当下热点研究方向,进行热点主体识别,最后还会对一些专家团队进行追踪。
在平安医疗的知识图谱中,主要有疾病与症状,药物与药物,疾病与检查检验,指南与文献与相似病例。

  • 医疗知识图谱构建

【会议笔记】第五届中国健康信息处理大会(CHIP2019)Day01_第2张图片
在医疗知识图谱的Schema中,其他的因为ppt原因看不太清,主要我关注了一下他的疾病以及疾病属性,疾病属性有运动,食物,风险因子,科室以及文章,这些属性都可以从不同角度以及不同实体维度反应疾病特征,这种属性列表方法值得借鉴。
【会议笔记】第五届中国健康信息处理大会(CHIP2019)Day01_第3张图片
【会议笔记】第五届中国健康信息处理大会(CHIP2019)Day01_第4张图片
知识图谱的构建流程依旧是命名实体识别,关系抽取等常见的NLP过程,在第一步,候选术语及概念抽取的过程中,进行了术语的结构化。
命名实体识别过程才用的是BERT-BiLSTM-CRF,标准化采用的是N-gram匹配的方法
关系抽取采用的是规则匹配+基于模型的方法
【会议笔记】第五届中国健康信息处理大会(CHIP2019)Day01_第5张图片
此外,他们还进行了实体链接的部分,通过同义词替换,细粒度切词以及规则模板的方法,对抽取出的实体进行了实体链接的过程,为的是对实体进行标准化,并且更好的诠释抽取实体的意思。细粒度切词是将实体名称按照Disease/Type/Body/Number/Degree等几个部分,将实体切分为单个的字或者词。

  • 诊疗中的临床决策支持

【会议笔记】第五届中国健康信息处理大会(CHIP2019)Day01_第6张图片
倪渊博士为我们介绍了平安医疗目前已经上线的一个产品,AskBob,它的工作流程为:发现备选症状(计算症状的共现频率),基于鉴别诊断进行排序,诊断模型的应用,得到最终的诊断结构,进行用药推荐。
用药的推荐才用的是知识驱动的决策树以及数据驱动的决策树细化,由于病人需要对症下药,因此首先会构造一个根据病人症状得到最终用药情况的决策树,其次病人的用药case by case,可能会因为病人自身的身体情况或者同时使用的并发药产生不同的药效,因此还加入了有真实数据驱动的决策树。
在个性化用药推荐中,加入了基于药物疗效的分析来优化短期结局,还加入了基于强化学习的模型来优化长期结局。
【会议笔记】第五届中国健康信息处理大会(CHIP2019)Day01_第7张图片

  • 诊疗后的询证查找和文献分析
    在诊疗结束后,还进行了疾病检索,关联分析推荐,语义检索等内容,在文献分类中,进行了作者消歧,文献主题分析,以及RCT(随机对照试验)文章细粒度结构化。其中进行了PIO的模式进行询证查找,其中P代表participant,I代表information,O代表outcome

OHDSI

OHDSI是一个由美国哥伦比亚大学牵头的观察性健康医疗数据科学与信息学计划,是一个世界性的公益性非盈利研究联盟,旨在通过各个组织间的合作来收集和分析数据,进而促进更好的决策和医疗。通过OHDSI的中国区领导人之一的欧玉梅女士的介绍,大致了解到OHDSI是一个非盈利的研究组织,其中不乏有社会各界对健康医疗,信息检索,大数据等具有强烈研究兴趣的人士,这些人士有的来自医院,科研机构,高效或者保险界,有的深耕健康医疗研究多年,有的可能只是刚刚接触改领域的小白。该联盟旨在利用医疗机构或者保险数据,采用平台通用分析方法,得到更多不同的数据。
【会议笔记】第五届中国健康信息处理大会(CHIP2019)Day01_第8张图片
【会议笔记】第五届中国健康信息处理大会(CHIP2019)Day01_第9张图片
对于OHDSI获取到的医院及保险机构数据,进行脱敏处理后,由研究人员通过上传代码或者使用通用工具进行研究分析,得到新的结果,也就是欧女士所说的通用数据模型+通用分析方法=高效和可靠的数据和研究。


写在最后:
这一天的前沿研讨班可谓是打开了自己的视野,首先国内有一些企业虽然并没有在模型或者方法上有许多创新,但是以项目为主导的智慧医疗研究却仍然能给科研带来一点思路,例如:

  • 在进行了关系抽取之后,平安科技还进行了实体链接步骤,虽然该步骤并没有采用非常复杂的神经网络模型或者深度学习方法,但是在构建大型的医疗知识图谱中却是十分重要的,将实体细粒度切分以及链接到外部数据库,可以进行知识寻址,以及知识验证,能够更加佐证我们实验的完整性。
  • 在构建知识图谱中,单纯以三元组的方式进行实体关系抽取可能略显单薄,因此提出了多元组的概念,加入实体的属性,例如疾病,疾病的三元组可能有疾病与症状,疾病与文献,疾病与疾病等等,但其实还有许多疾病的属性:运动、食物、风险因子、科室、文章等等。加入这些属性特征有利于整体全面的构建知识图谱。

下午的OHDSI的分享,让我了解到了一个类似医疗界的GitHub的组织,他们通过半分享医疗数据的方式,提供给研究人员必要的数据,研究者只需要提供他们的想法即可。并且对于我们这样的小白,也可以在平台中提出任何问题,会有感兴趣的人给予解答,类似于社区。

你可能感兴趣的:(读书笔记)