精准医疗,是要根据患者的个体遗传基因特征,量身定制个性化诊疗方案。而当前在医学数据大规模整合的时代,生物数据的指数级增长导致精准医疗知识体系已经超过医生个人承载的范围,知识更新速度也超出了传统医学教育系统的处理能力。
这时,想要实现更为精准有效的诊疗,就亟需计算能力超强的人工智能来救场。
精准医疗可以提供更准确的预测预防、治疗以及康复的解决方案,而支撑精准医疗发展的三驾马车——生命科学、信息技术和临床医学,则在相辅相成中共同推动精准医疗的发展。随着精准医疗的不断提速,其主要难度也逐渐集中在信息技术领域。
有专家表示,目前我国“应用终端的发展”远远走在“硬件架构”的前面,现有计算平台已经不足以完成人工智能对于庞大运算量的需求。
除了人工智能本身面临的挑战之外,对于精准医疗来说,数据的深度挖掘也是目前急需解决的问题之一。精准医疗现阶段最大的困难就是数据积累,此外影像数据和放射科医生增长速度的不匹配在促进人工智能发展的同时,也给存储和处理海量数据带来巨大灾难。
精准医疗会遇到大量计算资源和相应需求割裂的问题,此时人工智能的相应计算和分析大有可为。
精准医疗,就是要克服千人一方、万人一药的瓶颈问题,根据患者个体的遗传基因特征,量体裁衣式地制定具有个性化的治疗方案。然而,随着生物数据的爆炸式增长,更多的挑战出现在了计算技术领域。
“我们已经进入了一个医学数据大规模整合的时代,要参考基因组学、微生物组、环境、行为、临床检验等各种信息,这个整合就导致数据量出现指数级的增长。”中国国家罕见病注册系统执行总监弓孟春在2017人工智能计算大会上表示,现在精准医疗的知识体系已经超过医生个人承载的范围,知识更新的速度也超出了传统医学教育系统处理的能力。
而人工智能最大的优势就是其碾压性的计算能力,医疗若想更精准,急需人工智能前来救场。
“胖数据”待“瘦身”
“现在病人会拿着基因测序的报告问你,糖尿病会不会遗传给孩子、会不会很早就得眼底病变、会不会很快出现心血管病变、是不是应该用胰岛素、应该先吃什么药、运动会不会对我有效……”精准医疗普及的同时也给医生提出了很多难题,弓孟春就遇到过很多问题不断的病人,这些问题已经远远超出医生原来数据搜集的范围。
“我如果要评估这些问题,就需要对整个环节的其他维度的信息做收集和整理,然后再进行分析,还要参考我的知识体系来作判断,最后才能回复我的病人。”弓孟春无奈地说,“医生现在面临的挑战就是,作决策的时候需要参考的信息维度大大增加。”
当前,精准医疗的临床部署对信息技术的依赖程度越来越强,因为精准医学的知识体系和数据量已经远超过医生个人承载的范围。
中国医学科学院北京协和医学院放射科主任医师惠周光表示,医疗大数据研究的内容包括疾病、药物、医生和患者,其来源从狭义上说,包括医院的信息系统及电子病历数据、检验信息系统数据、医学影像存档和传输系统数据,以及一些医学文献和临床经验等。但是从广义上来说却远远不止这些,还涉及到公共卫生及生命科学领域。
以恶性肿瘤大数据为例,惠周光的体会就是,随着计算机的不断发展,医学影像的精度、密度等数据信息量也会越来越大,生物标本库和生物组学信息的数据也在快速增长,数据的存储甚至人工的智能判读都成为重要问题。
现在,精准医疗本身也有赖于数据的采集,“比如说哮喘患者,有无药物过敏、家族病史、空气的监测和可穿戴设备等数据,都会构成基于患者个人的模型,从而预测该患者的病情未来会不会加重,是否要转移到急诊去。”弓孟春说。
而回到基因行业领域,英特尔医疗与生命科技集团首席架构师丁华表示,随着全基因组测序成本的不断下降,将来有可能会演进到更多的全基因组的测序。“谈到精准医疗不可回避的一点就是,把组学的这部分内容跟传统临床能够更好地结合,然后共同实现精准医疗的目标。但目前我们还处在怎样把基因数据变成有意义的、有价值的数据,这个数据能够在临床上应用这个阶段,依然面临很多的挑战。”丁华指出。
受益于人工智能浪潮
有业内人士这样比喻:在医疗领域,人工智能分析的作用堪比经验丰富的临床医生。
阿里云此前发布的ET医疗大脑辅助医生判断甲状腺结节点的场面,就令不少人记忆犹新:ET医疗大脑通过计算机视觉技术在甲状腺B超影像上圈出结节点,并给出良性或者恶性的判断。而在此之前,医生个人判断甲状腺结节点的平均准确率仅为60%~70%,当下人工智能算法的准确率已被证明可达85%。
人工智能之所以判断准确率比人类更高,离不开三个关键词:计算、算法、数据。算法的突破及数据洪流的爆发使得几乎所有的“机器辅助功能”都成为可能,深度学习框架的开发和开源,也使得人工智能“算法”的开发越来越便捷。“计算”平台则成为本轮推动人工智能进步的重要因素。
在当天会场的楼下就摆放着数十台样式各异的计算机、服务器。“这其中一台小小服务器的计算速度,就是20年前最快计算机的60倍。”中国工程院院士、浪潮集团首席科学家王恩东说,由于计算能力的快速发展,结合互联网、物联网带来的海量数据和深度学习等先进算法,共同催生了第三次人工智能浪潮。
精准医疗也将乘着人工智能这波浪潮,在各个领域发挥着超过人类预期的作用。上海交通大学高性能计算中心工程师韦建文团队就准备在白血病诊断方面,想办法解决机器读片的问题。
“当前,血液涂片的人工诊断仍然非常费力,一般专职读片医生需要3至5年的训练,而受限于人眼可阅读的涂片视野,医生根据个人的能力和经验诊断出的结果精确度起伏不定,难以覆盖所有亚型的白血病细胞。”韦建文说。
通过解决超高分辨率、超高灵敏度,把基因组学跟医疗影像学结合,再加上时间序列等技术突破,研究人员实现了在高性能计算平台上进行血液涂片的解读,并可以让医学人员也非常方便地去使用这个工具。
另外,处理精准医疗的大数据需要极高纬度的分析,在可预料性低的情况下,用传统信息学方法处理难度较大。记者从英特尔方面了解到,英特尔BioX实验室与华大基因在蛋白组学方面就有成功的合作案例。对于蛋白质飞行质谱实验,在使用深度学习CNN框架和LSTM算法的情况下,较之先前的传统计算,实验人员大幅提升了飞行质谱预测的效率,同时节省了2/3的计算时间。
在美国,微软也宣布将人工智能用于医疗健康计划“Hanover”,他们试图帮助寻找最有效的药物和治疗方案。此外,微软还在研究模拟癌症如何在不同病人身体里扩散,甚至于研究像计算机编程一样创造生物细胞等。
应对计算与数据的挑战
精准医疗可以提供更准确的预测预防、治疗以及康复的解决方案,而支撑精准医疗发展的三驾马车——生命科学、信息技术和临床医学,则在相辅相成中共同推动精准医疗的发展。随着精准医疗的不断提速,其主要难度也逐渐集中在信息技术领域。
有专家表示,目前我国“应用终端的发展”远远走在“硬件架构”的前面,现有计算平台已经不足以完成人工智能对于庞大运算量的需求。而在王恩东看来,尽管人工智能如今迎来蓬勃发展,但仍是挑战重重,其中排在第一位的就是计算性能。
清华大学教授、国家超级计算无锡中心主任杨广文则指出,在过去11年里,内存带宽仅仅提升了15~16倍,而计算能力则提升了30~50倍,这说明内存的性能和计算的性能之间的差距在逐渐拉大,这也是GPU计算今天面临的一个巨大挑战——在相对强悍的计算能力和相对薄弱的内存访问之间,横跨的那一道鸿沟。
除了人工智能本身面临的挑战之外,对于精准医疗来说,数据的深度挖掘也是目前急需解决的问题之一。“机器需要更多的学习次数,以得到更准确的判断。多次学习的基础是数据,医疗影像需要海量医疗影像和医生的结果判断。”一位智能医疗界投资人士表示,精准医疗现阶段最大的困难就是数据积累。
另外,他还指出,影像数据和放射科医生增长速度存在不匹配。相关数据显示,美国、中国的影像数据年增长率将分别达到63.1%和30%。但两国放射科医生年增长率仅有2.2%和4.1%。两者之间的鸿沟一方面促进了人工智能的发展,同时也给人工智能存储及处理海量数据带来巨大难题。
惠周光也以肿瘤大数据为例指出,目前我国尚未建立以医院为基础的癌症筛查网络,缺乏全国肿瘤发病与诊疗状况的权威数据,导致肿瘤防治、临床研究、指南制定等都有一定的盲目性。
惠周光建议要搭建医疗机构的网络平台,建立医疗大数据存储、传输安全和共享机制,并通过标准化解决临床习惯用语与标准数据相割裂的问题。
“另外,现在组学的应用越来越多,大量的计算资源与相应的需求相割裂,都是精准医疗会遇到的问题。我想人工智能相应的计算和分析在这里都是可以大有作用的。”惠周光说。