闲聊机器学习医疗应用的“最后一公里”

最后一公里

闲聊机器学习医疗应用的“最后一公里”_第1张图片

共享单车是近期的热门话题,膜拜和Ofo到底合并不合并?我交的押金到底退还是不退?能不能退回来?共享单车在2015年出现的时候,主打的招牌就是解决大家日常出行的最后一公里问题。在这个主打招牌之下,迅速的火遍全中国,走向世界。

现在机器学习的热度并不比当年的共享单车差。而医疗影像分析则是机器学习的应用热点之一。从2015年崭露头角,机器学习突飞猛进,早已经迈出学院研究的象牙塔,在产业界开花结果,涌现出很多创业公司和一批非常优秀的产品。而整个机器学习产业界目前最关注的问题,或者说亟待解决的痛点,恰恰是机器学习临床落地的“最后一公里”问题。

这里说的临床落地“最后一公里”问题,简单来说,就是如何让基于机器学习的软件产品成为医生日常诊疗工作中的一个常规环节。“日常”和“常规”两个词往往用于描述很普通的事物,算不上褒义词,但这两个词恰恰是机器学习技术在医疗界应用目前最欠缺的方面。信息技术发达的今天,“无软件不工作”,每位医生每天的诊疗工作都要使用和涉及至少3~4种,甚至7~8种的软件工具。而目前,大多数医生的日常工作软件列表中还没有包括机器学习软件。很多机器学习公司进入医院仍然采用的是科研合作方式。

说是最后一公里,看似简单,其实并不简单。这里只讨论两个方面:一、机器学习软件如何获得进入医院的资格;二、机器学习软件如何融入医院工作流程。

注册认证

先说第一个方面,资格问题。 
所谓资格,指的是机器学习医疗软件作为医疗器械必须面临的注册认证问题。商业化公司要想把医疗软件作为商品销售给医院,产生经济效益,在国内必须获得国家食品药品监督管理总局(CFDA)的注册许可。在美国,必须获得食品药品监督管理局(FDA)的注册许可。中国和美国申报流程差别很大,但有一个基本思想是相同的:产品在上市之前必须通过递交资料的方式将各个环节的设计、原理、性能、指标都阐述清楚,获得注册许可后,上市时则必须严格按照之前申报的资料进行生产和销售,并且要提供相应机制保证产品在医院使用过程中也严格按照申报的参数和指标运行。简单来说,上市之前必须把自己的产品是什么样子讲清楚,上市之后这个样子就不能再变了。如果想改变,必须重新注册或更改。

而在群众眼中,本轮人工智能浪潮最吸引大家的是”机器自己能够学习了”。在大家的愿景中,某个面向特定疾病诊断的机器人可能开始不是很聪明,看病看的不准,但是可以在进入医院后,利用医院的病例数据,在医生指导下,好好学习,天天向上,越来越聪明。直到有一天青出于蓝而胜于蓝,超过医生。说白了,大家最期望看到的,是一个有脑子的、会学习、能进步的机器人,而不是一个木头脑袋、不会学习、一成不变的机器人。

闲聊机器学习医疗应用的“最后一公里”_第2张图片

愿望是好的,但这是与医疗器械注册审批的基本思想原则相违背的。换个悲观(暗黑)的角度想,这个会看病的机器人一天一个样,每天不一样。做为监管者,我怎么知道机器人是学好了还是学坏了?前车之鉴,余音未消,在“聊天机器人”领域,已经发生聊天机器人在短短24小时之内被网友带坏的真实故事了(http://tech.163.com/16/0325/16/BJ14BI64000915BD.html)。

怎么解决这个问题?最简单的方式,厂家在出厂之前把机器人训练好,按照训练达到的参数指标进行注册;出厂后,进入医院后,就不允许机器人再学习了。也就是说,需要把进入医院的机器人的学习能力禁止掉。这肯定不是最好的方式,也不符合技术进步的趋势。大家更加期待的是调整修改医疗器械审批的规章,让规定能够适应和跟上技术的进步。

那么,现在关于医疗器械软件的审批规章有哪些与人工智能相关的规定呢? 
先来看国内的CFDA。2017年8月,国家食品药品监督管理局颁布了最新的《医疗器械分类目录》(http://www.sda.gov.cn/WS01/CL0087/177089.html)。其中,与2002版分类目录对比,最值得机器学习公司关注的新增内容为,增加了一个新的一级产品类别“21-4 决策支持软件”,该类别的官方说明为”此类软件提供辅助诊断或者用药建议等决策。”。该一级分类包含的二级产品类别如下:

序号

一级产品类别

二级产品类别

产品描述

预期用途

品名举例

管理类别

04

决策支持软件

01药物计算软件

通通常由软件安装光盘(或者从网络下载安装程序)组成。基于药代和/或药物模型、患者生理参数与体征计算药物注射方案,为临床注射药物提供建议。

用于为临床注射药物提供建议。

胰岛素注射计算软件

02计算机辅助诊断/分析软件

通常由软件安装光盘(或者从网络下载安装程序)组成。利用影像处理和/或数据处理技术,由计算机软件对病变进行自动识别,对病变的性质等给出临床诊断治疗依据和/或建议。

由计算机软件对病变进行自动识别,对病变的性质等给出临床诊断治疗依据和/或建议。

乳腺X射线影像计算机辅助诊断软件、结肠计算机辅助诊断软件、肺部计算机辅助诊断软件、乳腺超声辅助诊断软件

通常由软件安装光盘(或者从网络下载安装程序)组成。对影像或者数据进行分析,给出临床参考值。

对影像或者数据进行分析,给出临床参考值。

骨密度计算机辅助检测软件

03中医诊疗软件

通常由软件安装光盘(或者从网络下载安装程序)组成。利用中医证治的相关理论,使用数据统计等方法,实现各种征候的分析诊断和/或提供治疗建议。

用于实现各种征候的分析诊断和/或提供治疗建议。

岐黄脏象辅助诊疗软件、中医诊疗软件

而且,更加重点的是,新版分类目录中专门做了解释性说明,原文摘录如下: 
“诊断功能软件风险程度按照其采用算法的风险程度、成熟程度、公开程度等为判定依据,不仅仅依据处理对象(如:癌症、恶性肿瘤等疾病的影像)为判定依据。若诊断软件通过其算法,提供诊断建议,仅具有辅助诊断功能,不直接给出诊断结论,本子目录中相关产品按照第二类医疗器械管理。若诊断软件通过其算法(例如,CAD,骨密度除外)对病变部位进行自动识别,并提供明确的诊断提示,则其风险级别相对较高,本子目录中相关产品按照第三类医疗器械管理。”这里说的CAD指的就是上面的二级产品分类“02计算机辅助诊断/分析软件”。

目前,大多数机器学习医疗软件的主打功能都是医疗影像中特定病变的检测(CADe)与诊断(CADx)。因此,严格来说,都应该归属“02计算机辅助诊断/分析软件”中的III类。当然,如果软件只是给出了某种数值,则属于II类。用大白话说一遍,如果一个机器人看了一张乳腺X射线影像,在影像上画了一个圈,和大夫说“这里应该有病变,建议你看一下”,那这个机器人就属于III类;如果是大夫画了一个圈,然后机器人只是说“这个圈里面的灰度均值2000”,那这个机器人就属于II类。

大家是否注意到,CFDA给出的III类的几个品名举例,恰恰是当前机器学习医疗影像应用的排名最靠前热点。如果再加上眼底影像糖网筛查辅助诊断、超声影像甲状腺结节辅助诊断、病理影像特定癌症辅助诊断,基本就齐了。

机器学习软件自主学习能力与CFDA/FDA医疗器械审批原则的冲突已经引起了审批规章制定者和执行者的重视。作为先行者,Bakul PatelFDA数字健康副主任于今年9月份启动了一项“Digital Health Software Precertification (Pre-Cert) Program” (https://www.fda.gov/MedicalDevices/DigitalHealth/DigitalHealthPreCertProgram/default.htm)。这项行动的主要目标是找到一种合适的审批方式,从而允许基于最新技术的医疗软件能够及时迭代改进,并且允许软件自我学习和自我适应。有必要把原文摘录如下: 
The goals of this program are to: 
enable a modern and tailored approach that allows software iterations and changes to occur in a timely fashion; 
ensure high quality medical product software throughout the life of the product by enabling companies to demonstrate their embedded culture of quality and organization excellence (CQOE); and 
be a program that learns and adapts and can adjust key elements and measure based on the effectiveness of the program. 
法规的制定与调整总是滞后于技术的进步,但好的法规始终都在调整和改进,追赶和适应技术的进步。

融入医院工作流程

再说说第二个方面,融入医院工作流程。目前大多数医院中,放射影像从拍片开始之后的阅片流程大致如下:设备拍片-》在设备工作站上进行后处理(可选)-》在PACS/RIS系统中阅片同时写报告。这里暂不讨论拍片之前的申请单等环节。 
这里的设备工作站主要指医院往往与CT、MR设备一起配套购买的CT、MR影像后处理工作站。影像医生在设备工作站上做的后处理工作一般包括三维重建、特定疾病辅助分析、特定成像模式分析测量,后处理的结果一般采用关键帧截图方式与原始图像一起发送到PACS系统。然后报告医生在PACS系统中集中阅片,并在RIS系统中完成报告书写。

在稍微大一些的综合性医院的放射科中,影像报告医生都是按照学组划分的。比如说腹组的医生主要看腹部影像,头组的医生主要看头部影像。现在基于机器学习的医疗软件功能主要集中在面向特定疾病的辅助检测与识别。软件与医生一样,基本每个软件当前只能对特定影像类型中的特定疾病种类进行分析。比如说,有一类软件是专门分析CT肺部影像的,还有一类是专门分析乳腺影像的。实际往往比这个要划分的更细。可以想象,这就带来一个问题。疾病种类繁多,与影像相关的大概有两千多种。当要诊断的疾病这么多,未来就会需要很多个机器学习软件。那么,这些软件如何能够整合,形成一个整体,融入医生的日常工作流程?

基于现在深入学习的理论和技术基础,针对每个单一病种的算法研发和产品化,都需要投入大量的人力和物力,才能做好做精。所以对于大多数公司来讲,每家公司真正能够推出成熟的、产品化的特定病种的辅助诊断软件,近期之内能达到3到10种左右,就相当厉害了。(不要忘记CFDA/FDA审批。)假如说未来2~3年内,有50种常见疾病的影像诊断都已经被机器学习攻克,但这些技术来自于5~10家不同的公司。毫无疑问,医院对能够减轻影像医生重复劳动和低技术含量工作负担的软件工具有着迫切需求,但医院是否有意愿面向5~10家不同公司去分别购买?尤其是考虑到后期的用户培训和系统维护。不要忘了,医院除了放射科医院还有很多其他科室,他们也有软件要购买,要维护。很多医院信息科目前最头疼的事情之一,就是有太多的系统要维护、有太多的软件供应商要联系。 
对于医生来讲,医生其实是希望每天工作中用的软件种类越少越好。最好一天工作下来,只用一个软件。这样最高效、最省心。医生都很忙,往往也不愿意去学习熟悉那么多软件。

因此,无论是从医院信息化管理的角度,还是医生日常工作便捷性的角度,都要求对繁花似锦的机器学习影像辅助诊断软件进行整合。其实,在机器学习热潮之前,已经有很多基于传统模式识别和图像处理的CAD软件,这些软件有一部分是采用独立工作站形式进行销售,但有相当一部分,是采用与设备后处理工作站和PACS系统整合的方式,切入医院影像阅片流程。

生态环境

好的技术和产品不可能被一家公司垄断,来源必然多样化,这在机器学习领域尤其明显。大家需要做的是,找到协同合作的方式,各取所长,创造出一个共同繁荣的氛围。这也就是大家现在在每个领域都喜欢谈论和建立“生态环境”的原因吧。也希望早日有一个充满活力、适应变化的生态环境来铺平机器学习进入临床应用的最后一公里道路。

闲聊机器学习医疗应用的“最后一公里”_第3张图片

你可能感兴趣的:(人工智能,深度学习,医疗影像)