(转)影像组学学习

影像组学学习笔记

题外话

这仍然是一篇学习笔记。近期在不同的学术会议上,有幸聆听学习了几位影像组学的大咖做报告,受益匪浅。以大咖们的报告为指导,自己也学习查找了一些文献,加入了一点点自己的理解和想法,整理成一篇笔记,与大家分享。

名词解释:影像组学(Radiomics)

“影像组学”,一共4个字,每个字都是常见字啊。但4个字放一起啥意思?好吧,我们把它们拆成“影像”和“组学”两个词来说。这里的“影像”通常指的就是放射影像,是这种方法研究的对象,目前大家选择最多的是CT、MR影像。但额外说一句,已经有大咖开始选择超声影像作为研究对象(我自己要研究的也是这类)。组学,英文为Omics,是目前生物和医药前沿研究领域最流行的后缀了。如果用一句话来解释组学,就是把与研究目标相关的所有因素综合在一起作为一个“系统”来研究。说的高大上一些,组学可以看做是西方(现代)科学研究从“点”到“面”再到“系统”理念发展的大趋势代表性体现。 
举个例子,组学(Omics)这个后缀最早被提出是用在“基因组学”(Genomics)中。按照上面的拆解模式,基因组学的研究对象是“基因”,采用的研究方法不再是最早单独研究某个基因片段的作用,而是将所有的基因构成综合起来进行系统化的分析和考虑。 
回到影像组学。它的研究对象是放射影像,它的研究方法则是将影像内包含的所有信息提取出来然后进行综合系统化分析。更确切的说,影像组学是采用自动化算法从影像的感兴趣区(ROI)内提取出大量的特征信息作为研究对象,并进一步采用多样化的统计分析和数据挖掘方法从大批量信息中提取和剥离出真正起作用的关键信息,最终用于疾病的辅助诊断、分类或分级

技术路线:信息提取与分析

关于影像组学,还有一种极简的解释,”Convert images to mineable data in high throughput”,将影像以高通量方式转换为可挖掘的数据“。那么,如何转换,又如何挖掘呢?下图给出了一个简单的流程说明。

图像收集

图像收集,也就是临床试验中常说的“病例入组”。两个要点:一、制定好入组标准是最基础的要求;二、在结构或功能影像以外包含必要的临床病历信息或基因、病理数据已经成为当前新的研究趋势,也是发高水平论文的新标准。换句话说,单独只有结构影像已经不太好在大杂志上发文章了。

感兴趣区分割

这里说的感兴趣区,通常指的就是病灶,比如癌症或肿瘤区域。图片中列出了三种分割(勾画)方法,但目前来看,临床用的最多的还是纯手工。也就是类似于Photoshop中的手工抠图了。这也是影像组学中比较耗费高级人力的一个步骤了。说“高级人力”,是因为需要专业的影像医生来勾画。

特征提取

图中列出了目前常用的4大类特征。真的是4“大”类,因为每类都可以提取出数十、乃至上百的信息。借用中科院田捷教授给出的表格,大家感受一下。

统计分析

一下子提取出来数百上千的特征怎么办?必须用统计分析了,其实核心目的就是减少特征的数量,找到少数的真正关键的特征。具体的统计方法就不介绍了,图片中仅仅是列举了几个常用的。找到这些关键特征后,还需要建立起相应的预测或分类模型。

分类与预测

千挑万选建立起来的模型肯定要应用才能体现价值。目前影像组学应用最多的领域包括肿瘤分类、肿瘤分期和愈后预测等。

应用领域

辅助诊断

影像组学目前应用最多的领域首推肿瘤辅助诊断,尤其是对肿瘤良恶性的辅助判读。例如,对于肺结节良恶性的辅助判断;对于肝细胞癌良恶性的辅助判读;对宫颈癌分期的辅助诊断。

Staging of cervical cancer based on tumor heterogeneity characterized by texture features on 18F-FDG PET images

肿瘤预测

影像组学还可以拥有对肿瘤病灶的发展趋势进行预测。在这方面,广东省人民医院刘再毅教授、梁长虹教授和中科院自动化所田捷教授的联合团队做了很多优秀工作,发表在高级别学术期刊上,包括发表在Journal of Clinical Radiology上的术前预测结直肠癌淋巴结转移;发表在Radiology上的预测非小细胞肺癌无进展生存率。

Radiomics Signature: A Potential Biomarker for the Prediction of Disease-Free Survival in Early-Stage (I or II) Non—Small Cell Lung Cancer

Development and Validation of a Radiomics Nomogram for Preoperative Prediction of Lymph Node Metastasis in Colorectal Cancer

治疗方案选择

影像组学也被用于不同手术方案的治疗效果预测。浙大医学院邵逸夫医院团队在Clinical Cancer Research上发表了直肠癌新辅助化疗的治疗效果评估方法。

Rectal Cancer: Assessment of Neoadjuvant Chemoradiation Outcome based on Radiomics of Multiparametric MRI

面临的挑战

可重复性

影像组学从影像中提取了很多隐藏的特征信息,其中一些信息是很“微妙”的,例如纹理信息。这些信息的抗干扰能力如何,普遍性如何?直接决定了相应的影像组学模型的抗干扰性和通用性。例如,使用某个厂商的CT采集数据建立的模型,是否能够适用于另外厂商CT采集的数据?即使是同一厂商相同型号的CT机,如果重建参数不同,或者打对比剂的剂量或扫描时间点不同,是否会影响模型适用性? 
学术界已经注意到上述问题,并且提出,需要通过多中心试验来验证上述问题。

大数据

影像组学研究所需要的入组病例数越来越多,而单个病例所包含的影像数据量随着扫描层数和分辨率的上升,也在迅速增大。两方面因素累积,影像组学所需要存储和分析数据量已经变的非常大,称得上是“大数据”了。随之而来的则是数据分析计算量的挑战和工作量的负担,也就是意味着计算服务器硬件成本的高投入和研究人员人力成本的高投入。

数据共享

如前面提到的,多中心试验是保证影像组学模型可重复性的一个重要方式。多中心试验首先要求能够实现数据共享。而影像组学中的数据共享目前还面临诸多限制,不仅包括数据所有权和数据保护的限制,而且,在互联网上跨地域实现海量“大数据”的共享和传输还面临着传输效率和数据安全性的实际问题。

经典论文推荐

开山之作

Radiomics: Extracting more information from medical images using advanced feature analysis 
2012年,荷兰学者Lambin在上面的论文中正式提出了放射组学的概念,即采用自动化、高通量的特征提取方法将影像转化可以挖掘的特征数据。奠基之作,怎么着也要拜读一下啦。

权威最新综述

Radiomics: Images Are More than Pictures, They Are Data.pdf 
2016年Radiology杂志发表了关于影像组学的权威综述。这篇综述中再次强调影像组学的核心理念“the conversion of digital images to mineable data”,并且指出这种从图像到数据的转换将成为以后的临床影像分析常态。如果想用一篇文章了解影像组学最新发展趋势,那就首推此文了。

新入门者必读

Computational resources for radiomics 
如果哪位已经撸起袖子,下定决心要开始做影像组学,这篇文章强烈推荐。如同文章摘要中提到的,这篇文章就是为影像组学的新入门者量身打造的,不仅介绍了各分析步骤流程,更重要的是,每个步骤都推荐了适用的工具软件。而且,还附上软件应用的例子。简直不能更贴心啊。

题外篇:关于“组学”

有对“组学”这个神奇蹿红的学术热词感兴趣,想了解更多的同学,推荐点击下方附赠的链接啊。 
About Omics 
Wiki 
组学的未来 
组学:一个疯狂“寄生”的故事

你可能感兴趣的:(来自其他blog,医学影像)