影像组学必知必会

Radiomics : Convert images to mineable data in high throughput

看到影像组学该不会想到电影的摄制组吧?这里的影像指的是医学影像,所以在我们脑海应该是这样子的:

图片来自百科词条

我们不应忘记,1895年11月8日(我周运来讲影像组学,必须从这一天讲起),伦琴把实验室的门关的紧紧的,一个人在那里进行阴极射线的研究,在出现阴极射线时,旁边涂有氰化铂钡的荧光屏上,似乎也发出点蓝白色的光。为了仔细研究这隐约的信号,伦琴把床也搬进了实验室,整整7个星期,伦琴埋首在自定义的"X线"中。

圣诞节前夕,老婆大人别鲁塔来到实验室,他把她的手放到照相底板上用"X线"照了一张照片,这是人类的第一张X线照片,伦琴亲自在照相底板上用钢笔写上1895,12,22。妻子看到照片惊叹不已,问:"这个圆环是什么?","是我们的结婚戒指!"。这时他们拥抱彼此,完全沉醉幸福之中了。

X射线是上帝送给现代医学的浪漫礼物,自那以后:

  • 1978年,应该放射学年会上,一位名叫G.N.Hounsfield的工程师公布了计算机断层摄影的结果。

  • 在20世纪50年代,简单的A型超声诊断仪开始用于临床。到了70年代,能提供断面动态的B型仪器问世。80年代初问世的超声彩色血流图(color flow mapping,CFM)是目前临床上使用的高档超声诊断仪。

  • 1945年美国学者首先发现了磁共振现象,从此产生了核磁共振谱学这门科学。70年代后期,对人体的磁共振成像获得成功。

今天我们所说的影像默认即为放射影像(CT、MR影像等)。我们应该熟悉医生在医院看片判片的画面,是的,早期的时候我们是要打开人体才能看到病理状态的,有了影像,大大解放了医生的双手,但是对他们的视力要求更高了。

影像组学想做的一件事就是进一步解放医生的双眼,借助IT技术从图像中获得更多的信息。我们看了那么多影像组学的资料,他的核心是什么?

特征提取

把影像主要的特征提取出来,得到可计算的数据,这样不管我们是用《实用生物统计学》还是《实用机器学习导论》的统计方法来在临床上找到数据的意义。随着图像处理算法的发展,影像组学也越来越多地呈现出其数学的本质:从影像数据的清洗到共享数据库的每一步都萦绕数学的体香。

影像组学是个一零后,在开山之作:Radiomics: Extracting more information from medical images using advanced feature analysis中,作者系统定位了这个学科,也论证在21世纪的今天它已经基本成熟。

并给出了影像组学的一般分析方法,在这篇文章中作者提出的不是一个概念,而是一个方法体系。

影像组学数据分析一般流程

在文章的结尾,作者颇具远见地评述道:

Solid cancers have extraordinarily spatial and temporal heterogeneity at different levels: genes, proteins, cells, microenvironment, tissues and organs. This limits the use of biopsy based molecular assays but in contrast gives a huge potential for non-invasive imaging, which has the ability to capture intra-tumoural heterogeneity in a non-invasive way.

我们对heterogeneity不应该感到陌生,影像组学使我们能够从医学影像中获得更多信息,也会建立起影像之间的关联。我们知道,让小朋友在5张片子上找不同是多么困难的事,所以影像组学要从娃娃抓起啊。

既然,影像组学就是要从图片中提取特征, 首先我们要定义影像特征,这是特征工程的一个应用。什么是特征?就是最强标签。还记得我学的第一个特征选择器:mRMR.它的名字就很好地说明了特征选择的特点:最大相关最小冗余(Minimum redundancy and maximum relevance)。

那么,影像都有哪些特征呢?想一想,给你一张图,你要如何描述它,无外乎形状和颜色:

  • First Order Statistics
  • Shape-based
  • Gray Level Cooccurence Matrix
  • Gray Level Run Length Matrix
  • Gray Level Size Zone Matrix
  • Neigbouring Gray Tone Difference Matrix
  • Gray Level Dependence Matrix

只要有了data,也就接通了后面的通路,各种传统的/现代的统计学习方法就可以应用在影像组学中了。在2017年颇具影响力的学术论文Radiomics: Images Are More than Pictures, They Are Data中,作者进一步定义了和细化了影像组学。在新的历史条件下也提出它面临的机遇与挑战。

同样地,作者也看到计算带来的便利:

As part of the reading, the extracted size, shape, location, and textural features will be automatically uploaded to a shared database and algorithmically compared with prior images to enable more precise diagnoses. Such capabilities are nearly at hand, as most picture archiving and communication systems have the capability to coregister current images with prior images and perform user-interactive segmentation. For the foreseeable future, the field of radiomics research will be concentrated on improving classifier models to provide the most accurate possible diagnoses and, hence, better patient care and outcomes.

影像组学不是要替代谁的工作,而是使我们的判读更加轻松和自动化,所以你们家科室配备生物信息工程师了吗?会python的那种?

影像组学的工具与方法已经基本形成,虽然还谈不上成熟,但它已经不是少数人的游戏。就在昨晚,我在B站跟着有LI学习了《影像组学(python 通俗演义版)》,写下一段影像组学必知必会,此文。

参考:
影像组学笔记(1)
影像组学学习笔记
影像组学的前沿研究与未来挑战
医学影像组学特征值(Radiomics Features)提取之Pyradiomics(一)理论篇
威廉·康拉德·伦琴

你可能感兴趣的:(影像组学必知必会)