影像组学在医学影像中的应用

     首先介绍一下影像组学:目前来讲,影像设备所生成的图像数据量越来越大,过去对图像数据的处理与使用方式显然难以充分挖掘图像的大数据信息。因此影像组学应运而生。2012年,荷兰学者Lam bin等人[1]正式提出了影像组学的概念,Radiomics即应用大量的自动化数据特征化算法将感兴趣区域(region ofinterest,ROI)的影像转换为可发掘的数据信息,并对之进行高通量 (high throughput) 定量分析。同年 Kumar等人[2]发表文章,将Radiomics的定义进一步扩展为:从CT、PET或MRI等医学影像图像中高通量地提取并分析大量高级、定量的影像学特征。

      那么问题来了,影像组学究竟是什么呢。我浅薄的理解:影像组学是一门技术,应用人工智能与机器学习的方法对医学图像进行感兴趣区域(ROI)的分割,定量ROI特征提取,分析模型构建,临床辅助决策。其中提取影像组学特征是关键的一步。在这里,我将其应用到医学图像肿物的良恶性分类上。我们对感兴趣区域提取一阶、二阶(GLCM、GLDS......)以及高阶Gabor特征,但是由于多模态特征的特征维度较高,在建立机器学习的分类模型之后,导致模型的计算复杂度高、很难训练一个鲁棒性强的模型。在这里就要考虑到特征降维,例如:Lasso、Relief、MI互信息等等。在这里,我想表达的是,单个好的特征的组合并不能增加分类器的性能,换一种说法,m个最佳特征并不是最好的特征[3],因为有可能特征之间是高度相关的。在特征降维之后,我们接下来将进行数据挖掘与统计分析,从而更深层次的发掘特征数据与临床数据之间的关系。主要采用的方法就是机器学习和数据的统计分析。在这里,我们将采用机器学习的方法进行分类模型的构建,较为经典的方法有神经网络,支持向量机(support vector machine,SVM)或者贝叶斯决策树等等。

      随着分类器的应用,有必要使用相应的措施来评估结果作为生成的模型的稳定性情况的验证。因此,采取以下措施:混淆矩阵:真阳性(TP),真阴性(TN),假阳性(FP),假阴性(FN)。

 

模型性能的评估通过:(灵敏度)

 (特异性)

(准确性)

(F1_score)

还有一种常用的评估手段:接受者工作特性曲线(Recevier operating characteristic, ROC)和曲线下面积(area under the curve,AUC)值,用来描述参数的整体表现能力。对于AUC值来讲,接近于1是理想值,当值小于0.5时,证明参数没有任何的分类能力。

        影像组学在医学影像中的应用_第1张图片

............

就先到此为止,上述表述如有错误,还忘批评指正。

[1] Lambin P, Rios-Velazquez E, Leijenaar R, et al. Radiomics: extracting more information from medical images using advanced feature analysis[J]. European journal of cancer, 2012, 48(4): 441-446.

[2] Kumar V, Gu Y, Basu S, et al. Radiomics: the process and the challenges[J]. Magnetic resonance imaging, 2012, 30(9): 1234-1248.

[3]Cover T M. The best two independent measurements are not the two best[J]. IEEE Transactions on Systems, Man, and Cybernetics, 1974 (1): 116-117.

你可能感兴趣的:(python学习笔记)