基于pyradiomics影像组学特征提取

基于pyradiomics影像组学特征提取

  • 特征提取:
  • 1 pyradiomics的使用:
    • 1.1,在python环境下安装pyradiomics:
    • 1.2,设置特征提取器,获得想要特征:
      • 1.2.1 图像类型
      • 1.2.2 目标特征设置
      • 1.2.3 特征提取器设置
  • 2 代码示例;
  • 参考:

特征提取:

在这里,我们使用pyradiomics来提取影像组学特征。首先,我们先介绍pyradiomica工具包,然后我们进行特征的提取。

1 pyradiomics的使用:

PyRadiomics的官方文档:https://pyradiomics.readthedocs.io/en/latest/
基于pyradiomics影像组学特征提取_第1张图片

1.1,在python环境下安装pyradiomics:

pip install pyradiomics

1.2,设置特征提取器,获得想要特征:

通过自定义特征提取器,可以根据自己的需求来设置并提取特征。
其实,需要设置两个方面:1,图像类型;2,所要提取的特征;3,提取器设置

1.2.1 图像类型

第一步:图像类型:首先,设置提取特征的图像类型,可以指定用于提取特征的图像类型。在pyradiomics包中为我们提供了许多可以使用的滤波器,所以我们可以使用原始图像及经过各种滤波器之后的图像,如下方表格。
具体可以参考官方:https://pyradiomics.readthedocs.io/en/latest/customization.html#image-types

图像类型 解释
Original 原始图像
Wavelet 小波变换。产生在三个维度中每个维度分别使用高通、低通滤波器的所有组合(LLH、LHL、LHH、HLL、HLH、HHL、HHH、LLL)
LoG Laplacian of Gaussian filter高斯滤波器的拉普拉斯算子,是一种边缘增强滤波器。使用它需要指定参数sigma,低 sigma 强调精细纹理,高 sigma 值强调粗糙纹理
Square 平方。取原始像素的平方并将它们线性缩放回原始范围
SquareRoot 平方根。取绝对图像强度的平方根并将它们缩放回原始范围
Logarithm 对数。取绝对强度 + 1 的对数,值缩放到原始范围
Exponential 指数。采用e^(绝对强度)获取强度的指数值,值被缩放到原始范围
Gradient 梯度。返回局部梯度的大小
LocalBinaryPattern2D 在每一片中进行的本地二进制模式
LocalBinaryPattern3D 在3d中进行的本地二进制模式

如何使用:
指定方式:设置特征提取器后可以在下边指定
可以直接使用:enableAllImageTypes() 启用所有类型
也可以使用:enableImageTypeByName( imageType , enabled=True , customArgs=None )启用你想用的类型
如:

# 所有类型
extractor.enableAllFeatures()
# 指定使用LoG和Wavelet滤波器
extractor.enableImageTypeByName('LoG')
extractor.enableImageTypeByName('Wavelet')

1.2.2 目标特征设置

第二步:目标特征设置
pyradiomics包也为我们提供了很多种可选的特征,如下表格所示:
具体可参考资料:https://pyradiomics.readthedocs.io/en/latest/features.html
这些特征主要包含:

  • 一阶特征 First Order Statistics (19 features)
  • 3D形状特征 Shape-based (3D) (16 features)
  • 2D形状特征 Shape-based (2D) (10 features)
  • 灰度级共生矩阵 Gray Level Co-occurrence Matrix (24 features)
  • 灰度级游程矩阵 Gray Level Run Length Matrix (16 features)
  • 灰度大小区域矩阵 Gray Level Size Zone Matrix (16 features)
  • 相邻灰度色调差异矩阵 Neighbouring Gray Tone Difference Matrix (5 features)
  • 灰度依赖矩阵 Gray Level Dependence Matrix (14 features)

下面展示一阶特征及其解释,更多的可以参考官方文档。

特征类型 特征 解释
First Order Features(共19个) Energy 能量
Total Energy 总能量
Entropy
Minimum 最小特征值
10Percentile 特征值的百分之10的值
90Percentile 特征值得百分之90的值
Maximum 最大特征值
Mean 均值
Median 中位数
InterquartileRange 四分位距离
Range 灰度值范围
MeanAbsoluteDeviation (MAD)平均绝对误差
RobustMeanAbsoluteDeviation (rMAD) 鲁棒平均绝对偏差
RootMeanSquared (RMS)均方根误差
StandardDeviation 标准差。测量平均值的变化或离散量,默认不启用,因为与方差相关
Skewness 偏度。测量值的分布关于平均值的不对称性
Kurtosis 峰度。是图像 ROI 中值分布的“峰值”的量度
Variance 方差。是每个强度值与平均值的平方距离的平均值
Uniformity 均匀度。是每个强度值的平方和

注意:除了形状特征类外,其他特征都可以在原始图像和滤波后的图像上进行计算。

具体的指定方法:
可以直接使用:enableAllFeatures( )启用所有类型
也可以使用:enableFeatureClassByName(featureClass, enabled=True)启用你想用的类型
例如:

# 设置一阶特征
extractor.enableFeatureClassByName('firstorder')
# 设置只提取一阶特征的'Mean'和'Skewness'
extractor.enableFeaturesByName(firstorder=['Mean', 'Skewness'])

1.2.3 特征提取器设置

第三步:特征提取器设置:
是否对原图归一化、是否重采样。
图像归一化:

  • normalize:默认为false。设置为true时进行图像归一化。
  • normalizeScale:确定图像归一化后的比例。默认为1。
  • removeOutliers:定义要从图像中删除的异常值。默认为0。

图像/mask重采样:

  • resampledPixelSpacing:设置重采样时的体素大小。默认无。
  • interpolator:设置用于重采样的插值器。仅适用于重采样图像,sitkNearestNeighbor始终用于重采样掩码以保留标签值。可选的插值器:

基于pyradiomics影像组学特征提取_第2张图片

  • padDistance:设置重采样期间裁剪肿瘤体时的体素补充数量。

例如:

settings = {}
settings['![binWidth](https://img-blog.csdnimg.cn/c9b0896a5eea4eaf8217d0ed7f23e92b.png)
'] = 25
settings['resampledPixelSpacing'] = [3,3,3]  # [3,3,3] is an example for defining resampling (voxels with size 3x3x3mm)
settings['interpolator'] = sitk.sitkBSpline

还有其他的一些设置,根据自己的需要修改即可。

2 代码示例;

下面是一个CT肺部特征提取特征的代码示例:

特征提取块设置:当然,你可以把这一块写成函数:

import radiomics
from radiomics import featureextractor

# 定义特征提取设置
settings = {}
settings['binWidth'] = 25
settings['sigma'] = [3, 5]
settings['resampledPixelSpacing'] = [1,1,1] # 3,3,3
settings['voxelArrayShift'] = 1000 # 300
settings['normalize'] = True
settings['normalizeScale'] = 100

# 实例化特征提取器
extractor = featureextractor.RadiomicsFeatureExtractor(**settings)

# 指定使用 LoG 和 Wavelet 滤波器
extractor.enableImageTypeByName('LoG')
extractor.enableImageTypeByName('Wavelet')
# 所有类型
extractor.enableAllFeatures()
extractor.enableFeaturesByName(firstorder=['Energy', 'TotalEnergy', 'Entropy','Minimum', '10Percentile', '90Percentile',
                                                 'Maximum', 'Mean', 'Median', 'InterquartileRange', 'Range',
                                                 'MeanAbsoluteDeviation', 'RobustMeanAbsoluteDeviation','RootMeanSquared',
                                                 'StandardDeviation', 'Skewness', 'Kurtosis', 'Variance', 'Uniformity'])
extractor.enableFeaturesByName(shape=['VoxelVolume', 'MeshVolume', 'SurfaceArea', 'SurfaceVolumeRatio', 'Compactness1', 'Compactness2', 
                                            'Sphericity', 'SphericalDisproportion',  'Maximum3DDiameter', 'Maximum2DDiameterSlice', 
                                            'Maximum2DDiameterColumn', 'Maximum2DDiameterRow', 
                                            'MajorAxisLength', 'MinorAxisLength', 'LeastAxisLength', 'Elongation', 'Flatness'])

将输出特征保存:
我们使用单例数据进行测试,当然,你可以在此基础上写个循环对整个文件夹进行测试:

import pandas as pd
import numpy as np

# Get the testCase
nii_Path = './test/Image/'
seg_Path = './test/Mask/'

features_dict = dict()
df = pd.DataFrame()


imagePath = nii_Path + 'sub-strokecase0001_ses-0001_dwi_reg_norm.nii.gz'
maskPath = seg_Path + 'sub-strokecase0001_ses-0001_msk_reg.nii.gz'
print(imagePath)
features = extractor.execute(imagePath, maskPath)  # 抽取特征

for key, value in features.items():  # 输出特征
    features_dict[key] = value

df = df._append(pd.DataFrame.from_dict(features_dict.values()).T, ignore_index=True)

df.columns = features_dict.keys()
df.to_csv('Radiomics-Features.csv', index=0)
print('Done')

excel表:
基于pyradiomics影像组学特征提取_第3张图片

参考:

[1] https://pyradiomics.readthedocs.io/en/latest/index.html
[2] https://blog.csdn.net/weixin_46428351/article/details/123592586

你可能感兴趣的:(影像组学)