【论文翻译2019-10-21】Shell feature: a new radiomics descriptor for predicting distant failure after ra...

shell feature:一个新的放射组学描述关于预测非小细胞肺癌和宫颈癌放疗后的distant failure

摘要

Distant failure是与人类癌症相关的死亡率的主要原因。为了开发一种预测非小细胞肺癌(NSCLC)和子宫颈癌(CC)患者远处转移的模型,使用治疗前正电子发射断层扫描(PET)构建了一个由肿瘤边界周围的外部像素组成的壳特征,来自48例NSCLC患者的图像接受了立体定向放射治疗,而52例CC患者则接受了外部束放射治疗,同步化疗以及大剂量率腔内近距离放射治疗。该feature背后的假设是,非侵入性和侵入性肿瘤在肿瘤周围可能具有不同的形态学模式,从而反映出PET影像在放射学表现上的差异。通过支持向量机分类器,与强度,几何形状,基于灰度共现矩阵的纹理,基于邻域灰度差异矩阵的纹理以及这四个特征的组合进行比较,评估了外壳的实用性。根据准确性,敏感性,特异性和AUC对结果进行评估。总体而言,在NSCLC和CC队列中,shell feature的预测性能均优于其他所有用于远处转移的功能。
关键词:非小细胞肺癌,宫颈癌,放射组学,distant failure,shell feature

1 引言

当恶性肿瘤细胞转移到远处器官时,发生distant failure,即癌细胞从原发性肿瘤扩散到远处器官的任何部位而没有局部衰竭,导致多达90%的人类癌症相关死亡(Mehlen和Puisieux,2006)。立体定向放射疗法(SBRT)被广泛用于患有早期医学上无法手术的非小细胞肺癌(NSCLC)的患者,达到了85%–95%的局部控制率(Chetty等,2013)。尽管局部控制率很高,但distant failure仍然很常见,3年和5年远距离复发率分别为22%和31%(Timmerman等人2010,Zhou等人2017)。同样,对于局部晚期宫颈癌(CC)的患者,即使推荐同时进行化学疗法和腔内近距离放射治疗(ICBT)的外束放射疗法(EBRT),至少有20%的患者仍会发生远处转移(Whitney等1999,Rose et al 2007);在主动脉旁受累的患者中,该比例超过40%(Schmid et al 2014)。因此,预测高危患者的distant failure对于通过强化治疗方式获得更好的治疗效果至关重要。

尽管尚不清楚许多控制转移的机制,但已知肿瘤微环境可调节肿瘤向转移的方向发展(Quail和Joyce 2013),如宫颈(Braumann等,2005),肺(Wood等,2014),结肠所示癌症以及其他癌症类型(Koelzer and Lugli 2014,Koelzer et al 2016)。发现微环境与distant failure之间存在相关性(Valastyan和Weinberg,2011年),通常以上皮-间充质转变(EMT)理论为例。在此过程中,位于肿瘤边缘的一部分癌细胞可能获得典型的转移性癌干细胞(CSC)样特征,包括自我更新,肿瘤起源,侵袭性和凋亡耐受性升高;这些癌细胞脱离主要肿瘤并开始转移,导致交界处改变和空间异质性(Chaffer和Weinberg,2011; Praks等,2013)。通过混合多尺度数学模型对该细胞侵袭过程进行了仿真,结果表明侵袭性肿瘤细胞首先在肿瘤内发育,然后穿透肿瘤边缘形成转移灶(Robertsontessi等,2015)。

除了EMT和CSC外,肿瘤萌芽也是造成侵袭的另一个因素,并且与结肠癌(Lugli等2017),肺癌(Yamaguchi等2010,Taira等2012),子宫颈癌(Alhadi)等的恶化相关。 等人,2014年; Huang等人,2016年)。 在肿瘤萌芽中,分离的或成簇的小恶性细胞靠近肿瘤边缘。 文献综述报道肿瘤芽可能是CSC的实现和EMT过程的展现(Dan等人2016),表明肿瘤出芽是独立的预后因素(Kadota等 2014),Huang等人2016。

在肿瘤边缘也观察到肿瘤岛。 在肺癌中,肿瘤岛是恶性细胞的大巢,它们相互连接,并与肺泡空间中的原发肿瘤相连,并靠近肿瘤边界。 它们也与预后不良有关(Onozato等,2013)。 通过发现在气隙中的扩散(STAS)扩大了研究范围,STAS是在肿瘤边缘附近的气隙中的侵袭性细胞现象。 STAS已被认为是一种重要的侵袭模式(Lu等2017),并被2015年世界卫生组织批准为肺分类系统中肺癌的独立转移预测因子(Travis等2015)。

这些发现表明,肿瘤与正常组织之间的界面可能会提供与转移潜能有关的表型信息,这将有助于发展预后和预测模型。 放射线学使该应用成为可能,放射线学可以提取与上述细胞表型有关的定量放射成像特征,即EMT诱导的CSC改变,肿瘤出芽,肿瘤岛和STAS。 此外,由于正电子发射断层扫描(PET)可能与病理形态相关(Baardwijk等,2008; Cook等,2014),因此可以预测包括肺癌在内的各种癌症的治疗结果(Tan等,2013; Wu等人,2016年),宫颈癌(Kidd等人,2010年)和其他癌症(Nogami等人,2014年)。 这些研究表明PET是肿瘤边缘病理异质性的有希望的定量反映。

在这项前期研究中,我们开发了肿瘤壳,这是一种放射学特征,可表征肿瘤周围及其与distant failure的相关性。 我们证明了其对于早期NSCLC接受SBRT的患者,接受EBRT并发化疗并随后在IB-IVA CC期接受高剂量ICBT的患者预测治疗反应的能力。

2 材料和方法

2.1 患者

我们的研究是在我们的机构中​​进行的,研究对象是机构审查委员会批准的两个队列的患者:
(1)2006年至2012年,48例接受SBRT治疗的IA和IB早期NSCLC患者(男性28例,女性20例;平均年龄70.58±9.84岁;范围54-90岁); (2)52例无主动脉结受累的IB-IVA宫颈癌患者,于2009年至2012年接受EBRT和同期化疗联合高剂量率ICBT治疗(平均年龄47.10±11.82岁;范围26-72岁) 。这项研究的黄金标准是患者在治疗后是否发生distant failure的状态,以二进制结果表示:数字0表示没有distant failure,数字1表示发生distant failure。在NSCLC数据集中,每个患者的PET切片总数在274到355之间变化,切片厚度为2.00到5.00 mm,像素空间分辨率为4.0×4.0 mm或5.0×5.0 mm。基于样条的插值具有连续的一阶和二阶导数,并且已显示出比其他几种医学成像方法更准确,更平滑的结果(Meijering等,2001; Saha等,2015)。因此,为了获得一致的分辨率,所有样条都通过样条插值沿轴向尺寸插值最小切片厚度为2.0 mm,以进行一维插值,而空间分辨率为4.0×4.0 mm,通过双三次样条算法在轴向平面中进行二维插值。有关插值的详细信息在附录A中进行了描述。在CC数据集中,所有切片均直接使用而无需插值,因为它们具有相同的5.00 mm切片厚度和4.0×4.0 mm像素空间分辨率。在进行肿瘤分析之前,将原始PET数据转换为标准摄取值(SUV)。

2.2 肿瘤分析

对于每位患者,选择包含原发肿瘤的切片进行分析。在NSCLC队列中,肿瘤被自动分割,中间位置切片通过基于对象信息的交互式分割方法(OIIS)(Zhou et al 2013)进行了分割,其他切片通过OTSU方法进行了分割。在CC队列中,由拥有4年经验的放射肿瘤学家手动划定了包含整个肿瘤的感兴趣区域,并由拥有19年经验的另一位放射肿瘤学家进行了检查。在NSCLC队列中,最初选择的切片数量为5到17,切片数量小于17的患者使用零填充。因此,在插值到最小切片厚度2.0 mm后,所有患者均拥有42切片。同时,由于所有患者切片中的最大平面内肿瘤直径均为13像素,因此在每个切片的肿瘤中心周围切出一个17×17像素的小块,从而每个患者切片的立方体尺寸为17×17×42。 CC队列中的每位患者使用的体积为29×29×40。所有特征均在裁剪的PET立方体上计算。

2.3 肿瘤外壳特征构建

图1 Shell feature提取工作流程 (a)一位患者的轴向PET切片 (b) 从a中每次切片上裁剪出一系列包含肿瘤的块(a中的红色窗口 )(c) 从b中相邻的块中衍生出的一系列sub-shell (d) shell feature 左图为灰度图像 右图为热红外图像

从一系列轴向PET切片中的肿瘤边界周围的体素中提取壳特征。外壳特征构建的工作流程如图1所示。第一行显示了按轴向顺序排列的肿瘤切片(红色窗口中的轮廓)(图1(a))。首先,如第二行所示(图1(b)),从上面的相应切片中裁剪出包含所描绘的肿瘤的贴片。保留所描绘的肿瘤中的PET强度值,而将肿瘤轮廓之外的像素设置为零。此外,通过将肿瘤内部区域设置为1,将肿瘤外部区域设置为0,获得了代表特定肿瘤区域的二值掩模图像。许多灰度子壳φ(t)(在图1中以黄色,蓝色和绿色正方形表示)(c))是通过计算每两个相邻的灰度色块P(t)(在图1(b)中以黄色,蓝色和绿色矩形概述)及其对应的二进制掩码M(t)之间的差异图像而得出的。如公式(1)所示,然后通过Hadamard乘积将两个差异图像组合在一起,从而获得sub-shell。如预期的那样,sub-shell通常是肿瘤的外部区域。最后,通过将等式(2)中所示的sub-shell φ(t)加在一起,形成壳S(k)(图1(d)),并用来表示在整个肿瘤体积边界三维像素的整体异质性。
图1(c)中的sub-shell序列φ(t)定义为:


其中P(t)表示图1(b)中所示的灰度色块序列,M(t)是表示肿瘤区域的匹配二进制蒙版图像序列,符号。表示Hadamard积,t是块( 片)号。 当t = 1时, φ(t)为零矩阵0。 φ(t)中的元素大于(当M(t)M(t-1)中的对应元素为0、1或1、0时 )或等于零(当M(t)M(t-1)中的对应元素为0、0或1、1时)。 因此,每个sub-shell图像中部分描述了肿瘤边缘的异质结构,SUV值越高像素显得越亮。 sub-shell的示例如图1所示。
为了表示整个肿瘤边界的异质性,对于每位患者k,通过连续累积子壳在一起来构造壳特征S(k),可以写成:

其中,n是切片总数,其中NSCLC队列中的n = 42,CC队列中的n = 40。 shell feature的优势在于使用了紧凑而全面的描述,该描述捕获了肿瘤边界上的一系列形态学图案,例如简单的2D映射中的形状,大小,SUV值和异质性(图1,最后一行 )。 要注意的是,在整个工作中,此2D映射被整体视为shell feature。 然后将向量化的外壳(例如,从2D映射图转换的1D向量)用作基于支持向量机(SVM)的分类器的输入(第2.5节)。 这种方法与基于体素/像素的方法相同(Zuluaga等人(2015),Huang等人(2017),Khamis等人(2017)),而没有像传统的基于放射学的方法那样进一步明确地计算出handcrafted features。

2.4 Handcrafted features

对比:尽管指定了相同的名称,但GLCM和NGTDM中采用了不同的计算方法。 缩写:GLCM,灰度共生矩阵; NGTDM,邻域灰度差矩阵

将我们提出的shell feature与从整个描绘的肿瘤区域中提取的以下五组handcrafted features进行比较:9个强度特征,8个几何特征,12 s阶灰度共现矩阵(GLCM)特征,5个高阶邻域灰度 差异矩阵(NGTDM)纹理特征,以及这四种类型的组合,总共有34种。表1中描述了这些功能,附录B中提供了计算功能。

2.5 建立预测模型

为了建立预测模型,采用具有高斯径向基函数(RBF)的监督学习方法SVM将有或没有distance failure的患者分为两类。 SVM是判别模型,可以通过代表两个类别之间最大分隔边距并具有两个参数惩罚因子C和gamma的分隔超平面对数据进行分类(Suykens和Vandewalle 1999)。使用LIBSVM工具箱中的程序(Chang和Lin,2011年),并进行了网格搜索,以通过最小化SVM的分类误差来找到最佳参数,如文献所示(Hsu等,2003)。在将向量化的shell用于SVM之前,通过主成分分析(PCA)对其进行了处理,以减小特征尺寸。还原过程在附录C中进行了描述。在10个NSCLC和CC队列研究中,使用10条5倍交叉验证的随机试验比较了shell feature与其他五个特征的预测能力。同时,为了解决阶级不平衡问题,通过在少数族裔邻里分布的基础上创建综合实例,使用合成少数类过采样技术(SMOTE)来增加少数类样本(具有distance failure的样本)类别(Chawla等,2002)。 在这项研究中,在NSCLC队列中生成了24个(12个distance failure阳性,36个distance failure阴性)合成样本,并且在CC中创建了24个(14个distance failure阳性,38个distance failure阴性)新样本队列。准确性,敏感性,特异性和受体工作特征曲线(AUC)下的面积用作评估指标。该代码在Matlab(R2016a版本)中实现。

2.6 统计分析

外壳特征与其他特征之间的AUC性能差异通过学生的t检验进行了评估。 认为差异具有统计学意义,P值小于0.05。 图2显示了具有95%置信区间的接收器工作特性(ROC)曲线。使用Matlab统计工具箱(版本R2016a)进行了统计分析。

3 结果

3.1 临床表现

note. NSCLC和CC的分期分别由TNM和妇产科联合会(FIGO)分期系统确定。 缩写:NSCLC,非小细胞肺癌; CC:子宫颈癌; SD:标准偏差

表2列出了NSCLC和CC队列中患者的人口统计学和临床特征。在两次试验之间,未观察到远处失败发生率的显着差异(P = 0.917)。 在随访期间,放疗后在NSCLC队列中有25%(48个中的12个)患者和在CC队列中26.9%(52个中的14个)中观察到远处转移。

3.2 预测性能对比

note. “组合”是指四种特征的组合,即强度,几何形状,GLCM纹理和NGTDM纹理; 95%CI和P值均来自AUC值; P值衡量每组手工制作之间的统计AUC差异 功能和外壳功能。 缩写:AUC,特征操作曲线下的面积; CI,置信区间

图2 外壳特征和其他五组手工特征的接收器工作特性(ROC)曲线 (a) NSCLC队列 (b)CC群组 ROC曲线根据可变特征阈值下的预测特征和远距离故障的观察结果描述了二进制SVM模型的分类能力,x轴代表假阳性率,并计算为(1-特异性) y轴通过灵敏度表示真实的阳性率, 曲线下较大的区域表示更好的预测。

通过定量分析(表3)和ROC绘图(图2)在NSCLC和CC队列中对壳特征和其他特征进行了比较。 AUC,敏感性,特异性和准确性是研究中使用的标准。 附录D中给出了定义。

外壳特征在预测远距离故障方面显示出最高的准确性(表3)。 在NSCLC队列中,壳特征的AUC为0.82(95%CI,0.6632至0.9247),灵敏度为0.81,特异性为0.80,准确度为0.81。 对于其他五个特征,对于GLCM纹理,观察到最佳结果,如0.76 AUC(95%CI,0.5528至0.8905),0.75灵敏度,0.74特异性和0.75精度所示。 同样,在CC队列中,shell功能仍在所有指标上均达到最佳性能,具有0.83 AUC(95%CI,0.6559至0.9212),0.81灵敏度,0.80特异性和0.80准确性。 这些结果表明,壳特征比其他特征具有更大的判别能力。 此外,发现外壳特征与其他特征之间的AUC性能差异也很明显(两个队列中的两个特征均P <0.005)。

不同特征集的ROC曲线如图2所示。NSCLC(图2(a))和CC((b))获得了相似的结果。 拟议的外壳特征(由上方的蓝色曲线表示)位于图表的左上角附近,表明与其他方法相比,平均而言具有更大的区分能力。

图3 外壳特征具有识别远距离衰竭(DF)阴性和阳性肿瘤的能力。 (a)和(b)是2D外壳在结构异质性方面的代表性示例。 (a)非小细胞肺癌病例。 (b)CC案件。在每个队列中,根据肿瘤体积(第一列)中的一系列切片(第二列)计算出壳特征(第三列),第一行显示没有远距离衰竭的肿瘤,而下一行显示了远距离衰竭的肿瘤。如图所示,远距离衰竭的肿瘤表现出更复杂的形态学模式。 (c)和(d)是整个患者的特征矩阵,其中每一行指的是来自一名患者的矢量化壳的稀疏系数,而每一列对应于特征的元素。 (c)非小细胞肺癌病例。 (d)CC案件。这些特征是通过字典学习方法从原始矢量化壳中学习的稀疏系数。这些特征矩阵显示(DF)阳性和阴性肿瘤的聚集特征。

辨别能力由代表性的2D壳图表示(图3(a)和(b))。 上排显示没有远距离衰竭的肿瘤(图3(a)),下排显示了远距离衰竭的肿瘤(图3(b))。 具有较高SUV值的像素以较亮的颜色表示,而具有较低SUV值的像素以较暗的颜色表示。 从壳图可以明显看出,远处失败阳性的肿瘤比远处失败阴性的肿瘤表现出更多的异质边界表达。 该发现可能归因于屏障微环境中肿瘤的更活跃,变化更大且潜在的侵入性细胞行为。

图3(c)和(d)进一步说明了针对NSCLC和CC队列的shell分类的总体能力,其中矩阵中的行是通过字典学习方法学习的向量化shell的稀疏系数(Gu et al 2014 )。给定矩阵X(每列是向量化的外壳,行数是外壳的长度)和类标签Y(遥远失败状态的二进制结果0/1),则在以下框架下进行字典学习稀疏表示是为了解决优化问题{D,Q} = arg min D,Q || X − DQX || 2 F +(D,Q,X,Y),其中(D,Q,X ,Y)是判别函数,D是用于重构X的合成字典,Q是用于编码X的分析字典。使用求解的D和Q,可以通过W = QX获得稀疏系数矩阵,每列为对应于患者的向量外壳的稀疏系数,它是原始训练数据(输入向量外壳)对包含判别信息的学习词典的投影。可以在两个队列中看到聚类特征,同一类别的特征显示相似的表示,不同类别的特征显示不同的表示。在图3(c)和(d)的水平行中,DF负数中的稀疏系数在上半部分具有较高的值,而在后半部分中则具有较低的值,而DF正数中的稀疏系数在其中具有较低的值。上半部分较高,下半部分较高。

3.3 对NSCLC患者的独立验证

注意:NSCLC中的阶段由TNM决定。 缩写:NSCLC,非小细胞肺癌; SD:标准偏差。

为了进一步评估弹壳的预测能力,2012年至2016年,另一队列的23例IA和IB NSCLC不能手术的早期患者接受了SBRT(男性12例,女性11例;平均年龄73.30±9.58岁;范围55到91岁)。 机构用于独立验证。 在30.4%(23个中的7个)患者中观察到远处转移。 表4列出了患者的人口统计学和临床特征。在远距离衰竭阳性队列中(P = 0.320),验证组与主要队列(48名患者的队列)在特征(P = 0.320)之间没有显着差异。 0.336)或在远距离失败时为负队列(P = 0.792),这证明了将其用作验证队列是合理的。 将48例具有5倍交叉验证的NSCLC患者的主要队列用于训练,然后将经过训练的模型应用于验证队列。



验证集中的外壳功能的性能也与其他功能进行了比较。 实验结果显示在表5中。在验证队列中,外壳功能仍然优于其他功能,可用于远距离故障预测。 壳特征获得的AUC为0.79(95%CI,0.6559至0.9212),灵敏度为0.71,特异性为0.87,准确度为0.83,而其他特征获得的最高AUC为0.70(95%CI,0.4079至0.8442)。 灵敏度分别为0.71,特异性0.62和0.65。

4 讨论与总结

肿瘤外壳评估了肿瘤边界作为distance failure的预测因素的潜力,PET衍生的特征可让我们检测其与微环境内转移的关系。 shell feature可用于预测用SBRT治疗的NSCLC患者和用EBRT以及化疗与大剂量ICBT同时进行的CC患者的结局。

肿瘤-宿主界面与转移有关,因为肿瘤细胞与其微环境之间的相互作用在肿瘤的侵袭和转移中起着积极的作用。然而,据我们所知,很少有研究针对医学成像中的肿瘤边界来构建转移的风险模型(Lennon等,2015; Mezheyeuski等,2016)。最近的一项研究将肿瘤-基质界面的形态与多重分形指标联系起来,该分形指标源自病理图像上的肿瘤轮廓(不包括肿瘤内部组织)。发现基于轮廓的指标与转移相关特征(例如肿瘤边界构型和肿瘤发芽等级)显着相关(P <0.001),从而验证了其对结肠癌治疗反应的预后和预测功效(Mezheyeuski等2016)。类似地,在肺癌综述中,肿瘤-基质界面的分形维数用于测量肿瘤进展(Lennon等人,2015年)。该研究强调了放射影像学的使用,并发现衍生指标与肿瘤生长和预测的治疗反应相关(Lennon等人,2015)。值得注意的是,这些研究的预测指标是根据肿瘤边缘轮廓线计算出的分数,而我们的方法使用的是肿瘤边界区域,其中可能包含更多可挖掘的信息。此外,分数的计算是手工处理的,容易受到人为不一致和操作者依赖性的影响。

由于shell是由围绕肿瘤边缘的外围像素构建的,并且shell feature是通过简单地在外壳区域对PET的像素强度值进行矢量化来构造的,因此一旦重建了PET图像,shell feature就被固定了。与需要从重构的PET进一步提取/计算特征的基于handcrafted features的方法相比,shell feature可能较少依赖体素相关因素,因为它直接将整个矢量化壳视为特征。另一方面,重建的PET的噪声水平和图像分辨率受重建算法以及重建期间选择的参数的影响。在这项初步研究中,以不同的分辨率重建了PET图像,其中基于样条的插值技术克服了PET图像的不均匀分辨率,这是因为其性能优越。如附录A所示,不同的插值方案将生成不同的插值结果。因此,重建参数可能仍会影响shell feature的性能。由于我们目前拥有的样本相对较少,因此无法通过根据重建参数对患者进行进一步分组来量化PET重建参数对壳体特征性能的影响。如果重建参数协调一致,则壳特征的性能可以得到进一步改善。

distance failure与肿瘤边缘的放射学特征之间的相关性是基于与转移潜能相关的已知生物学过程,例如EMT和肿瘤出芽。 基于这些发现位于肿瘤边界的假设,提出了壳特征来描述与转移可能性有关的肿瘤外围的空间形态。 而且,就这些过程存在于其他肿瘤类型中而言,shell feature可能可用于预测其他癌症的预后。

我们的研究提出了一些限制,包括使用小病人。 同样,将一系列子壳(3D)累积到2D壳特征中可能会导致轴向透视图中空间复杂度的损失。 我们仅使用矢量化壳作为输入,因为我们的主要目的是评估壳预测远距离故障的能力。 当与强度,几何形状和纹理特征等其他特征结合时,外壳需要额外的过程以具有更简洁有效的描述,这可能会导致更好的预测能力。 最后,本文未研究肿瘤边界扩展的影响。

总之,PET衍生的shell feature揭示了肿瘤边缘与distance failure之间的关系,可用于促进NSCLC和CC患者的放射治疗反应的早期预测。

Acknowledgment

This work was supported in part by the American Cancer Society (ACS-IRG-02-196) and US National Institutes of Health (5P30CA142543). The authors would like to thank Dr Damiana Chiavolini for providing helpful suggestions and editing the manuscript.

附录A. 插值方法比较

由于基于样条的插值优于其他方法,因此我们将沿轴向尺寸的样条插值用于一维插值,并将轴向平面中的双三次样条算法用于二维插值。

你可能感兴趣的:(【论文翻译2019-10-21】Shell feature: a new radiomics descriptor for predicting distant failure after ra...)