嘿,大家好,好久不见了。今天给大家分享一篇来自EBioMedicine(IF: 5.74原来6.18)白血病相关的一篇文章,预后分析还是那些操作
Genome-wide Identification of FHL1 as a Powerful Prognostic Candidate and Potential Therapeutic Target in Acute Myeloid Leukaemia
通过全基因组分析发现FHL1是急性髓样白血病有效的预后和潜在的治疗标志物
1 摘要:
背景:急性髓系白血病(AML)是一种异质性高、死亡率高的恶性血液肿瘤。可靠的预后评估对治疗策略至关重要。然而,目前的急性髓细胞白血病的预后评估系统还有所欠缺。
方法:对三个独立AML数据集进行全基因组单变量Cox回归分析,以筛选预后相关基因。采用Kaplan-Meier生存分析,通过1298例新生AML患者、648例非急性早幼粒细胞白血病AML患者和407例细胞遗传学正常AML患者验证FHL1基因评估总体生存的有效性;其中一些患者的数据也用于EFS和RFS验证。多变量Cox回归验证FHL1作为独立预后的标志物。应用WGCNA、GSEA及基因相关分析探讨FHL1在AML中的作用机制。
结论:全面的全基因组分析和大样本验证表明,FHL1是AML患者总体生存、无事件生存和无复发生存的强有力的预后候选,且独立于与预后相关的临床因素和遗传异常。其分子机制可能通过调节白血病干细胞中的FHL1、肿瘤相关信号通路和化疗药物的跨膜转运而发生。靶向FHL1干预可增强AML细胞对阿糖胞苷的敏感性。FHL1可作为临床策略选择的评价因子,其靶向干预可能有利于AML患者的化疗。
2 材料和方法:
2.1 患者与治疗方法:
一个数据集来自癌症基因组图谱(TCGA),该图谱提供了151名AML患者,TCGA提供了AML患者的主要形态学和细胞遗传学亚型,以及基于高通量测序(RNA- seq)的RNA表达谱和详细的临床信息。所有基因表达数据均可通过数据门户获取(https://portal.gdc.cancer.gov/)。TCGA研究网络对AML患者的临床特点、细胞遗传学和分子生物学信息、治疗方法和生存状态进行了总结。
另外两个数据集分别从德国AML合作组织(AMLCG)和包括162和78名未经治疗的CN-AML患者(不包括MDS-RAEB)。所有患者均接受化疗。从Gene Expression Omnibus(GEO, accession number: GSE12417) 获得临床和生存信息以及微阵列数据。
其他一些已发布的AML数据集也用于进一步分析,GSE37642-GPL96 (n = 417)、GSE37642-GPL570 (n = 136)、GSE106291 (n = 250)用于所有新生或non-APLAML患者的生存分析; GSE71014(n = 104)用于CN-AML患者的生存分析;GSE83533(n = 19)用于复发性AML病例分析;GSE30029 (n = 121)研究干细胞的基因表达模式。上述所有表达信息及临床资料均可在GEO数据库中公开获取;省略临床资料不完整的病例。
为了进一步验证,我们收集了来自中国山东大学齐鲁医院血液科知情同意的28例新诊断AML患者的骨髓样本;其中15例对后续标准化疗方案敏感,13例耐药。本研究经山东大学医学院医学伦理委员会批准。获得患者知情同意。
2.2 变量Cox回归分析
为了确定预后基因,以TCGA数据集为训练集,进行全基因组单变量Cox总生存期(OS)回归分析。以FDR<0.05为统计界限,获得预后候选基因。通过单变量Cox回归在代表CN-AML患者的两个AMLCG数据集中验证了候选基因,以鉴定潜在的预后指标。以各基因在个体群体中的中位表达水平为截止值,将基因表达水平一分为二。
2.3 加权基因共表达网络分析(WGCNA)
WGCNA是一种系统的生物学方法,用于描述不同样本之间的基因相关性模式。基因组和表型之间的关联有助于确定候选生物标记基因或治疗靶点。在这项研究中,构建了TCGA数据的基因表达矩阵,并选择了25%变异最大的基因作为输入数据。使用R软件中的“ WGCNA”软件包执行WGCNA,并构造邻接矩阵和拓扑重叠矩阵(TOM)并计算相应的不相似度(1-TOM)。用动态树切割法进行基因树状图的构建和模块鉴定,并计算模块特征基因与生存条件之间的相关性。进一步分析含有FHL1的模块进行基因表达和功能富集分析。
2.4 基因特征分析
采用基因富集分析方法(GSEA, http://software.broadinstitute.org/gsea/index.jsp)对FHL1相关的生物学功能进行了分析。对TCGA中FHL1高(上四分位数)和低(下四分位数)表达的样本进行GSEA检测。GSEA的临界值为P <0·05和错误发现率(FDR)<0·25。
2.5 细胞培养和慢病毒转导
AML细胞系Kasumi-3,U937和Kasumi-1从美国典型培养物保藏中心(ATCC)获得,在RPMI 1640培养基(Life Technologies, Carlsbad, CA)中培养,加入10%胎牛血清(Gibco, Carlsbad, CA),并在37℃,5% CO2的环境中培养。Kasumi-3和U937细胞分别用针对FHL1表达短发夹rna (shRNAs)的慢病毒或从GenePharma(上海,中国)获得的混乱序列转导,以比较FHL1敲除的生物学效应。用嘌呤霉素筛选阳性细胞进行病毒感染。针对FHL1的干扰序列为sh-FHL1-1’-GGACTTCTACTGCGTGACTTG-3’和sh-FHL1-2 - 5’-GCTGTGGAGGACCAGTATTAC-3’。
2.6 质粒转染
按照制造商的规程,用罗氏转染试剂(瑞士罗氏)将3Flag标记的FHL1真核表达质粒及其载体(Genechem,中国上海)转染到Kasumi-1和U937细胞中。
2.7 阿糖胞苷(cytarabine)治疗和测量细胞活力
阿糖胞苷购自Sigma-Aldrich公司(Sigma-Aldrich,圣路易斯,密苏里州),用二甲基亚砜(DMSO)溶解并冷冻至- 20℃。在100 nM或500 nM浓度下用阿糖胞苷处理AML细胞。采用细胞计数Kit-8 (CCK-8)检测细胞活力。按照每个孔8×10 3个细胞分配到96孔板中,每个孔中含100 µL不同浓度阿糖胞苷完全培养基,持续72 h,然后将10 µL CCK-8试剂添加到每个孔中并孵育3 h在孵化器中。使用酶标仪测量450 nm处的吸光度,并计算细胞活力。
2.8 RNA提取和实时定量PCR(qRT-PCR)
用Trizol法提取细胞和临床样本中的总RNA。利用带有gDNAEraser的PrimeScript™RT试剂试剂盒合成互补DNA (cDNA)。通过PCR,使用β-肌动蛋白作为对照验证FHL1基因的表达。FHL1正向5'-CCAACACCTGTGTGGAATG-3'和反向5'-GAGTCCTCCCGAGTGGTG-3';β-肌动蛋白正向5'-AGTTGCGTTACACCCTTTCTTG-3'和反向5'-CACCTTCACCGTTCCAGTTTT-3'。
2.9 统计分析
根据FHL1high或FHL1low的表达值(与患者所属队列的中位数相比),将FHL1的表达一分为二。总生存期(OS)被定义为从最初诊断到因任何原因死亡或观察结束的时间。无事件生存期(EFS)包括从最初诊断到复发或死亡的间隔时间。采用log-rank检验计算OS、EFS和无复发生存(RFS)的概率。
多变量Cox回归模型包含多个预测变量,包括年龄、白细胞(WBC)计数,不良细胞遗传学风险和基因突变。C-index由R软件的“survcomp”包计算,C-index使用“cindex.comp”包进行比较。利用R软件的“survcomp”和“survival”软件包进行时间相关的接收机工作特性(ROC)分析和曲线下面积(AUC)计算。曲线下综合面积的比较采用“iauc.comp”软件包。两组之间的分析是使用Student t检验,Welch t检验,配对t检验或Mann-Whitney检验进行的,基因表达与临床特征之间的关系通过Mann-Whitney检验,卡方检验或费舍尔的精确测试。使用R 3.5.3,Stata / IC 15.0和GraphPad Prism 8.0.2软件完成基因表达相关性分析和所有统计。每个实验重复三次,所有数据以均数±标准差表示。所有检验的显著性水平为p-value <0·05。
3 结果分析
3.1 整合基因组筛选急性髓系白血病新的预后标志物。
为了获得稳定的AML预后和靶向干预的相关基因,我们合成了AML患者的基因表达数据和生存状态,并进行了全基因组单变量Cox回归分析,在CGA-LAML和两个CN-AML数据集:AMLCG(1999-2003)和AMLCG(2004)中获取与预后相关的基因。 首先,我们确定了存在于所有三个独立数据集中的12311个基因。然后以TCGA数据集作为训练集,将上述基因按中位基因表达水平分为两组,再进行单变量Cox回归。以FDR<0.05为统计界限,共获得394个候选基因。候选基因分别在AMLCG(1999-2003)和AMLCG(2004)中进行单变量Cox回归验证。最后,在两个验证数据集中验证了FHL1、HOPX和FAM124B三个基因,并在预后评估中进一步评估(图1)。
图 1
为了比较这三个基因的预后评估能力,我们对FHL1、HOPX和FAM124B进行了AML患者生存的多因素Cox回归分析。结果显示,Cox模型中三个基因均具有统计学意义,其中FHL1表现出较大的危险比(Hazard Ratio, HR),可能在模型中发挥重要作用(图2)。然后我们计算这三个基因生存评估的c指数。结果表明,FHL1的c指数为0·762(0·683-0·842),HOPX为0·690(0·601-0·779),FAM124B为0.652(0·558-0·746)。FHL1的c指数高于FAM124B (Student’s t-test;P= = 0·02),略高于HOPX,但无统计学意义(Student’s t-test;P = = 0·089)。对3个基因进行时间依赖的受试者工作特征(ROC)分析,结果显示FHL1曲线下面积(AUC)较大,尤其是10年生存率。曲线下综合面积(IAUC)统计分析表明,FHL1曲线下综合面积(AUC)高于HOPX曲线下综合面积(Wilcoxon秩和检验;P= = 0·011)和FAM124B (Wilcoxon秩和检验;P < 0·0001)。考虑到APL在AML中的特异性,我们还对非APL AML患者的FHL1、HOPX和FAM124B进行了生存评估分析。结合单变量Cox回归结果、多变量Cox回归结果和时间依赖ROC结果,我们发现FHL1在非APL AML患者中也具有更好的生存评估表现(图2)。综上所述,FHL1在三个筛选基因中对AML具有较好的预后评估效能,但其在白血病中的作用尚不明确,因此我们选择了FHL1进行进一步的研究。
图 2
3.2 FHL1的高表达是预测初发AML患者不良临床结果的重要因素
本研究共对1298例初发急性髓系白血病的成年患者进行了多项临床试验,以评估FHL1的预后价值。其中,在四个独立数据集中,FHL1表达较高的初发AML患者总OS较FHL1表达较低的患者短(GSE37642-GPL96 (median OS 8·7 vs. 16·4 months; log-rank test, P = 0·011), GSE37642-GPL570 (median OS 11·4 vs. 24·1 months; log-rank test, P = 0·016), TCGA (median OS 8·1 vs. 46·5 months; log-rank test, P<0·0001) and GSE106291 (median OS 15·1 vs. 28·8 months; log-rank test, P = 0·04)) (图3.a)。
图 3
同样,在非APL组中,FHL1高表达也提示AML患者生存期较短,预后较差(图3.b)。对FHL1的预后价值,我们也对FHL1在中间细胞的表达进行了风险类别评估,在407名核型正常的新生AML患者(包括TCGA CN-AML患者)中发现了高FHL1表达暗示较差的预后(median OS 10·7 vs. 25·3 months; log-rank test, P = 0·021), GSE71014 (median OS 25·0 months vs. undefined; log-rank test, P = 0·029) datasets, AMLCG (1999-2003) (median OS 7·9 vs. 33·3 months; log-rank test, P <0·0001) and AMLCG (2004) (median OS 11·4 months vs. undefined; log-rank test, P = 0·0024)(图4.c)。此外,与FHL1低的患者相比,FHL1高的患者EFS更糟(median OS 6·4 vs. 17·0 months; log-rank test, P <0·0001) and RFS (median OS 13·4 vs. 34·1 months; log-rank test, P = 0·005),同时在CN-AML患者 (EFS median OS 7·5 vs. 14·8 months, log-rank test, P = 0·0045; RFS median OS 8·3 vs. 17·0 months, log-rank test, P = 0·025) 和非APL AML患者的EFS (EFS median OS 7·2 vs. 12·95 months, log-rank test, P = 0·0018; RFS median OS 14·9 vs. 17·0 months, log-rank test, P = 0·23),也观察到同样的现象,但RFS并没有这个现象(图4.d-f)。
图 4
此外,与预后预测一致,FHL1高表达患者的细胞遗传学和分子风险分类较差。因此,FHL1是新生AML患者的有效预后因素。
3.3 FHL1是AML不良预后的独立预测因子
多个临床因素对AML预后有显著影响,以年龄、白细胞(WBC)计数和细胞遗传风险为代表。此外,许多基因突变对AML的预后也有重要的指示作用。单变量Cox回归用于具有较高突变频率的基因,以选择与预后相关的突变基因。对于初发AML患者,对年龄、WBC计数、不良细胞遗传学风险以及TCGA中初发AML患者的MLL-PTD、FLT3、DNMT3A、TP53和RUNX1突变等几个对OS有显著影响的参数进行了多变量分析。对AML患者,多因素分析结合所有预后因素时,高FHL1表达仍是OS(HR = 2·194; 95% confidence interval (CI), 1·409-3·416; P = 0·001)、EFS (HR = 2·025; 95% CI, 1·326-3·093; P = 0·001)、RFS(HR = 2·240; 95% CI, 1·300-3·859; P = 0·004)的独立不良预后因素(图5)。
图 5
在非APL AML患者中,高FHL1表达仍然是OS的独立不良预后因素。在CN-AML亚型中,FHL1的高表达也与OS相关
当与所有这些预后因素结合进行多因素分析时,FHL1的高表达仍然是OS(HR = 2·143; 95% CI, 1·134–4·050; P = 0·019), EFS (HR = 2·498; 95% CI, 1·355–4·604; P = 0·003)和RFS(HR = 2·504; 95% CI, 1·235–5·078; P = 0·011)独立于年龄、白细胞计数、MLL-PTD、FLT3和DNMT3A突变不良预后因素(图6)。
图 6
3.4 FHL1与其他已发表的预测基因集在预后评估方面的比较
已报道了几种基于基因表达的全基因组AML预后基因集。为了比较FHL1和其他预后模型的预后价值,我们对FHL1和3基因、7基因和24基因模型进行了两两配对的多变量Cox回归。多因素Cox回归分析显示,大多数比较中OS(8/9)、EFS(3/3)和RFS(2/3)的FHL1仍然是独立且有统计学意义(P <0·05)的(表1),而OS(3/3)和EFS(3/3)在非APL组中。这些结果表明FHL1是一种有效、独立、简单的AML预后指标。
表 1
3.5 FHL1的表达与AML的多种临床和分子特征有关
根据FHL1中位表达水平将TCGA中AML患者分为两组。FHL1的高表达与年龄的增长和复杂的细胞遗传学有关。此外,FHL1 - 高和- 低组透露,French-American-British(FAB)分类的不同分布特征。M0多见FHL1表达增高,M3多见FHL1表达降低。我们分析TCGA中突变频率较高的基因,发现FHL1表达较高的患者RUNX1中突变的发生率较高,但那些FHL1表达较低的患者,其NPM1和CEBPA等临床预后较好的基因发生了突变(表2)。
表 2
3.6 WGCNA和AML预后相关模块的鉴定
WGCNA是一种系统的生物学方法,它根据基因表达模式的相似性将基因分为不同的簇或模块,可以用来分析基因的潜在功能。为了确定AML预后相关模块,我们基于基因表达谱和生存信息(包括OS时间、OS状态、EFS时间和EFS状态)对TCGA中的AML患者进行了WGCNA。去除基因表达模式差异较大的样本(图7.a)。我们选择无标度R 2= 0·8作为实现无标度网络的软阈值(图7.b-c)。结果,在动态树切割合并后,共识别出32个基因共表达模块(图7.d)。
图 7
热图绘制了1000个选定基因中的TOM,表明每个模块都是相互独立验证的,并计算各模块与AML患者生存期的相关性(图8.e)。我们确定了两个与OS时间、OS状态、EFS时间和EFS状态(P < 0·05)有统计上显著关联的模块:一个用于肿瘤抑制,另一个用于肿瘤促进。绿色模块与AML患者生存时间呈正相关(Pearson correlation coefficient, OS P = 2 × 10−4; EFS P = 8 × 10−5),与患者生存状态呈负相关(defining death as the positive event; Pearson correlation coefficient, OS P = 7 × 10−6, EFS P = 6 × 10−6);红色模块与生存时间呈负相关(Pearson correlation coefficient, OS P = 0·03; EFS P = 0·04),但与生存状态呈正相关(Pearson correlation coefficient, OS P = 0·01, EFS P = 0·02),FHL1存在红模块(图8.f)。由于同一模块的基因通常具有相似的生物学功能,我们对与FHL1相同模块的基因进行了分析。这个红色模块包含一些已被报道为AML预后标志物的基因,如CALCRL、DOCK1和HOPX,还包括一些干细胞相关基因,如CD34和FAM30A以及一些转录因子相关基因,如JAK1、SMAD1和Notch1(图8.g)。KEGG富集分析还发现,红色模块基因参与了肿瘤的转录错误调控(图8.h)。TCGA数据的WGCNA显示包含FHL1的模块与AML预后显著相关,对模块相关基因的功能分析提示FHL1可能参与了基因转录和干细胞的调控,可能作为预后的候选标志物。
图 8
3.7 FHL1相关基因在LS标记、癌症通路和化疗药物的细胞外转运中富集
为了探索FHL1表达与肿瘤细胞标记的相关性,我们根据FHL1表达水平对AML患者进行GSEA检测。AML、LSC信号、癌症信号通路(包括Wnt信号通路、MAPK信号通路和JAK/STAT信号通路)、细胞对药物的反应、化疗药物的细胞外转运均显著富集(图9.a-h)。
图 9
为了进一步验证结果,我们检测了151例初发AML患者FHL1与已知的LSC相关基因的相关性,发现FHL1的表达与ADGRG1、FAM30A、CD34、ZBTB46和NYNRIN呈显著正相关,这些基因被报道为LSC信号的重要组成部分(图10.i)。
图 10
此外,FHL1、SMAD3和TCF4在Wnt信号通路中的表达、MEF2C和TAB2在MAPK信号通路中的表达以及IL2RA和JAK1在JAK/STAT信号通路中的表达均呈现明显的正相关(图11.j-l)。
图 11
GSEA结果还显示,FHL1表达相关基因在化疗药物跨膜转运中富集,此外,负责将阿糖胞苷等化疗药物转运出细胞的ABCC1和ABCC4在FHL1高表达组内表达升高(图12.m-n)。
图 12
而在化疗耐药患者中,FHL1的表达与SLC29A1基因呈负相关,SLC29A1基因负责将阿糖胞苷转运入细胞(图13.o)。
图 13
因此,FHL1可能通过减少化疗药物进入细胞的摄取,增加化疗药物排出细胞外,参与AML细胞对化疗药物的耐药。
3.8 FHL1在LSCs中高度表达,其靶向干预增强了阿糖胞苷的细胞毒
性作用
为了进一步阐明FHL1在LSCs中的作用以及AML的化疗耐药,我们将FHL1在FAB-M0(又称微分化急性成髓细胞白血病)中的表达与分化程度较高的FAB-M4和-M5中的表达进行了比较(图14.a)。先前的一项关于正常造血的研究报道称,与它们的子代细胞相比,FHL1在脐血来源的原始造血干细胞(HSPCs)中过表达。因此,我们探究FHL1是否与LSCs有关,发现FHL1在17-gene LSC评分(LSC17)高的细胞中表达增加,LSC17是与干性相关的预后生物标志物(图14.b)。此外,FHL1在AML CD34+细胞中的表达高于AML CD34-细胞(图14.c)。FHL1在LSCs中高度表达,可能参与了LSCs的调控,AML的高复发率归因于LSCs的持续存在,LSCs具有许多与治疗耐药相关的干细胞特征。我们的研究和另一项基于高通量筛选的研究表明,与化疗敏感患者相比,化疗耐药AML患者初始诊断时FHL1表达升高(图14.d)。此外,我们发现FHL1在同一AML患者复发时的表达高于首次诊断时(图14.f)。
图 14
因此,FHL1可能参与了AML的化疗耐药和复发。根据首次诊断时FHL1表达情况,我们将接受以胞嘧啶为基础的标准诱导化疗的AML患者分为两组,生存分析显示FHL1高表达组有较短的OS和EFS(图15.g-h)。FHL1高表达的新AML患者移植后预后也较差(图15.i)。
图 15
我们下调了AML细胞株Kasumi-3和U937中FHL1的表达(图16.j),并检测了这些细胞对阿糖胞苷敏感性的影响。结果显示,两种shRNA敲除FHL1后,与对照组相比,阿糖胞苷对AML细胞的杀伤作用增强(图16.k-l)。我们在AML细胞中过表达FHL1,发现在阿糖胞苷治疗中,FHL1可以提高AML细胞的存活率(图16.m-o)。提示FHL1靶向干预可能提高AML细胞对阿糖胞苷的敏感性。因此,FHL1在初始诊断时的表达水平可能对AML化疗患者的预后评估和针对性干预有帮助。
图 16
4 讨论
本研究发现FHL1是一种强有力的预后指标,独立于现有的临床或遗传因素并与之互补,其高表达暗示较短的生存期和化疗反应较差。此外,FHL1的下调增强了AML细胞对阿糖胞苷的敏感性。因此,FHL1的高表达可以作为临床策略选择的评价因子,其靶向干预可能有利于AML患者的治疗,尤其是化疗耐药的患者。