通过基质相关基因确定肿瘤预后标志物以改善早期诊断和预测病人预后

Novel prognostic matrisome-related gene signature of head and neck squamous cell carcinoma

头颈部鳞状细胞癌的新型预后基质体相关基因特征

发表期刊:Front Cell Dev Biol

发表日期:2022 Aug 23

影响因子:6.081

DOI:  10.3389/fcell.2022.884590

一、背景

        头颈部鳞状细胞癌(HNSCC)是一种常见的恶性肿瘤,来源于口腔、咽部和喉部的粘膜上皮。最常见的HNSCC亚型是喉鳞状细胞癌(LSCC)、口腔鳞状细胞癌(OSCC)和鼻咽癌。LSCC约占所有头颈部恶性肿瘤的20%,是上呼吸道肿瘤中仅次于肺癌的第二大恶性肿瘤。声门上和声门下LSCC的预后普遍较差,且明显差于声门喉癌。由于OSCC具有高度侵袭性,患者在诊断和治疗过程中通常会出现疾病进展。确定LSCC和OSCC的共同分子标志物不仅可以发现这两种疾病之间的关系,而且对它们的诊断和治疗也有重要作用。

        细胞外基质(ECM)是一个复杂的网络,由细胞内合成的生物大分子和细胞外分泌的生物大分子组成,驻留在细胞表面或细胞之间。核心基质组包括250多个独特的基质基因,分为胶原蛋白、糖蛋白和蛋白多糖。癌症中的ECM重塑是肿瘤微环境(TME)的重要组成部分,也是恶性肿瘤发展的重要驱动力。ECM的沉积、重塑和交联与肿瘤的发展和预后密切相关。

二、材料与方法

1、数据来源

1) TCGA-HNSC基因表达RNA-Seq数据,包括count 和TPM数据,来自UCSC Xena,并与临床信息相关联(502个HNSCC肿瘤44个正常组织)

2) GEO:GSE27020(109个LSCC样本)、GSE42743(74个OSCC和29个正常样本)、GSE150321、GSE172577

3) 从Matrisome项目中获得了274个核心matrisome基因的列表;共选择了190个常见的核心基质基因,包括33个胶原蛋白、127个ECM糖蛋白和30个蛋白多糖编码基因

2、分析流程

流程图

三、实验结果

01 - 建立基于差异表达的matrisome基因的预后模型

        通过对TCGA-HNSC数据进行差异分析,在肿瘤和正常样本之间共发现1779个DEGs,包括939个上调基因和840个下调基因(图2A)。在GO BP分析中,这些DEGs大多富集于 "肌肉结构发育"、"超分子纤维组织"、"骨骼系统发育"、"纤毛运动"、"模式规范过程"和 "细胞外基质组织"(图2B)。在KEGG分析中,DEGs在 "蛋白质消化和吸收"、"唾液分泌"、"ECM-受体相互作用"、"钙信号通路"、"局灶粘附 "和"肥大性心肌病 "中富集。对TCGA-HNSC中的DEGs和190个共同的核心matrisome基因进行交叉分析,确定了52个差异表达的matrisome相关基因用于后续分析(图2C,D)。

图2 筛选DEGs

        为了建立HNSCC患者的预后评估模型,选择TCGA-HNSC数据集(仅有生存数据的肿瘤样本,N = 502)作为训练队列,GSE27020(LSCC样本,N = 109)和GSE42743(OSCC样本,N = 74)数据集作为测试队列。对52个差异表达的matrisome基因进行了单变量Cox回归分析,以评估训练队列中样本的OS。将P<0.1的12个基因(MATN3、LAMC2、FN1、SPP1、LAMB4、LAMB3、DMP1、IBSP、DMBT1、TGFBI、CHAD和MMRN1)列入LASSO分析。所有12个matrisome基因都达到了最小的部分表达量,并进一步将其表达水平和预后数据纳入多变量Cox回归分析,以确定参与特征构建的基因。多变量Cox回归分析建立了一个由六个基因(FN1、LAMB4、LAMB3、DMP1、CHAD和MMRN1)组成的风险的预后模型。风险分数的计算公式如下:风险分数=0.075123 × FN1 + (-0.348,219) × LAMB4 + 0.090359 × LAMB3 + 0.363,187 × DMP1 + (-0.314,325) × CHAD + (-0.125,206) × MMRN1。

        根据风险评分,训练和测试队列的样本基于50%的截止值被分为两组,即高风险组和低风险组,(图3A-O)。KM分析显示,无论是在训练队列(TCGA-HNSC)还是测试队列(GSE27020和GSE42743)中,高风险评分的患者的生存时间都明显短于低风险组(图3A,F,K)。此外,1年、2年和5年生存率的ROC曲线的曲线下面积(AUC)值分别为0.636、0.635和0.571,表明风险评分可用于预测训练队列(TCGA-HNSC)的预后(图3B)。在测试队列中,1、2、5年生存率的AUC值在GSE27020(图3G)和GSE42743(图3L)中分别为0.724、0.691和0.650。此外,所有六个基因(FN1、LAMB4、LAMB3、DMP1、CHAD和MMRN1)在训练(TCGA-HNSC)和测试队列(GSE27020和GSE42743)中都与预后不良和不健康的生活习惯显著相关(图3E,J,O)。因此,建立并验证了HNSCC的基质相关预后模型。

图3 关键基因的预后分析

02 - 高风险组和低风险组之间的肿瘤浸润免疫细胞图谱比较

        作者使用ssGSEA,根据TCGA-HNSC的临床数据和每个样本的风险评分,绘制了23种浸润性免疫细胞类型的热图(图4A),进行了肿瘤浸润性免疫细胞之间的相关性分析。如图4B所示,激活的CD8 T细胞和中性粒细胞之间有最高的明显正相关,而最高的明显负相关是CD56 bright自然杀伤细胞和单核细胞之间。不同风险组之间肿瘤浸润免疫细胞丰度的对比分析显示,高风险组中活化和未成熟的B细胞、嗜酸细胞、巨噬细胞、单核细胞、中性粒细胞和Th2细胞的存在明显减少(图4C)。最后,分析了23种浸润性免疫细胞类型与风险评分之间的相关性。结果显示,Th17细胞是唯一与风险评分明显正相关的细胞类型,而风险评分与未成熟B细胞、单核细胞、巨噬细胞、嗜酸性粒细胞、活化B细胞、Th2细胞、γ-δT细胞、MDSCs和中性粒细胞呈明显负相关(图4D)。总之,结果显示7种细胞类型(活化的B细胞、嗜酸细胞、未成熟的B细胞、巨噬细胞、单核细胞、中性粒细胞和Th2细胞)可能在基质相关的HNSCC微环境中发挥重要作用。

图4 肿瘤浸润性免疫细胞景观估计

03 - 不同风险组的体细胞突变情况

        此外,TCGA-HNSC患者的体细胞突变谱被用来探索高、低风险组的常见体细胞突变。在这些患者中,239人属于高危组,215人属于低危组。与低风险组相比,高风险组的基因突变频率普遍较高。高危组或低危组的突变情况变化如下:在高危评分的组织中,有8个基因突变率大于15%:TP53、TTN、FAT1、CDKN2A、MUC16、CSMD3、NOTCH1和LRP1B,而在低风险组的组织中,有8个基因突变率超过15%:TP53、TTN、FAT1、CDKN2A、MUC16、PIK3CA、CSMD3和SYNE1。值得注意的是,TP53是癌症中最常见的突变基因之一,在高风险组比低风险组出现的频率更高(图5A,B)。

图5 高风险和低风险HNSCC患者之间的突变谱和通路富集景观

04 - 预后基因分析

        进行GSVA以确定预后相关的KEGG通路。如热图所示,高危组在P53信号通路、甲状腺癌、结直肠癌、子宫内膜癌、前列腺癌、基底细胞癌和黑色素瘤KEGG通路中明显富集,而糖胺聚糖生物合成硫酸角蛋白、糖基磷脂GPI锚生物合成和叶酸生物合成KEGG通路在低危组明显富集(图5C)。因此,高危组的基因表达在肿瘤相关途径中明显富集。

利用HPA在线数据集,又通过IHC验证了这些预后基因的蛋白表达。与正常对照组相比,发现FN1、LAMB3和DMP1蛋白上调,而LAMB4、CHAD和MMRN1蛋白则下调(图6)。这些发现与使用TCGA数据集的结果一致。

图6 基于HPA的预后蛋白的免疫组化染色

05 - 预后基因的单细胞转录组学分析

        接下来,使用GSE150321和GSE172577数据集的单细胞RNA-Seq数据来进一步验证HNSCC的预后模型和基因之间的关系。对于GSE150321数据集,包括来自两个LSCC样本的数据,根据以前的文献,总共确定了5个细胞集群(肿瘤、免疫、上皮、间质和内皮细胞)(图7A),然后计算每个细胞的风险得分,并将其绘制在UMAP图和小提琴图中(图7B)。与非肿瘤细胞相比,LSCC肿瘤细胞的风险得分更高。

        对于GSE172577数据集,四个OSCC样本,GSM5258385、GSM5258386、GSM5258387和GSM5258388被合并。根据 "scCancer "R软件包,对细胞集群进行了手工注释(图7C,D)。值得注意的是,除了在GSE172577中CHAD的表达水平较低外,大多数预后基因的表达情况与LSCC相似(图7E)。总的来说,这些结果进一步支持了这个与matrisome相关的预后基因的特征影响了HNSCC的进展。

图7 基于单细胞测序分析的预后性表达谱

06 - LAMB4影响肿瘤细胞的增殖和迁移

        根据前面的分析结果,作者选择LAMB4作进一步分析,因为它是六个预后基因之一,在HNSCC方面的研究较少。在AMC-HN-8和JHU011细胞系中,使用LAMB4的siRNA来沉默LAMB4的表达(图8A)。CCK-8试验表明,沉默的LAMB4水平促进了AMC-HN-8和JHU011细胞的增殖(图8B)。还检测了LAMB4沉默后的迁移变化。转孔实验显示,LAMB4敲除后促进了LSCC和OSCC细胞系的迁移(图8C,D)。因此,作为一个潜在的肿瘤抑制基因,沉默LAMB4促进了HNSCC细胞系的增殖和迁移。

图8 在HNSCC细胞系中沉默LAMB4可促进细胞增殖和迁移

四、结论

        综上所述,作者揭示了matrisome相关基因的表达与HNSCC的生存有关,并建立了一个基于六个差异表达的matrisome相关基因(FN1、LAMB4、LAMB3、DMP1、CHAD和MMRN1)特征的新型风险评分预后模型,这些基因也可能作为HNSCC的潜在治疗目标。

你可能感兴趣的:(通过基质相关基因确定肿瘤预后标志物以改善早期诊断和预测病人预后)