黄韧带肥大(LFH)是导致椎管狭窄的常见原因。本研究的目的是鉴定LFH中的差异表达基因(DEGs),以及LFH发展和免疫反应的分子机制。基因表达综合数据库(GEO)用于获得GSE113212数据集,DEG来源于微阵列数据。为了确定关键基因和信号通路,进行了基因本体论富集、京都基因和基因组百科全书(KEGG)富集和蛋白质-蛋白质相互作用(PPI)网络分析,然后使用检索到的数据集进行免疫细胞浸润和Friends分析。
1. 数据规范化
图1显示了研究设计和数据处理的流程图。为了研究两个研究组(老年LFH组织和年轻正常LF组织)中基因表达的变异性,首先对基因表达水平进行了标准化。然后在两组的基因表达值中观察到可比较的分布(图2A、B)。
图1 研究设计的流程图
图2 数据规范化
2. 免疫细胞浸润分析
作者在表达谱数据中使用了CIBERSORT算法来计算老年LFH和年轻正常LF组中22种免疫细胞类型的浸润程度。GSE113212数据集中两种免疫细胞类型,即记忆激活的CD4 T细胞和B细胞的比例显示,LFH组和正常LF组之间存在显著差异(Wilcoxon检验,p<0.05)(图3A)。LFH组中记忆激活的CD4 T细胞和幼稚B细胞的浸润显著低于正常LF组,这表明这两种类型的免疫细胞在LFH过程中起着关键作用。其余20种免疫细胞类型的比例在两组之间没有显著差异。记忆激活的CD4 T细胞与幼稚的B细胞(图3B)、M1巨噬细胞和CD8 T细胞显示出显著的正相关(p<0.05)。不同样本中免疫细胞类型的相对比例如图3C所示。
图3 免疫细胞浸润分析
3. 差异表达基因
为了评估GSE113212中数据的再现性,进行了主成分分析(图4A)。为了分析LFH组(老年组)相对于对照组(LF组织正常的年轻组)的基因表达值,并获得DEG,作者使用limma R软件包。在GSE113212数据集中获得的1530个已鉴定DEG的火山图显示,971个DEG上调,559个下调(图4B)。热图是通过对DEG进行聚类绘制的(图4C),显示这些DEG可以清楚地区分LFH和正常组织。
图4 差异表达基因
从ImmPort数据库下载的1793个免疫相关基因列表与已识别的DEG取交集,以获得LFH的免疫相关DEG,如图4D所示的韦恩图所示。
4. 差异表达基因的功能富集分析
为了分析与LFH相关的DEG与GO类别BP、CC和MF之间的关系,作者首先对这些DEG进行了功能富集分析(图4E)。白细胞活化、T细胞活化的正调节、白细胞趋化性、BP中趋化因子产生的正调节,溶酶体膜、MHC蛋白复合物、免疫突触、溶酶体腔和CC中免疫受体活性,以及MF中整合素结合、内肽酶活性和细胞因子活性得到富集。
此外,通路富集分析表明,DEG在ECM受体相互作用、蛋白质消化和吸收、细胞因子-细胞因子-受体相互作用,PI3K-Akt信号通路和Th17细胞分化等生物学通路中富集。最显著富集的途径是ECM受体相互作用(hsa04512,图5A)和免疫相关途径Th17细胞分化(hsa04659,图5B)。
图5 富集KEGG途径的可视化
5. 基因集富集分析和基因集变异分析
作者确定了LFH和正常组织数据集中哪些生物途径受基因表达水平差异的影响最大。在GSE113212数据集中,受影响最大的反应体途径是白细胞介素的信号传导、天冬酰胺连接的糖基化、淋巴细胞和非淋巴细胞之间的免疫调节相互作用;受影响最大的KEGG途径是产生IgA的肠道免疫网络和参与败血症免疫反应的微小RNA,以及其他生物学相关途径(图6A–E)。因此,在LFH组织中,一些免疫相关的信号通路被富集,这表明免疫因子可能在这种疾病的发展中发挥重要作用。
图6 GSEA和GSVA
为确定LFH组和正常LF组中生物途径的富集而进行的GSVA显示,在疾病组中,反应体途径和其他生物相关途径受影响最大:CREB3因子激活基因,仅BH3蛋白与抗凋亡BCL2成员相关并失活,N-乙酰基成员的合成,乙酰葡糖胺的合成,有缺陷的ST3GAL3导致MCT12和EIEE15(图6F)。在正常LF组中,反应体途径POLB依赖性长贴片基底切除修复主要受到影响(图6F),以及其他相关途径。
6. 蛋白质-蛋白质相互作用网络
作者构建了一个与黄韧带肥大免疫相关的差异表达基因的蛋白质-蛋白质相互作用网络(图7A)。共发现144个与LFH相关的免疫相关DEG和877个PPI对。与其他LFH免疫相关DEG相互作用最多的前五种DEG是肿瘤坏死因子(TNF;74种相互作用)、IL6(73种相互作用。用于对PPI网络进行聚类的MCODE插件揭示了两个关键模块(图7C、D),并使用模块1中的27个基因(得分>10)作为与LFH免疫相关的关键DEG。
图7 PPI网络
7. Friends分析
与LFH免疫相关的关键基因在老年LFH组和年轻正常LF组之间差异表达(图8A)。脑源性神经营养因子(BDNF)、集落刺激因子3(CSF3)和LEP基因的ROC曲线的AUC值大于0.8,表明这三个基因有可能区分LFH组和正常LF组(图8B)。对与LFH免疫相关的关键DEG进行的Friends分析显示,TNF超家族成员11(TNFSF11)与其他DEG的相关性最强,因此可能在LFH免疫中发挥关键作用(图9)。
图8 关键基因分析
图9 Friends分析
8. 免疫浸润相关性分析
与LFH免疫和免疫细胞浸润相关的关键DEG之间的相关性揭示了几个显著的相关性(图10)。例如,分化簇86(CD86)和中央记忆CD8 T细胞与调节性T细胞之间存在显著的负相关,CSF1R和酪氨酸激酶结合蛋白(TYROBP)基因与调节性T细胞之间存在明显的正相关。
图10 免疫细胞渗滤相关性分析
9. 定量逆转录聚合酶链式反应和免疫组织化学评估生物信息学结果的验证
使用qRT-PCR获得的IL-6、IL-10、LEP和TNF-α的mRNA水平在LFH组织中显著高于正常LF组织,其中LEP表现出最显著的差异表达。然而,两组之间EGFR mRNA表达没有显著差异(图11)。作者还在组织病理学中证实了上述结果(图12)。总之,这些结果证实了生物信息学结果的可靠性。
图11 mRNA的相对表达水平
图12
总结
总之,通过对GSE113212 LFH数据集的全面生物信息学研究,确定了LFH的DEG和关键分子途径,并通过qRT-PCR和IHC在体外人类LFH组织中较高的IL-6、IL-10、LEP和TNF-α表达水平证实了这一点。与LFH相关的DEG在细胞因子活性相关和PI3K-Akt信号通路中特别丰富。这一关于LFH分子机制的新信息可能有助于开发新的治疗靶点和方法。