4+机器学习+实验验证

今天给同学们分享一篇4+机器学习+实验验证的生信文章“Identification and Analysis of Neutrophil Extracellular Trap-Related Genes in Osteoarthritis by Bioinformatics and Experimental Verification”,这篇文章于2023年8月31日发表在 J Inflamm Res 期刊上,影响因子为4.5。

4+机器学习+实验验证_第1张图片

骨关节炎(OA)是一种常见的关节疾病,长期疼痛和功能障碍会对患者的生活质量产生负面影响。中性粒细胞胞外捕获物(NETs)由 DNA、蛋白质和细胞质组成,由中性粒细胞释放,在多种疾病中发挥重要作用。然而,OA 与 NET 之间的关系尚不清楚。


1. 识别 OA 患者的 DE-NRGs

将 GEO 数据库中收集到的四个 OA 相关数据进行合并,并校正批次效应,以减少后续分析中的误差。以P-adjust<0.05 and |logFC|>0.585作为Con组和OA组差异分析的筛选标准,最终得到133个下调差异表达基因和120个上调差异表达基因(DEGs)(图1A)。如热图所示,表达显著上调或下调的前 50 个基因被突出显示(图 1B)。通过将 255 个 DEGs 与 69 个 NRGs 相交,确定了 7 个与 OA 过程有关的 DE-NRGs(TLR7、CRISPLD2、SLC25A37、IL1B、IL6、MMP9 和 TLR8)(图 1C)。对NETs谱系相关通路(中性粒细胞通路、中性粒细胞脱颗粒和中性粒细胞颗粒成分)的GSVA算法分析表明,OA组的通路活性明显高于Con组(图1D)。

4+机器学习+实验验证_第2张图片

图1 OA 相关 DEGs 的鉴定


2.OA 患者免疫特征的差异

CIBERSORT 算法用于探究 OA 组和 Con 组之间免疫细胞浸润丰度的细节。OA 患者 CD4 记忆激活的 T 细胞、M0 巨噬细胞和静止的肥大细胞的丰度明显高于 Con 组。相比之下,血浆细胞、CD4 记忆静止的 T 细胞、单核细胞、活化的肥大细胞在 Con 组中的浸润比例更高(图 2A 和图 2B)。

4+机器学习+实验验证_第3张图片

图2 Con 组和 OA 组的免疫浸润情况比较


3.核心 DE-NRG 的鉴定以及与性状相关基因的相互作用分析

作者整合了 LASSO、SVM- RFE 和 RF 三种机器学习算法的结果,确定了 OA 过程中最关键的 DE-NRGs 。根据线性回归的结果,LASSO 确定了五个重要的 DE-NRG (图 3A 和图 3B)。)SVM- RFE 和 RF 的结果表明,这五个基因的排名最高。通过对这五个 DE-NRG 的相关性分析,作者发现 TLR7 和 MMP9 呈显著正相关,而 SLC25A37 CRISPLD2 和 IL1B 呈显著负相关 。接下来,作者利用 GeneMANIA 工具构建了与 DE-NRG 相关的 PPI 共表达网络,并进行了 KEGG/GO 富集分析 (KEGG 结果侧重于 MAPK 信号通路和细胞因子-细胞因子受体的相互作用。生物通路、分子功能结果涉及细胞因子介导的信号通路和细胞因子受体的结合。细胞成分的研究结果表明,含胶原蛋白的细胞外基质和分泌性颗粒腔可能参与其中。

4+机器学习+实验验证_第4张图片

图3 机器学习算法筛选关键 DE-NRG

4+机器学习+实验验证_第5张图片

图4  DE-NRGs 交互关系和相关性分析


4.与 NET 有关的示意图模式构建与验证

作者根据 5 种 DE-NRG(TLR7、CRISPLD2、SLC25A37、IL1B 和 MMP9)开发了一种与 NET 相关的 Nomogram 模型,为医生提供了一种简便可靠的诊断工具(图 5A)。校准曲线分析表明,DE-NRG 的 Nomogram 模型的准确性与实际阳性率非常相似(图 5B)。图 5E-I 中的 ROC 曲线也显示 CRISPLD2、SLC25A37、IL1B、MMP9 和 TLR7 的分类性能极佳,曲线下面积(AUC)值很高。最后,作者还验证了 CRISPLD2、SLC25A37、IL1B、MMP9 和 TLR7 在 GSE55235 中的表达情况,结果表明这 5 个 DE-NRG 也存在显著差异。

4+机器学习+实验验证_第6张图片

图5 构建与 DE-NRGs 相关的 Nomogram 以评估临床价值


5.预测 DE-NRGs 靶向药物

作者通过分析 DGIdb 数据库深入研究了能有效靶向 DE-NRGs 的潜在药物,并用 Cytoscape 软件将结果可视化(图 6)。遗憾的是,作者的分析没有预测到针对 CRISPLD2 的药物。作者最终发现了 34 种可能对 DE-NRG 产生潜在影响的药物,其中包括 4 种靶向 TLR7 的药物、1 种靶向 CRISPLD2 的药物、28 种靶向 IL1B 的药物和 1 种靶向 MMP9 的药物。研究结果表明,硫酸羟喹可用作 TLR7 的拮抗剂,而 IMIQUIMOD 可用作 TLR7 的激动剂。RILONACEPT 和 CANAKINUMAB 可用作 IL1B 的抑制剂。

4+机器学习+实验验证_第7张图片

图6 预测 DE-NRGs 靶向药物


6.ssGSEA 和 GSEA 探讨组建 NETs

为了确定中性粒细胞通路、中性粒细胞脱颗粒和中性粒细胞颗粒成分通路的活性是否存在显著差异,作者使用ssGSEA算法对GSE55235数据集进行了验证。结果显示,OA 组中性粒细胞通路、中性粒细胞脱颗粒和中性粒细胞颗粒成分通路的活性显著高于 Con 组(图 7A)。结果表明,TLR7 与中性粒细胞脱颗粒和中性粒细胞颗粒成分通路呈显著正相关。此外,MMP9 的上调可能会促进中性粒细胞通路、中性粒细胞脱颗粒和中性粒细胞颗粒成分通路的活性。CRISPLD2 和 IL1B 与中性粒细胞脱颗粒和中性粒细胞颗粒成分途径呈显著负相关。SLC25A37 仅与中性粒细胞成分途径呈负相关(图 7B)。随后,作者对 GSE55235 和 GSE55457 数据集中的 TLR7 进行了基因富集分析。结果显示,在 GSE55235 和 GSE55457 数据集中,TLR7 都富集在中性粒细胞胞外陷阱形成途径中(图 7C 和图 7D)。

4+机器学习+实验验证_第8张图片

图7 OA 与 NET 之间的相关性


7.通过 qPCR 和免疫荧光验证生物信息学结果

为了阐明 TLR7、CRISPLD2、SLC25A37、IL1B 和 MMP9 在 OA 中的作用,作者开始用 Safranin O-Fast Green 染色法验证人类 OA 样本和已建立的小鼠 OA 模型的真实性(图 8A-C)。这一步骤对于确保研究样本的可靠性至关重要。随后,对小鼠 OA 模型进行了胫骨内侧平台(MTP)和股骨内侧髁(MFC)评分,以进一步加强模型的有效性(图 8D 和图 8E)qPCR 结果显示,TLR7、CRISPLD2、IL1B 和 MMP9 的 mRNA 表达水平存在显著差异,与生物信息学分析结果一致。然而,只有在小鼠 OA 模型中才能观察到 SLC25A37 mRNA 表达量的差异。由于 SVM-RFE 算法和 RF 算法都表明 TLR7 是最关键的因素,作者随后重点分析了 TLR7。在 ATDC5 细胞实验中,TNF-α 刺激导致 TLR7、MMP9 和 IL6 的 mRNA 表达水平大幅上升,而 CRISPLD2、IL1B 和 SLC25A37 则明显下调。最后,作者通过免疫荧光检测发现,TLR7 在人类 OA 样本和小鼠 OA 样本中的表达均升高 。

4+机器学习+实验验证_第9张图片

图8 TLR7 的实验验证


总结

总之,作者的研究全面探讨了NETs过程与OA之间的关联,并最终确定了关键基因。接下来,作者将中心基因与免疫细胞、NETs形成和基因靶向药物结合起来进行了综合分析。最后发现,TLR7 有可能诱导 NETs 的形成,从而推动 OA 的进展。


你可能感兴趣的:(零知识证明)