8+容易拿分的思路,共病+WGCNA+机器学习


今天给同学们分享一篇非肿瘤+WGCNA+机器学习的生信文章“Identification of immune-associated genes in diagnosing osteoarthritis with metabolic syndrome by integrated bioinformatics analysis and machine learning”,这篇文章于2023年4月17日发表在Front Immunol期刊上,影响因子为8.786。
8+容易拿分的思路,共病+WGCNA+机器学习_第1张图片

在骨关节炎(OA)和代谢综合征(MetS)的发病机制中,免疫系统扮演着特别重要的角色。本研究的目的是在同时患有代谢综合征的骨关节炎患者中寻找关键的诊断候选基因。

8+容易拿分的思路,共病+WGCNA+机器学习_第2张图片

图1  流程图


1. 差异表达基因

经过 LIMMA 分析,综合 OA 数据集共得出 2263 个 DEGs,其中上调基因 1341 个,下调基因 922 个。图 2A 和 B 显示了根据上述数据生成的热图和火山图。此外,MetS 数据集产生了 1449 个 DEGs,包括 605 个上调基因和 844 个下调基因(图 3A、B)。

8+容易拿分的思路,共病+WGCNA+机器学习_第3张图片

图2 从综合 OA 数据集中发现的 DEGs 的热图和火山图

8+容易拿分的思路,共病+WGCNA+机器学习_第4张图片

图3 通过 Limma 识别 DEGs,通过 WGCNA 识别 MetS 中的模块基因


2. 关键模块的选择

在 MetS 中,使用 WGCNA 过滤关键模块。当软阈值=14 时,无标度网络表现最佳(图 3C、D)。图 3E 描述了两组的聚类树图和随机得到的 10 个彩色基因模块(图 3F、G)。黄色模块(691 个基因)与 MetS 的相关性最高(图 3H),可在接下来的分析中用作关键模块。图 3I 显示了黄色模块中基因的相关性分析结果,显示出正相关性(r=0.62)。


3. 代谢综合征的功能富集分析

通过对 1449 个 DEGs 和 691 个模块化基因的交叉分析,共得出 108 个基因(图 4A)。KEG 分析主要富集了 "PI3K-Akt 信号通路 "和 "甘油磷脂代谢"(图 4B)。根据 GO 分析,生物过程(BP)术语主要富集在 "参与免疫反应的 B 细胞活化 "和 "细胞对 DNA 损伤刺激的反应 "中(图 4C)。在细胞组分(CC)本体方面,它主要存在于 "细胞膜"、"核腔 "和 "囊泡 "中(图 4D)。在分子功能(MF)分析中,它主要富集在 "分子功能调节器"、"酶调节器活性 "和 "信号受体结合 "中(图 4E)。

8+容易拿分的思路,共病+WGCNA+机器学习_第5张图片

图4 MetS 基因交集的富集分析


4. 骨关节炎与代谢综合征的富集分析

为了进一步探讨MetS相关的关键基因是否可能与OA的发病机制有关,研究人员从OA DEGs和MetS关键模块基因的交叉点中通过Venn图确定了82个基因(图5A)。根据KEGG分析,82个基因主要富集在 "炎症介质调节TRP通道"、"细胞衰老 "和 "MAPK信号通路 "中,这些基因都与免疫系统密切相关(图5B)。GO 分析显示,这些基因主要富集在 "免疫反应"、"细胞死亡 "和 "免疫系统过程"(BP);"内质网膜的组成部分"、"立体纤毛膜 "和 "免疫突触"(CC);以及 "催化活性"、"ATP 结合 "和 "序列特异性 DNA 结合"(MF)(图 5C-E )。

8+容易拿分的思路,共病+WGCNA+机器学习_第6张图片

图5 OA 与 MetS 共同基因的富集分析


5. 利用机器学习筛选关键基因

利用Lasso回归和射频算法识别关键基因,并创建相关的提名图进行 ROC 分析。Lasso 回归筛选出 10 个候选基因(图 6A、B),RF 算法识别出 30 个最重要的基因(图 6C、D),两者相交(图 6E),最终确定了 8 个基因(FZD7、IRAK3、KDELR3、PHC2、RHOB、RNF170、SOX13 和 ZKSCAN4)。

8+容易拿分的思路,共病+WGCNA+机器学习_第7张图片

图6 机器学习在筛选 MetS 性 OA 候选诊断生物标志物中的应用


6. 确定诊断值

作者根据八个候选基因绘制了提名图(图 7A)和 ROC 曲线,以评估每个基因的诊断价值。计算得出的AUC和95%置信区间如下:FZD7(AUC 0.86,CI 0.96-0.76)、IRAK3(AUC 0.92,CI 0.99-0.84)、KDELR3(AUC 0.94,CI 1.00-0.87)、PHC2(AUC 0.89,CI 0.99-0.80)、RHOB(AUC 0.96,CI 1.00-0.90)、RNF170(AUC 0.82,CI 0.94-0.70)、SOX13(AUC 0.83,CI 0.94-0.72)、ZKSCAN4(AUC 0.90,CI 0.99-0.81)(图 7B-I)。研究结果表明,获得性基因对合并 MetS 的 OA 诊断具有很高的价值。

8+容易拿分的思路,共病+WGCNA+机器学习_第8张图片

图7 Nogrim comtraction 和诊断价值评估


7. 免疫浸润分析

作者发现,与 MetS 相关的基因也能在 OA 中发挥作用,主要是在免疫调节方面。对提名图和 ROC 的深入研究表明,它们可用作诊断 OA 的潜在生物标志物,这一点已通过免疫浸润得到证实。


每个样本中 22 个免疫细胞的百分比显示在两个数据集的柱状图中(图 8A)。伏安图显示,OA 患者的 B 细胞记忆、巨噬细胞 M0、树突状细胞活化、肥大细胞静息和嗜酸性粒细胞水平较高,而 T 细胞 CD4 记忆静息、巨噬细胞 M2、肥大细胞活化和中性粒细胞水平较低(图 8B)。对 22 种免疫细胞类型的相关性分析表明,NK 细胞静息与中性粒细胞呈正相关(r=0.62),T 细胞 CD4 幼稚与 T 细胞 CD4 记忆激活呈正相关(r=0.52),肥大细胞激活与肥大细胞静息呈负相关(r=-0.67),巨噬细胞 M2 与 T 细胞 gamma delta 呈负相关(r=-0.52)(图 8C)。总之,OA 患者有不同程度的多种免疫细胞浸润,这可能是治疗 OA 的潜在调节点。

8+容易拿分的思路,共病+WGCNA+机器学习_第9张图片

图8 OA 与对照组的免疫细胞浸润分析


总结

基于生物信息学分析和机器学习,作者系统地发现了8个相关候选基因(FZD7、IRAK3、KDELR3、PHC2、RHOB、RNF170、SOX13和ZKSCAN4),并为OA合并MetS的诊断提供了模板。作者还注意到,MetS合并OA患者的免疫系统失去平衡,免疫细胞的比例会受到免疫微环境的影响,筛选出的基因可用于临床诊断和治疗。

你可能感兴趣的:(零知识证明)