点击关注,桓峰基因
桓峰基因
生物信息分析,SCI文章撰写及生物信息基础知识学习:R语言学习,perl基础编程,linux系统命令,Python遇见更好的你
86篇原创内容
公众号
这期分享21年12月发表在Molecular Therapy: Nucleic Acid杂志(IF:8.86)文章,本文研究m6A调控因子与m6A相关的RNA作为结直肠癌预后因子的综合性分析,该文章使用桓峰基因公众号里面的教程即可实现,有需要类似思路的老师可以联系我们!
摘 要
结直肠癌(Colorectal cancer, CRC)是最常见的恶性肿瘤之一,近年来已成为全球范围内癌症相关死亡的主要原因。N6-methyladenosine (m6A)甲基化是各类rna中最丰富的表观遗传修饰,在促进癌症发展中起着至关重要的作用。本研究中,我们从癌症基因组图谱(TCGA)中获得了CRC的SNV和转录组数据。我们发现大多数m6A甲基化调控因子在CRC患者中异常表达。m6A调控因子的异常表达是由其不同的拷贝数变异(拷贝数变异,CNV)模式引起的,m6A调控因子的改变与预后及肿瘤分期显著相关。通过加权共表达网络分析(WGCNA),我们识别了m6a相关的长链非编码RNA (lncRNAs)和mRNA;然后我们使用最小绝对收缩和选择算子(LASSO) Cox回归分析构建TCGA数据集中m6A相关的lncRNA和mRNA预后特征。建立具有临床病理特征、lncRNA风险评分和mRNA风险评分的Nomogram生存风险预测图,对CRC患者在训练集和测试集的总体生存预测能力较强。综上所述,m6A甲基化调控因子在影响CRC患者的预后中发挥着至关重要的作用,而m6A相关的lncRNA和mRNA揭示了CRC肿瘤发生和进展的潜在机制。
生信分析流程
我们从文章中提取生信分析流程,文章算是利用多组学的思路来分析结直肠癌预后,m6A调控因子的表达和CNV在结合lncRNAs和mRNA的数据综合性分析,看下文章中使用的数据集和生信分析方法,如下:
相关数据准备
数据集选择:TCGA-CRC 包括618例患者的FPKM和CNV数据,包括582 primary tumor tissues and 36 normal tissues;
训练集和测试集:a training set (n = 393) and a testing set (n = 189)
基因集选择:19个m6A调控因子,14176 lncRNAs and 19645 mRNAs
我们从文章的分析流程中提取所有的分析内容,整理出来就12个分析条目,构成了整个文章,临床大样本量+生信文章,发了8+,点击分析条码就会跳转到对应公众号的教程,跟着教程做,您也能发8+,如下:
1. CRC中m6A RNA甲基化调控因子的概况(heatmap)
2. CRC中m6A RNA甲基化调控因子与临床特征的关系(K-M)
3. CRC原发与正常样本的差异基因分析(limma)
4. CRC原发与正常样本的lncRNAs和mRNAs的差异分析(edgeR)
5. m6A RNA甲基化调控因子表达与临床病理特征和生成之间的关系
6. WGCNA检测m6A相关的lncRNA和mRNA
7. 构建Lasso Cox 回归进一步筛选m6A相关的lncRNA和mRNA
8. m6A相关lncRNA和mRNA的Cox风险模型的构建
9. 单/多因素Cox回归分析筛选独立的预后因素
10. 基于m6A相关lncRNA和mRNA预后模型的Nomogram构建
11. 临床预测模型的校验曲线(Calibration curve)
12. 临床预测模型的决策曲线(DCA)
13. 临床预测模型准确性(ROC)
研究结果
1. CRC中m6A RNA甲基化调控因子的概况(heatmap)
文章对整体进行了终结,如热图和调控因子之间的相关性,如下:
3. CRC原发与正常样本的差异基因分析(limma)
4. CRC原发与正常样本的lncRNAs和mRNAs的差异分析(edgeR)
6. WGCNA检测m6A相关的lncRNA和mRNA
7. 构建Lasso Cox 回归进一步筛选m6A相关的lncRNA和mRNA
8. m6A相关lncRNA和mRNA的Cox风险模型的构建
分别构建lncRNA和mRNA的Cox风险预后模型,并计算ROC以及RiskScore的高低分组与生存之间的关系,如下:
9. 单/多因素Cox回归分析筛选独立的预后因素
通过结合临床特征和两个预后RiskScore值进行单因素分析,再次进行多因素分析,而P-value<0.2的即可作为结直肠癌的临床预后独立因子,如下图的Age, Gender, Tumor stage,T stage 和两个RiskScore值,如下:
10. 基于m6A相关lncRNA和mRNA预后模型的Nomogram构建
基因多因素选择的独立预后因子构建Cox风险比例回归模型,并绘制列线表,如下:
11. 临床预测模型的校验曲线(Calibration curve)
通过构建的列线表可以获得每个患者的预后打分值,和风险比例,进一步绘制校验曲线,如下:
12. 临床预测模型的决策曲线(DCA)
评估临床预测模型的决策曲线DCA (Decision Curve Analysis) ,如下:
13. 临床预测模型准确性(ROC)
计算临床预测模型的准确性,如下:
References:
1. Li W, Gao Y, Jin X, et al. Comprehensive analysis of N6-methylandenosine regulators and m6A-related RNAs as prognosis factors in colorectal cancer. Mol Ther Nucleic Acids. 2021;27:598-610. Published 2021 Dec 14. doi:10.1016/j.omtn.2021.12.007