合并新版TCGA表达矩阵R代码叕更新了—RNA类型也给你提出来

TCGA数据库在2022年4月初进行更新之后,小编第一时间给大家展示了TCGA数据库的变化,用图文的方式详细介绍了新版TCGA数据库RNAseq数据下载方法。

☞ TCGA数据库悄咪咪更新了—RNAseq没有HTSeq-Counts了

怕大家不会下载,又给大家录了一期详细的视频讲解。小编也是为大家操碎了心。

☞新版TCGA数据库RNAseq数据下载

小编也针对新版TCGA数据库格式,为各位小伙伴提供了两种合并新版TCGA中RNAseq表达谱数据的方法

☞R代码合并新版TCGA数据库RNAseq表达谱数据

☞ 零代码合并新版TCGA数据库RNAseq表达谱数据

有小伙伴反馈,合并得到的矩阵里面只有ensembl gene ID,没有基因名字,不方便后续数据分析。

小编以迅雷不及掩耳之势就把R代码给更新了

☞ 合并新版TCGA表达矩阵R代码叒更新了—基因名字也给你提出来

会得到下面的矩阵。

当然如果你不想要基因名字也是可以的,将symbol设置成 F即可。

RNA_STAR_Counts=merge_TCGA(metadata=metaMatrix.RNA, 
                     path="RNAseq", 
                     data.type="RNAseq",
                     mRNA_expr_type="STAR",
                     symbol = F
                     )

昨天又有小伙伴反馈,能不能把RNA类型也提取出来。方便后续挑选mRNA或者lncRNA单独进行分析。今天小编就把代码给更新了。

在合并函数merge_TCGA中叕添加了一个参数RNA_type,来控制是否提取RNA类型。

RNA_STAR_Counts=merge_TCGA(metadata=metaMatrix.RNA, 
                     path="RNAseq", 
                     data.type="RNAseq",
                     mRNA_expr_type="STAR",
                     symbol = T, #T提取,F不提取
                     RNA_type=T  #T提取,F不提取
                     )

我们把所有的RNA类型都输出来看看,可以看到有lncRNA,还有protein_coding(mRNA)。我们可以从合并的完整的表达矩阵中根据type来挑选。

更新后的R代码+完整注释,下载地址参考☟☟☟

R代码合并新版TCGA数据库RNAseq表达谱数据

你可能感兴趣的:(合并新版TCGA表达矩阵R代码叕更新了—RNA类型也给你提出来)