如何下载TCGA拷贝数变异(CNV)数据

前面小编给大家详细介绍RNAseq数据,miRNA-seq数据的下载以及合并

☞新版TCGA数据库RNAseq数据下载
☞新版TCGA数据库miRNA数据下载
☞R代码合并新版TCGA数据库RNAseq表达谱数据
☞零代码合并新版TCGA数据库RNAseq表达谱数据
☞R代码TCGA差异表达分析
☞零代码TCGA差异表达分析

体细胞突变(somatic mutation)数据的下载以及合并成
☞【视频讲解】下载TCGA数据库中突变数据
☞ R代码合并TCGA体细胞突变数据
☞ 【R实战】使用maftools复现SCI文章中的体细胞突变瀑布图

甲基化数据的下载和甲基化水平矩阵的合并
☞ 如何从TCGA数据库下载DNA甲基化数据
☞ R代码合并TCGA数据库中DNA甲基化数据

今天小编给大家介绍一下如何从TCGA数据库下载拷贝数(copy number variation, CNV)数据。拷贝数变异是由基因组发生重排而导致的, 一般指长度为1 kb 以上的基因组大片段的拷贝数增加或者减少, 主要表现为亚显微水平的缺失和重复。CNV 是基因组结构变异(Structuralvariation, SV) 的重要组成部分。CNV位点的突变率远高于SNP(Single nucleotide polymorphism), 是人类疾病的重要致病因素之一。

我们还是以前面一直使用的TCGA-CHOL这套数据为例,来演示如何下载CNV数据。

  1. 首先打开TCGA网站,输入需要下载的肿瘤类型


2. 点击copy number variation后面的数字36


3. 点击左上角File


4. 选择copy number variation,Gene Level Copy Number然后Add all files to cart


5. 这36个文件就加入右上角的购物车里面了,点击一下这个购物车的标志


6. 下载sample sheet和Download下拉框里里面的Cart


得到两个文件gdc_sample_sheet.2022-10-15.tsv和gdc_download_20221015_132332.936251.tar.gz

7. 新建一个文件夹,名叫TCGA_CHOL_CNV在TCGA_CHOL_CNV下面再建一个文件夹叫CNV将gdc_sample_sheet.2022-10-15.tsv拷贝到TCGA_CHOL_CNV中,重命名为CNV_sample_sheet.tsv。将gdc_download_20221015_132332.936251.tar.gz拷贝到CNV中解压,TCGA_CHOL_CNV文件夹结果如下


TCGA_CHOL_CNV/CNV文件夹结构如下


更多关于TCGA数据库挖掘的文章参考

☞基于TCGA数据库的数据挖掘

下一期内容我们将跟大家分享如何使用R将各个样本的CNV数据合并起来。

你可能感兴趣的:(如何下载TCGA拷贝数变异(CNV)数据)