TCGA下载RNA-seq数据、合并成表达矩阵

记录一下步骤~

1、先进入GDC官网

GDCicon-default.png?t=M4ADhttps://portal.gdc.cancer.gov/2、进入官网后是这样的:点击Repository

3、点进去之后是下面的第一张图片这样的。(但得先确定自己的Cart里面是空的,这里我之前添加了542个文件,所以cart那里有个542,所以我需要进行清除)

清除Cart里的文件:点击cart,点进去之后是下面这样的:

 然后点击红色的Remove From Cart,点击ALL Files。

TCGA下载RNA-seq数据、合并成表达矩阵_第1张图片

清除完之后返回到Repository页面,也就是下面这样的页面:

4、先点击Cases,选择你需要的一些选项。

以我自己下载TCGA的胃癌举例

Primary Site :选择你需要下载的癌症,所以这里我就选择了stomach

Program:选择了TCGA

Project:选择了TCGA-STAD

其他的默认了,可以根据你想要的选项进行选择

5、再点击Files

Date category:选择transcriptome profiling

Date Type:选择 Gene Expression Quantification

Experimental Strategy:选择RNA-seq

其他没选了

6、选完之后,点击Add ALL Files to Cart,这样就把我们需要的样本文件都添加到购物车啦。

 

7、点击Cart,进入到如下页面

下载3个文件:Metadata、Download里面的(Manifest和Cart)

 8、下载好之后,把这3个文件放在同一个文件夹里,然后使用两个脚本合并出表达矩阵(行是基因,列是样本)!!!

你可能感兴趣的:(TCGA,其他)