TCGA数据下载及处理

筛选数据,加入cart

从cart中下载需要的文件

image.png

红框中为需要下载的文件。
我选择了使用linux client和gdc_manifest.txt下载的方式。client可以从这里下载https://gdc.cancer.gov/access-data/gdc-data-transfer-tool到服务器上。

文件处理

从metadata.cart.2022-09-22.json文件可以得知文件与id的对应关系,从而得到entity_submitter_id,之后取前三节(-分割)。


metadata.cart.json

与clinical.cases_selection.2022-09-22/clinical.tsv文件中的case_submitter_id对应,可以提取临床信息,常见的比如age, stage等。


clinical.tsv

你可能感兴趣的:(TCGA数据下载及处理)