TCGA原始文件id转换

本文适用于下载受保护的数据的文件,从文件id转换为TCGA样本id
官网教程
Windows下的方法
bug解决
自行下载manifest文件,具体参照官网方法
在R中运行

options(stringsAsFactors=F)
setwd("~/Desktop/gdc/")
manifest= "gdc_manifest.2022-06-15.txt"#下载于TCGA官网
x=read.table(manifest,header = T) 
manifest_length= nrow(x) 
id= toString(sprintf('"%s"', x$id))

Part1= '{"filters":{"op":"in","content":{"field":"files.file_id","value":[ '


Part2= '] }},"format":"TSV","fields":"file_id,file_name,cases.submitter_id,cases.case_id,data_category,data_type,cases.samples.tumor_descriptor,cases.samples.tissue_type,cases.samples.sample_type,cases.samples.submitter_id,cases.samples.sample_id,cases.samples.portions.analytes.aliquots.aliquot_id,cases.samples.portions.analytes.aliquots.submitter_id","size":'

Part3= paste0("\"",manifest_length, "\"", "}") #这里其实跟官网是不一样的



Sentence= paste(Part1,id,Part2,Part3, collapse=" ")
write.table(Sentence,"Payload.txt",quote=F,col.names=F,row.names=F,sep="\t")


在terminal终端中输入,我这里是用conda管理的环境

source /Users/nhlbihelp/opt/anaconda3/etc/profile.d/conda.sh
conda activate /Users/jiangc4/Documents/conda/cj 
cd ~/Desktop/gdc/
curl --request POST --header "Content-Type: application/json" --data @Payload.txt "https://api.gdc.cancer.gov/files" > File_metadata.txt
gdc_manifest
File_metadata

你可能感兴趣的:(TCGA原始文件id转换)