TCGA的maf文件开始控制下载了

TCGA的maf文件开始控制下载了

大家都知道maf文件记录着肿瘤患者的somatic突变情况,通常我们可以根据这个信息来在同一个肿瘤内部进行分组挖掘数据,比如:

如果你还不了解maf格式,请看:https://docs.gdc.cancer.gov/Data/File_Formats/MAF_Format/

非常久之前,整个TCGA数据库的全部数据都是提供下载的,包括fastq,bam,vcf, 但是呢,后来因为保护病人隐私,就只开放maf格式的somatic突变数据下载。

刚才我准备批量下载全部TCGA数据库的maf的时候,突然间发现,受限制了:

TCGA的maf文件开始控制下载了_第1张图片
image-20190312162742837

也就是说我很久以前写的一个教程应该是也失效了,这个没有办法,教程是有时效性的,所以才推荐大家关注生信技能树公众号获取最新资讯。

我仔细查看了其更新说明:https://docs.gdc.cancer.gov/Data/Release_Notes/Data_Release_Notes/

MAFs are not yet available for query or search in the GDC Data Portal or API.

You may download these files using the following manifests, which can be passed directly to the Data Transfer Tool. Links for the open-access TCGA MAFs are provided below for downloading individual files.

  • Open-access MAFs manifest
  • Controlled-access MAFs manifest

虽然官网装模作样的提供了一个公开版的maf下载,事实上我并没有下载成功,不知道为什么。

你可能感兴趣的:(TCGA的maf文件开始控制下载了)