TCGA数据库中miRNA数据如何平稳下载 ?

之前,我们讲过TCGA的miRNA数据如何区分5p和3p,然而我们手上并没有数据,所以,这次讲如何获取数据。
TCGA数据的下载都差不多,有通用的方法。
我们以前讲过转录组数据的下载。
从GDC下载TCGA肿瘤数据库的数据

TCGA数据库中miRNA数据如何平稳下载 ?_第1张图片

点击GDC进入,


TCGA数据库中miRNA数据如何平稳下载 ?_第2张图片

选择Repository,cases,选择要研究的种属和样本


TCGA数据库中miRNA数据如何平稳下载 ?_第3张图片

再点开files,选择需要的数据,我们这次是转录组里面的miRNA数据,转录组的数据下载看这个
从GDC下载TCGA肿瘤数据库的数据
选择完了之后,发送到购物车

TCGA数据库中miRNA数据如何平稳下载 ?_第4张图片

进入购物车


TCGA数据库中miRNA数据如何平稳下载 ?_第5张图片

下载manefest文件,用来下载需要的数据


TCGA数据库中miRNA数据如何平稳下载 ?_第6张图片

除此之外,还要下载metadata文件,用于把样本名称转化为TCGA_id


TCGA数据库中miRNA数据如何平稳下载 ?_第7张图片

下载gdc-tools,这是官方的下载工具。


TCGA数据库中miRNA数据如何平稳下载 ?_第8张图片

选择自己系统对应的链接,下载,然后解压


TCGA数据库中miRNA数据如何平稳下载 ?_第9张图片

把manefest文件和gdc-tools放在同一个文件夹,在文件夹中创建一个新文件夹叫,rawdata,用于放下载的数据。

windows用户可以下载一个git for windows安装一下,mac用户用自带终端即可
https://git-scm.com/download/win

在有manefest文件的文件夹,右击,打开git bash,mac用户进入终端,cd到当前文件夹。


TCGA数据库中miRNA数据如何平稳下载 ?_第10张图片

输入以下代码,即可把数据下载到rawdata文件夹中

./gdc-client.exe download -m ./gdc_manifest_20190814_132348.txt -d rawdata/

其中 gdc_manifest_20190814_132348.txt这个根据每次操作会不一样。

命令行,代表用当前文件夹下面的gdc-client.exe软件中的 download功能,使用manifest的方式下载文件,存入rawdata文件夹。

### ./gdc-client.exe -h 这个命令可以查看gdc-client.exe的使用方法
### ./gdc-client.exe download -h 这个命令可以查看download的使用方法
### 理解参数
### -m 参数 表示用manifest来下载
### -d 参数 表示下载到指定的文件夹

然后数据就开始下载,不要关闭终端,下载完全之后有提示,现在文件已经在rawdata文件夹了

TCGA数据库中miRNA数据如何平稳下载 ?_第11张图片

打开单个文件夹,是个txt文件,里面有需要的数据
TCGA数据库中miRNA数据如何平稳下载 ?_第12张图片

下一次我们就要把这1207个文件批量读入R语言,会非常有趣。
在这个系列结束后,我会录制一个视频,公布在 果子学生信公众号上。
还有一件事情,上次说的499元基因检测试剂盒的抽奖,明天公布。
一张神图,解决科研统计80%的问题。
Y叔的检测结果已经出来了,他喝酒不上头,抽烟也不伤肺,是难得的交际身体。但是,线下看起来鹤发童颜,慈眉善目,一点都看不出来。

我是果子,明天见。

你可能感兴趣的:(TCGA数据库中miRNA数据如何平稳下载 ?)