RNA-seq(2)-2:下载数据

这节按生信技能树的要求进行数据下载,同时下载一组肝癌数据。
文章:AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors. Nat Commun 2016 Nov 8;7:13347. PMID: 27824034 很容易在文章里面找到数据地址GSE81916 这样就可以下载sra文件作业,看文章里的methods部分,把它用到的软件和参数摘抄下来,然后理解GEO/SRA数据库的数据存放形式,把规律和笔记发在论坛上面!


1.0 论坛作业数据下载

首先,按照这个方法可以去查找文章和数据。共下载7个文件,代码如下:
运行起来速度还是很好,平均5M/S.

cd /mnt/f/rna_seq/data
for ((i=56;i<=62;i++));do ascp -QT -v -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200m [email protected]:/sra/sra-instant/reads/ByRun/sra/SRR/SRR358/SRR35899${i}/SRR35899${i}.sra .;done
备注:下载总共大概6h。

1.00下载自己的数据

文章在https://sci-hub.tw/http://doi.org/10.1038/onc.2013.424
首先在https://www.ncbi.nlm.nih.gov/sra,输入liver cancer,下载个较小的肝癌数据。选定https://www.ncbi.nlm.nih.gov/sra?term=SRP007560
(这个过程我是反着来的,现在SRA找到合适的数据,然后再下载文章)
具体信息见这里和这里

需要下载的四个数据为SRR316212 -215
同样,代码为

for ((i=2;i<=5;i++));do ascp -QT -v -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200m [email protected]:/sra/sra-instant/reads/ByRun/sra/SRR/SRR316/SRR31621${i}/SRR31621${i}.sra .;done
-QT表示断点续传

你可能感兴趣的:(RNA-seq(2)-2:下载数据)