sra数据下载

sra数据下载

      • 1. SRA Tookit
      • 2. aspera结合SRA Tookit
      • 3. 迅雷
      • 4. wget
      • 5.NCBI-sra数据链接汇总
      • 6. EBI数据下载

1. SRA Tookit

cat srr.txt | while read id; do (prefetch  ${id} );done

注: srr.txt储存sra检索号名字

2. aspera结合SRA Tookit

prefetch -t ascp -a ".aspera/connect/etc/asperaweb_id_dsa.openssh" --option-file srr.txt -O 输出目录

-a 必须要用绝对路径写上ascp所在的位置和previte KEY 的位置,否则下载速度会变慢

3. 迅雷

链接: ftp://ftp-trace.ncbi.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR检索号前3位/SRR检索号/SRR检索号.sra

例子: ftp://ftp-trace.ncbi.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR563/SRR5631562/SRR5631562.sra

4. wget

  • 获取链接
    sra数据下载_第1张图片
    sra数据下载_第2张图片
  • 下载
wget https://sra-download.ncbi.nlm.nih.gov/traces/sra60/SRR/006632/SRR6791470  

注:
1)如果网速不好下载数据不完整
2)也可以使用curl URL -o 输出目录 --progress来进行下载

5.NCBI-sra数据链接汇总

SRP(Studies)—>SRX(Experiments)—>SRS(Samples)—>SRR(Runs)

Studies: 一个特定目的的研究课题,包含了项目的所有 metadata,一个study 可能包含多个Experiment
Experiments: 实验,包含了Sample、DNA source、测序平台、数据处理等信息。一个Experiment可能包含一个或多个runs
Runs: 表示测序仪运行所产生的reads
Sample: 样品信息,包括物种信息、菌株(品系) 信息、家系信息、表型数据、临床数据,组织类型等

  • GSExxx
    链接:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE
    例子:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE111229
    sra数据下载_第3张图片

  • SRP/SRA/SAMNxxx
    链接:https://www.ncbi.nlm.nih.gov/sra?term=SRP/A
    例子:https://www.ncbi.nlm.nih.gov/sra?term=SRP133642
    sra数据下载_第4张图片
    例子:https://www.ncbi.nlm.nih.gov/sra?term=SAMN08619912
    sra数据下载_第5张图片
    SRP其他链接:https://www.ncbi.nlm.nih.gov/Traces/study/?acc=SRP078156&o=acc_s%3Aa
    sra数据下载_第6张图片

  • SRXxxx
    链接:https://www.ncbi.nlm.nih.gov/sra/SRX
    例子:https://www.ncbi.nlm.nih.gov/sra/SRX3749902

sra数据下载_第7张图片

  • PRJNAxxx
    链接:https://www.ncbi.nlm.nih.gov/bioproject/PRJNA
    例子:https://www.ncbi.nlm.nih.gov/bioproject/PRJNA436229
    sra数据下载_第8张图片
  • SRRxxx
    链接:https://trace.ncbi.nlm.nih.gov/Traces/sra/?run=SRR
    例子:https://trace.ncbi.nlm.nih.gov/Traces/sra/?run=SRR6790711
    sra数据下载_第9张图片

6. EBI数据下载

ENA数据库:隶属EBI ,功能等同SRA,对保存的数据做了注释,界面相对于SRA更友好,可以直接下载fastq 文件

  • 参考链接:
    https://www.jianshu.com/p/cf0a7b937413
    https://mp.weixin.qq.com/s/8xWl_DAYhFnLjdlg5ZcdIw

  • 下载方法
    1)搜索ENA主页
    2)在view搜索栏输入SRR号,如SRR1805951并点击搜索
    sra数据下载_第10张图片
    3)在show selected columns选择希望显示的列,然后下载报告
    sra数据下载_第11张图片
    4)文件里含有fastq和sra数据的链接
    在这里插入图片描述
    fastq
    链接:ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR前3位/00最后1位/SRR号/SRR号_1或者2.fastq.gz
    例子:ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR180/001/SRR1805951/SRR1805951_1.fastq.gz
    sra
    链接:ftp://ftp.sra.ebi.ac.uk/vol1/srr/SRR前3位/00最后1位/SRR号
    例子:ftp://ftp.sra.ebi.ac.uk/vol1/srr/SRR180/001/SRR1805951
    5)aspera下载

for i in {29..64} #i为SRR最后两位
do
a0='/路径/.aspera/connect/bin/' #aspera路径
a1='ascp -QT -l 300m -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh [email protected]:/vol1/fastq/SRR前3位/00' #下载命令
a2=$(($i % 10))
a3='/SRR前5位'$i
a4='_1.fastq.gz .' #fastq后缀,.代表当前目录
a5='_2.fastq.gz .'
echo $a0$a1$a2$a3$a3$a4
echo $a0$a1$a2$a3$a3$a5
done >> ascp.command
#执行
nohup bash ascp.command &

你可能感兴趣的:(数据下载,sra数据下载)