转录组实战之SRA数据下载(上) 2019-05-07

数据下载两种方式

  • 打开链接,下载id :https://www.ncbi.nlm.nih.gov//geo/query/acc.cgi?acc=GSE52778
微信图片_20190507093416.png
微信图片_20190507093422.png
微信图片_20190507093428.png

即可下载id号

  • 利用perfetch id号下载数据
    首先记住命令:
cat id |while read id ;do echo $id;done
cat id |while read id ;do prefetch $id ;done
#就可以下载id号对应的数据,&+()表示后台运行
nohup prefetch  SRR1039511 -O ~ &
[1] 6948
(rna) vip77 16:34:09 ~/rna-seq
$ nohup: ignoring input and appending output to 'nohup.out' 

# 输入一个nohup prefetch  SRR1039511 -O ~ &命令后就会有这种显示,按enter 键会出现
[1]+  Exit 3                  nohup prefetch SRR1039511 -O ~
ls 
id  nohup.out  #会多出nohup.out 文件,可以查看命令运行状况
ps -ef |grep prefe #可以看见输入命令在后台运行
ps -ef |grep prefe| kill  9524 # kill后面接的是第二列数字(即为任务id),可以杀死相应进程

杀死后台运行的命令:

cat id |while read id;do prefetch  $id -O ~ 1>$id.download.log 2>&1;done
ps -ef | grep "命令"
ps -ef |grep prefe|awk '{print $2}'|while read id ;do kill $id;done   #可以杀死

Q1:

nohup prefetch  SRR1039511  &
cat nohup.out 
Read 22852619 spots for /teach/project/1.rna/1.sra_data/SRR1039510.sra
Written 22852619 spots for /teach/project/1.rna/1.sra_data/SRR1039510.sra

2019-05-07T09:51:27 prefetch.2.9.1: 1) Downloading 'SRR1039511'...
2019-05-07T09:51:27 prefetch.2.9.1:  Downloading via fasp...
2019-05-07T09:52:22 prefetch.2.9.1:  fasp download failed
2019-05-07T09:52:22 prefetch.2.9.1: 1) failed to download SRR1039511

2019-05-07T10:52:52 prefetch.2.9.1: 1) Downloading 'SRR1039511'...
2019-05-07T10:52:52 prefetch.2.9.1:  Downloading via fasp...

一直在报错 妈呀

cp /teach/project/1.rna/2.raw_fq ~/rna-seq/ #报错,
cp -r /teach/project/1.rna/2.raw_fq ~/rna-seq/ #解决报错
cp /teach/project/1.rna/2.raw_fq/SRR1039510_2.fastq.gz ~/rna-seq/
cp: error writing '/trainee1/vip77/rna-seq/SRR1039510_2.fastq.gz': No space left  #无奈啊,内部不够!!!
free -hl
              total        used        free      shared  buff/cache   avail
Mem:            15G        338M        768M        153M         14G        
Low:            15G         14G        768M
High:            0B          0B          0B
Swap:            0B          0B          0B
#感觉好像内存占用没那么大,问了jimmy大神
df -h
Filesystem      Size  Used Avail Use% Mounted on
udev            7.8G     0  7.8G   0% /dev
tmpfs           1.6G  153M  1.5G  10% /run
/dev/vda1        50G  5.9G   42G  13% /
tmpfs           7.8G   24K  7.8G   1% /dev/shm
tmpfs           5.0M     0  5.0M   0% /run/lock
tmpfs           7.8G     0  7.8G   0% /sys/fs/cgroup
/dev/vdb1       473G  406G   43G  91% /trainee1
/dev/vdc1       473G   43G  406G  10% /trainee2
/dev/vdd1       148G   58G   83G  41% /teach
tmpfs           1.6G     0  1.6G   0% /run/user/500
tmpfs           1.6G     0  1.6G   0% /run/user/1022
tmpfs           1.6G     0  1.6G   0% /run/user/1005
tmpfs           1.6G     0  1.6G   0% /run/user/1071
tmpfs           1.6G     0  1.6G   0% /run/user/1064
tmpfs           1.6G     0  1.6G   0% /run/user/1078
tmpfs           1.6G     0  1.6G   0% /run/user/1000
tmpfs           1.6G     0  1.6G   0% /run/user/1008
#还是没搞懂

参考:
https://www.jianshu.com/p/2aecf90bf1f3
https://www.jianshu.com/p/dee6db5afeff
b站生信技能树转录组实战视频
没有解决的问题:

  • prefetch 下载报错
  • 内存怎么回寺 蒙圈中
    感觉今天困难重重,b站生信技能树linux视频再刷一遍,先把RNA-Seq小作业做完
    本篇纯属瞎编,没有参考价值,解决问题还得考谷歌叔叔

你可能感兴趣的:(转录组实战之SRA数据下载(上) 2019-05-07)