1.14 RNA-seq 之质控还没完成篇

收获:(这里要敲黑板划重点)
批量处理
脚本的编写
挂后台处理

(网不好真的很难过,很难过,很难过)
miniconda已经安装

  1. 加速下载先装个:asper
#下载
wget -c https://download.asperasoft.com/download/sw/connect/3.8.1/ibm-aspera-connect-3.8.1.161274-linux-g2.12-64.tar.gz
#解压
tar zxvf ibm-aspera-connect-3.7.4.147727-linux-64.tar.gz
bash ibm-aspera-connect-3.8.1.161274-linux-g2.12-64.sh
cd ~#回到家目录
ls -a#查看所有文件
cd .aspera/
cd connect/
cd bin/
ascp --help#调用成功表明安装成功
pwd#得到路径
#添加环境变量
export PATH="/home/vip11/.aspera/connect/bin:$PATH"
aspera安装成功
  1. 批量下载(耗时)
cd project
mkdir rna
mkdir sra_data fq_data
cd sra_data
cat >sra.sh #新建脚本
cat SRR_Acc_List.txt |while read id;do (prefetch ${id});done  #批量下载数据
cat sra.sh #查看脚本内容
nohup bash sra.sh & #后台运行
cat nohup.out #L查看 nohup.out
下载得到的sra数据
  1. 批量转化为fastq格式(极耗时,看下图时间戳)
    当前的路径为:/home/vip11/project/rna/sra_data
cat >qc.sh #新建脚本
vim qc.sh
ls *sra|while read id;do fastq-dump --gzip --split-3 -O /home/vip11/project/rna/raw_data/ $id 1>/home/vip11/project/rna/raw_data/${id}.log 2>&1;done 
# `ls *`当前路径下所有*sra结尾的文件, 
# `do fastq-dump --gzip --split-3`格式转换      
#`-O /home/vip11/project/rna/raw_data/` 将文件保存在此路径下
#`1>/home/vip11/project/rna/raw_data/${id}.log 2>&1` 文件日志保存在此路径下
nohup bash sra.sh &  #运行脚本
sra转fastq

你可能感兴趣的:(1.14 RNA-seq 之质控还没完成篇)