阿里云国外服务器处理转录组数据RNA-seq

#美国弗吉尼亚

8核64G,高主频型

4.5rmb/h

新建用户

adduser wuxiaobin

passwd wuxiaobin

赋予root权限:usermod -g root wuxiaobin

修改/etc/sudoers 文件 重启

准备工作

#安装RSEM

wget -c https://github.com/deweylab/RSEM/archive/v1.3.1.tar.gz

tar -xzvf ..

#安装相应配件

sudo yum install gcc-c++

sudo yum install zlib zlib-devel

#安装 R...

sudo yum install epel-release

dnf install 'dnf-command(config-manager)'

dnf config-manager --set-enabled PowerTools

dnf install R

#安装perl

dnf install perl

dnf install perl-Env

make 

make install DESTDIR=/home/my_name

#安装STAR

wget https://github.com/alexdobin/STAR/archive/2.7.3a.tar.gz

tar -xzvf 

#进入bin目录检查

#添加环境变量

export PATH=/home/wuxiaobin/STAR-2.7.3a/bin/Linux_x86_64:$PATH

export PATH=/home/wuxiaobin/RSEM-1.3.3:$PATH

第一步:fastq文件下载

安装sratoolkit(https://www.jianshu.com/p/26f6083f0e7f)

wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-centos_linux64.tar.gz

1.下载安装压缩包,解压

tar -xzvf ./

2.进入bin目录

./vdb-config --interactive

进入图形化界面后按x退出完成激活

下载:

nohup prefetch --option-file ./gse.txt &

#转换为fastq

nohup fastq-dump SRR2061752.sra &

or 双端

nohup fastq-dump --split-filesSRR2061752.sra &(split-file,spilt-e,split-3)

第二步:去除低质量reads和去接头

安装fastp

wget http://opengene.org/fastp/fastp

双端(3 min)双端数据全部先质控 在进行比对!

nohup ~/fastp -i ~/c_0_1.fastq -o ./test_1.fastq -I ~/c_0_2_clipper.fastq -O ./test_2.fastq -Q --thread=8 &

单端(2 min)

~/fastp -i ./SRR7912011.fastq -o ./qc.fastq -Q thread=8 -q 20 -u 20 -3 -W 4 -M 20

第四步:比对回帖

star和rsem的下载安装

建立索引(鼠和人)40min

wget ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_mouse/release_M24/gencode.vM24.annotation.gtf.gz

wget ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_mouse/release_M24/GRCm38.primary_assembly.genome.fa.gz

建立索引

/home/wuxiaobin/RSEM/bin/rsem-prepare-reference -gtf ~/gene_annotation/gencode.vM24.annotation.gtf --star -p 8 ~/gene_annotation/GRCm38.primary_assembly.genome.fa ~/second_object/mus_ref/mus_gencode

nohup /home/wuxiaobin/RSEM/bin/rsem-prepare-reference -gtf ~/gene_annotation/gencode.v31.annotation.gtf --star -p 8 ~/gene_annotation/GRCh38.primary_assembly.genome.fa ~/human_ref/human_gencode &

计算表达量

SE data:

nohup rsem-calculate-expression --star -p 8 --no-bam-output ./qc.fastq ~/ref/mus_ref/mus_gencode ./mus38_gencode &

PE data:

~/RSEM/bin/rsem-calculate-expression --paired-end --star -p 8 --no-bam-output ~/test/test_1.fastq ~/test/test_2.fastq ~/human_ref/human_gencode ~/test/pe/human38_gencode

你可能感兴趣的:(阿里云国外服务器处理转录组数据RNA-seq)