RNA-seq摸索:1.配置环境

2020.3.26
在新的虚拟机里安RNA-seq所需的软件

参考这篇
我觉得学RNA-seq必看的文献!!
这篇写的特别好:RNAseq-workflow
RNA-seq流程
RNA-seq一般流程
本科生搞定RNA-seq上游数据分析

所需要的软件
-数据下载:sra-tools
-质控:fastqc,multiqc;trimmomatic,trim-galore,cutadapt
-比对:hisat2,bowtie2,tophat,bwa,subread
-计数:htseq, bedtools ,deeptools salmon

开始安装conda

下载conda linux 64位

wget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh

777是指r w t 421权限都给

chmod 777 Miniconda3-latest-Linux-x86_64.sh

运行

bash Miniconda3-latest-Linux-x86_64.sh

一路yes 但是是否安在PATH中 选no!!!

输入conda发现找不到 这时

cd ./miniconda3/bin

发现有activate文件 但还是需要给它权限

chmod 777 activate

启动conda 第一个.等于 source

. ./activate

出现(base) 表示启动成功,可以输入 conda list 测试一下

添加频道 这两个是官方的

conda config --add channels bioconda
conda config --add channels conda-forge

这个是别人推荐的

conda config --add channels genomedk

查看已添加的频道

vim ~/.condarc
conda config --get channels

退出vim

:wq!

安装 gatk

conda install gatk

退出 conda 第一个. 等于 source

. ./deactivate

以上差不多conda就安好了


新建环境, python版本为2.7, -n: 设置新的环境的名字

conda create -n RNA-seq python=2.7
环境启动语句

进入环境

conda activate RNA-seq

安装软件

conda install -y fastqc
conda install -y sra-tools
conda install -y trim-galore
conda install -y star
conda install -y hisat2
conda install -y bowtie2
conda install -y subread
conda install -y htseq
conda install -y cutadapt
conda install -y multiqc
conda install -y samtools

查看已安装软件

conda list
软件名 --help

下载SRA格式文件

在GEO数据库中搜索GSE号,然后点击↓



选好需要的数据后可以:
①一个一个下,
②在前面□里打钩,然后选择↓,会得到一个SRR_Acc_List.txt文件



2020.3.26 一个插曲
下载SRA数据时报错:No Space Left
然后我用 df -h, df -i查看了一下使用情况,发现df -h后使用率100%,但是df -i后使用率只有31%
然后又按照网上大家的一些建议删除了小文件和工作日志,还是没有腾出空间。

这里附上链接:
"No space left on device”错误的排查与解决方法
解决Linux系统磁盘空间满的办法

然后pl建议我扩容硬盘,我就又搜索了一些怎么扩容硬盘的教程

这里附上链接:
VirtualBox 扩展虚拟硬盘容量

但是我实在是太菜了,看到后面还要分区,我觉得我实在操作不了,遂放弃‍♀️

所以菜鸡如我只好重新建个虚拟机了
使用软件:VirtualBoxXShellNotepad++


2020.3.27 第二天

cd 路径到RNA-seq目录里,在SRA上下载txt文件,放到RNA-seq目录里

这个文件的内容其实就是它们的“名字”


sra文件

txt文件作为while read的输入

先cd 到要储存 sra 格式的文件夹里,我的SRR_Acc_List.txt也存在这里
nohup cat SRR_Acc_List.txt | while read num;do (prefetch  $num); done &

为了后续操作的方便,我会把.sra格式全部移到一个新的文件夹里,详见RNA-seq摸索:2.sra下载数据→fastqc质控→hisat2/bowtie2/STAR/salmon比对→Samtools格式转换→IGV可视化结果

你可能感兴趣的:(RNA-seq摸索:1.配置环境)