本文讲述了做生信分析时一种简单易行的软件安装方式,对于刚接触生信分析的小小白非常友好。第一部分主要讲conda安装、环境配置、使用过程中的基本步骤和方式。第二部分主要讲用conda安装软件,以ChIP-seq分析(以及cut&run数据分析)所需软件为例,做RNA-seq,ATAC-seq等也是适用的。末尾推荐几篇很实用的好文。
”conda“有点儿像windows下的”Microsoft Store“,手机中的”应用市场“。Linux下安装软件往往很麻烦,且经常遇到bug几天解决不了,不适合我们这些小小白们。有了conda,一切都解决了。只要是conda有个软件资源库,里面的软件都可以安装,并且自动并你把依赖的包一起解决了。当然,现在很多牛人也开始使用这种简单的方式安装软件了。
安装conda
安装conda的流程
打开终端 -> 下载软件包 -> 安装,指定安装位置 -> 配置镜像 -> 创建小环境
- 打开终端:
连接终端的方式挺多的,linux下的bash终端可以直接打开,windowns的Linux子系统可以通过power shell中输入”bash“打开,远程连接服务器可以通过各种ssh方法。(关于这部分配置还挺有意思的,我会单独写篇文件介绍)
- 下载软件包
conda的安装包的下载链接可以从清华大学开源软件镜像站的miniconda区网页中找到,比如Linux 64位系统,就复制Linux-x86_64.sh 结尾的conda包链接。也可以直接用“latest”代替最新的版本号。
打开Linux终端,用系统自带的wget
命令下载miniconda。
mkdir ~/software && cd ~/software/
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
每次打开终端,默认所在的位置是当前用户的home目录,如果要下载到其他目录,需要cd
那个文件夹。(小小白们这时候要知道什么是~
, /home/
, cd
, ls
, wget
, *.sh
, 那就问问度娘吧)
- 安装,指定安装位置
安装下载好的conda软件包:
bash Miniconda3-latest-Linux-x86_64.sh
一路回车,yes下去吧。如果想把conda安装到指定目录,当系统问你想把conda安装到哪个时,直接输入路径即可。
press ENTER ENTER ENTER ... and "yes"
press ENTER to install conda at __[/home/x/miniconda3] __
Do you wish the installer to initialize Miniconda3 by running conda init? [yes|no] ---> yes
测试一下conda是否安装好,激活conda,调出conda 帮助信息:
source ~/.bashrc
conda --help
- 配置镜像
因为在国内,从conda默认的软件源下载速度简直是蜗牛。所以需要把国内的软件资源加到conda的配置中。一般就用清华的镜像(其实就是把链接地址写到某个指定的文本中的过程)。之前从网上找到过很多条镜像地址,但是都已经失效了,不用求多,这三条足够用了。
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda
conda config --set show_channel_urls yes
- 创建小环境
conda装好了,必须创建小环境才能用。小环境是什么?打个比喻吧:我有个书桌(conda),我在上面放了个盒子(小环境),里面放的是常用文具(小环境中安装的软件);我又放了个盒子(另一个小环境),专门放画画用的笔和颜料(另一个小环境中的软件)。 其实,对于我这种新手一个小环境就够用了。
除非特殊需求,本着喜新厌旧的原则,直接上python3环境。“y”确认创建。
conda create -n seqpy3 python=3
“seqpy3”是我给新建的小环境的命名,可以随意写喜欢的名字。
使用conda 安装分析软件的流程
激活小环境 -> 安装需要的软件 -> 退出小环境
打开盒子(小环境),往里面装东西(软件)吧, 以ChIP-seq为例,装几个必须的分析软件(本文第二部分详解)
- 激活小环境
这个命令使用频率相当高,每次安装和使用软件时都要用到·
source activate seqpy3
- 安装需要的软件
conda list # 列出安装了的软件
conda search 软件名 # 搜索资源中的软件
conda install 软件名 # 安装软件
- 退出小环境
source deactivate
使用分析软件的流程
激活小环境 -> 使用分析软件
每次使用分析软件之前,必须先激活小环境才能用其中安装过的软件。
使用conda安装生信分析软件
常用分析软件通用安装
source activate seqpy3 # 先激活小环境
conda install fastqc multiqc trim-galore bowtie2 samtools macs2 deeptools picard sra-tools -y
conda install sra-tools -y
conda install bwa -y
conda install gatk -y
"fastqc", "multiqc“,”trim-galore"等等都是软件名,中间以空格隔开,就可以一次安装好几个软件。如果安装时出现错误,或者不知道库中是否有这个软件,请使用conda list 软件名
来确认名字是否写对了。
-y 可有可无,代表“yes”。安装过程中系统会多次向你确认是否安装这个软件及相关依赖的包。小白当然是选”yes”,这样就不用一直守在屏幕前了。
其他软件安装
-
bigWigToWig
cd ~/software wget ftp://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/bigWigToWig chmod 777 bigWigToWig
bigWigToWig像是Windows下的一款免安装软件,下载下来就可以直接用了,所以我直接把它wget
下载到“~/software”这个文件夹下,以后直接调用就行了。切记!记住下载的位置。
chmod
不知道为什么,这个软件必须改了权限才能用。“777”指所有者,用户组用户,其他组用户都可以对此进行读、写、执行。
-
GATK4
GATK4, not GATK3。run as
gatk
, not gatk4conda install gatk4 -y
-
homer
defult install at ~/.conda/envs/seqpy3/bin/homerconda install homer -y
homer的运行需要其本身的参考数据库支持,并且会保存到默认目录,比如:
~/.conda/envs/seqpy3/share/homer-4.9.1-5/
下载后的数据保存至默认目录的子目录下:
~/.conda/envs/seqpy3/share/homer-4.9.1-5/data/genomes/hg19/
举个例子:
perl ~/.conda/envs/seqpy3/share/homer-4.9.1-5/configureHomer.pl -install hg19 perl ~/.conda/envs/seqpy3/share/homer-4.9.1-5/configureHomer.pl -install hg38
安装工具
axel加速器
axel是一款多线程的下载器,相比wget单线程的方式,更快。prefetch不工作时,我会拿axel来代替。
apt-get install axel
相关参考
清华镜像帮助文档:清华大学开源软件
跟着视频学软件安装是个非常好的方式:【生信技能树】生信人应该这样安装软件
这两篇讲得很详细:conda管理生信软件一文就够
万一哪天放弃了,请参考卸载部分:linux安装或卸载miniconda
如果你不知道传统安装和conda安装的区别,可以看看这篇软件安装的部分:生信软件 | bowtie2(测序序列与参考序列比对)