【环境软件】安装和配置生信测序分析环境

本文讲述了做生信分析时一种简单易行的软件安装方式,对于刚接触生信分析的小小白非常友好。第一部分主要讲conda安装、环境配置、使用过程中的基本步骤和方式。第二部分主要讲用conda安装软件,以ChIP-seq分析(以及cut&run数据分析)所需软件为例,做RNA-seq,ATAC-seq等也是适用的。末尾推荐几篇很实用的好文。

”conda“有点儿像windows下的”Microsoft Store“,手机中的”应用市场“。Linux下安装软件往往很麻烦,且经常遇到bug几天解决不了,不适合我们这些小小白们。有了conda,一切都解决了。只要是conda有个软件资源库,里面的软件都可以安装,并且自动并你把依赖的包一起解决了。当然,现在很多牛人也开始使用这种简单的方式安装软件了。

安装conda

安装conda的流程

打开终端 -> 下载软件包 -> 安装,指定安装位置 -> 配置镜像 -> 创建小环境

  • 打开终端:

连接终端的方式挺多的,linux下的bash终端可以直接打开,windowns的Linux子系统可以通过power shell中输入”bash“打开,远程连接服务器可以通过各种ssh方法。(关于这部分配置还挺有意思的,我会单独写篇文件介绍)

  • 下载软件包

conda的安装包的下载链接可以从清华大学开源软件镜像站的miniconda区网页中找到,比如Linux 64位系统,就复制Linux-x86_64.sh 结尾的conda包链接。也可以直接用“latest”代替最新的版本号。

打开Linux终端,用系统自带的wget命令下载miniconda。

mkdir ~/software && cd ~/software/
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh

每次打开终端,默认所在的位置是当前用户的home目录,如果要下载到其他目录,需要cd那个文件夹。(小小白们这时候要知道什么是~, /home/, cd, ls, wget, *.sh, 那就问问度娘吧)

  • 安装,指定安装位置

安装下载好的conda软件包:

bash Miniconda3-latest-Linux-x86_64.sh

一路回车,yes下去吧。如果想把conda安装到指定目录,当系统问你想把conda安装到哪个时,直接输入路径即可。

press ENTER ENTER ENTER ... and "yes"
press ENTER to install conda at __[/home/x/miniconda3] __
Do you wish the installer to initialize Miniconda3 by running conda init? [yes|no] ---> yes

测试一下conda是否安装好,激活conda,调出conda 帮助信息:

source ~/.bashrc
conda --help
  • 配置镜像

因为在国内,从conda默认的软件源下载速度简直是蜗牛。所以需要把国内的软件资源加到conda的配置中。一般就用清华的镜像(其实就是把链接地址写到某个指定的文本中的过程)。之前从网上找到过很多条镜像地址,但是都已经失效了,不用求多,这三条足够用了。

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda
conda config --set show_channel_urls yes
  • 创建小环境

conda装好了,必须创建小环境才能用。小环境是什么?打个比喻吧:我有个书桌(conda),我在上面放了个盒子(小环境),里面放的是常用文具(小环境中安装的软件);我又放了个盒子(另一个小环境),专门放画画用的笔和颜料(另一个小环境中的软件)。 其实,对于我这种新手一个小环境就够用了。

除非特殊需求,本着喜新厌旧的原则,直接上python3环境。“y”确认创建。

conda create -n seqpy3 python=3

“seqpy3”是我给新建的小环境的命名,可以随意写喜欢的名字。

使用conda 安装分析软件的流程

激活小环境 -> 安装需要的软件 -> 退出小环境

打开盒子(小环境),往里面装东西(软件)吧, 以ChIP-seq为例,装几个必须的分析软件(本文第二部分详解)

  • 激活小环境

这个命令使用频率相当高,每次安装和使用软件时都要用到·

source activate seqpy3
  • 安装需要的软件
conda list # 列出安装了的软件
conda search 软件名 # 搜索资源中的软件
conda install 软件名 # 安装软件
  • 退出小环境
source deactivate

使用分析软件的流程

激活小环境 -> 使用分析软件

每次使用分析软件之前,必须先激活小环境才能用其中安装过的软件。

使用conda安装生信分析软件

常用分析软件通用安装

source activate seqpy3 # 先激活小环境
conda install fastqc multiqc trim-galore bowtie2 samtools macs2 deeptools picard sra-tools -y
conda install sra-tools -y
conda install bwa -y
conda install gatk -y

"fastqc", "multiqc“,”trim-galore"等等都是软件名,中间以空格隔开,就可以一次安装好几个软件。如果安装时出现错误,或者不知道库中是否有这个软件,请使用conda list 软件名来确认名字是否写对了。

-y 可有可无,代表“yes”。安装过程中系统会多次向你确认是否安装这个软件及相关依赖的包。小白当然是选”yes”,这样就不用一直守在屏幕前了。

其他软件安装

  • bigWigToWig

    cd ~/software
    wget ftp://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/bigWigToWig
    chmod 777 bigWigToWig
    

bigWigToWig像是Windows下的一款免安装软件,下载下来就可以直接用了,所以我直接把它wget下载到“~/software”这个文件夹下,以后直接调用就行了。切记!记住下载的位置。

chmod不知道为什么,这个软件必须改了权限才能用。“777”指所有者,用户组用户,其他组用户都可以对此进行读、写、执行。

  • GATK4

    GATK4, not GATK3。run as gatk, not gatk4

    conda install gatk4 -y
    
  • homer
    defult install at ~/.conda/envs/seqpy3/bin/homer

    conda install homer -y
    

    homer的运行需要其本身的参考数据库支持,并且会保存到默认目录,比如:~/.conda/envs/seqpy3/share/homer-4.9.1-5/

    下载后的数据保存至默认目录的子目录下:

    ~/.conda/envs/seqpy3/share/homer-4.9.1-5/data/genomes/hg19/

    举个例子:

    perl ~/.conda/envs/seqpy3/share/homer-4.9.1-5/configureHomer.pl -install hg19
    perl ~/.conda/envs/seqpy3/share/homer-4.9.1-5/configureHomer.pl -install hg38
    

安装工具

axel加速器

axel是一款多线程的下载器,相比wget单线程的方式,更快。prefetch不工作时,我会拿axel来代替。

apt-get install axel 

相关参考

清华镜像帮助文档:清华大学开源软件

跟着视频学软件安装是个非常好的方式:【生信技能树】生信人应该这样安装软件

这两篇讲得很详细:conda管理生信软件一文就够

万一哪天放弃了,请参考卸载部分:linux安装或卸载miniconda

如果你不知道传统安装和conda安装的区别,可以看看这篇软件安装的部分:软件 | bowtie2序列参考序列比对

你可能感兴趣的:(【环境软件】安装和配置生信测序分析环境)