2020-01-08 在Windows10中搭建生信Linux环境

1. 准备电脑

配置Windows 10

在Microsoft Store中安装Canonical Group Limited. 开发的Ubuntu。
开始Ubuntu Linux的安装,安装过程中提供Ubuntu系统的账号密码。

双击Ubuntu图标,安装报错

百度报错原因,可能是未安装Windows子系统支持。



尝试该解决办法。



重启后,开始安装。

输入子系统的用户名和密码,完成安装。

安装Java

https://www.java.com/en/

配置Linux

Linux基本命令了解一下
https://www.cnblogs.com/yoci/p/10208452.html

升级Linux Distribution至最新版本。终端中输入:

sudo apt-get update && sudo apt-get upgrade -y

安装必要的packages。终端中输入:

sudo apt-get install -y curl unzip build-essential ncurses-dev
sudo apt-get install -y byacc zlib1g-dev python-dev git cmake
sudo apt-get install -y default-jdk ant
出现3条报错信息,让我尝试--fix-missing

第二行代码也出现了报错

配置终端

升级“shell” 。在终端中输入:

curl http://data.biostarhandbook.com/install/bash_profile.txt >> ~/.bash_profile
curl http://data.biostarhandbook.com/install/bashrc.txt >> ~/.bashrc

注意:只能输入一次!
新的设置不会在当前终端界面立即生效,需要重新打开终端,或输入:

source ~/.bash_profile

2. 安装conda和active bioconda

conda2是一个开源的软件包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖项,并在它们之间轻松切换。它在Linux、OSX和Windows上工作,是为Python程序开发的,但可以打包和分发任何程序。
接下来要用bioconda的定制conda版本来安装生物信息学软件包。你需要安装conda然后点击bioconda对应的通道。

在 Windows Bash中输入(可能需要微批恩,会报无法解析域名错误):

curl -OL https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh 
bash Miniconda3-latest-Linux-x86_64.sh

来安装miniconda,安装时接受所有默认选项



重新打开一个终端,输入:

conda --version

来查看conda是否被正确安装了,若正确安装,输入:

conda update -y -n base conda

更新conda至最新版本

Bioconda是一个分发生物信息软件的channel,可以在Conda package manager中启用。在终端中运行以下命令,启用bioconda channel

conda config --add channels bioconda
conda config --add channels conda-forge

3. 安装软件

创建生物信息学环境

conda create -y --name bioinfo python=3.6

再次重启终端
(Q:为什么人类都登上月球了,搭个环境还要重启这么多次终端?A:又不是不能用。)
激活并安装生物信息学工具

# 激活生物信息学环境,注意,每次重新打开终端都需要运行以激活生物信息学环境
conda activate bioinfo
# 安装Biostar Handbook中用到的多数生物信息学工具,需要花点时间
curl http://data.biostarhandbook.com/install/conda.txt | xargs conda install -y

由于Entrez Direct是一个会造成很多麻烦的工具,现在就提前检查一下它是否有效。上述安装完成后,运行以下命令以验证是否可以从命令行访问NCBI:

efetch -db nuccore -id 2 -format gb
可以!

我做对了没有?

Biostar Handbook作者提供了一个用于诊断的脚本

mkdir -p ~/bin
curl http://data.biostarhandbook.com/install/doctor.py > ~/bin/doctor.py
chmod +x ~/bin/doctor.py

~/bin/doctor.py
有可选程序未安装,后面章节会指导如何安装

安装出现问题没法解决?

建议还是重新搭建一遍环境:

conda create -y --name bioinfo python=3.6
conda activate bioinfo
curl http://data.biostarhandbook.com/install/conda.txt | xargs conda install -y

在Biostar Handbook Issue Tracker上寻找问题的解决方案并汇报新的问题
https://github.com/biostars/biostar-handbook-issues

有新的工具要装?

书里面已经将大部分常用的工具都安装好了
如果有的话,第一步看看conda有没有提供

conda activate bioinfo
conda install 工具名称

安装时要仔细注意⚠信息,有些工具是同当下的环境冲突的。

conda create --name 新环境名称 -y
conda activate 新环境名称
conda install 新工具名称

可以打开两个窗口,一个conda activate bioinfo、一个conda activate 新环境名称。

部分程序要通过源代码安装,安装指导在附录中,暂时不看往下走。

怎么升级tools?

# Upgrade a package.
conda update """

通过自动安装的tools没用了?

可能是工具开发者未及时更新,建议通过源代码安装。

想要更新conda?

conda update -n base conda

如何整理归档文件?

作者给出了一些教学:

整理生物学计算项目的快速指南
http://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1000424
基于GitHub的研究流程
http://www.carlboettiger.info/2012/05/06/research-workflow.html
文件目录布局建议
http://nicercode.github.io/blog/2013-04-05-projects/
最普适性的建议是“简洁”,如果怕忘了自己干了什么,后面会教你怎么用track record,而不是写很长长长长的路径名称。

• 指向二进制文件的链接 Links to binaries go into ~/bin.
• 参考基因组 Reference genomes go into ~/refs.
• 工具的源代码 Source code for tools go into ~/src.

确保文件路径长上面这样,而不是下面这样

你可能感兴趣的:(2020-01-08 在Windows10中搭建生信Linux环境)