关于STAMP(Statistical Analysis of Metagenomic Profiles)已经有很多介绍了,如微生物组间差异分析的神器——STAMP(2016.12) 。可见引进大陆视野已经一年多了,现在你再想写出很好的文档,是有难度了。但是目前还没有一个完整的应用手册,也就是软件文档的翻译、完整功能的介绍和流程化。
STAMP是什么的问题已经解决了,怎么用的问题也已经解决大半,比如Analyzing metagenomes with STAMP,剩下来就是为什么用这个的问题了。这个问题谁来回答?
STAMP window版很好下载和安装,就是不断地next,也推荐大家安装这个,因为linux版本的安装好用起来还是图像化的界面。下面我就介绍一下自己在阿里云上安装STAMP的经过。觉得安装了linux版的就不用点按钮了,也更接近计算过程,也更难。
首先我在官网上找到:
Linux and OS X users can follow the instructions to install from source
点连接,告诉我:
STAMP is implemented in Python and running it from source is easy. Any operating system that supports Python should be able to run STAMP from source. Running from source is the best way to fully exploit and contribute to STAMP. STAMP is dependent on the following libraries:
- Python 2.5 or 2.6 (we recommend Python 2.6.4)
- PyQt4
- NumPy and SciPy
- matplotlib
- biom-format
- pyqi
接下来就进入了漫长的装包之旅
在安装PyQt4的时候需要安装SIP,其实我现在是有这个库的但是版本不对,人家要4.19.1以上的。我就把原来的用conda uninstall 卸载掉重新安装。
这里讲一下如何查看Python安装的包的版本。
$pip list # 查看用pip装的包
$conda list #查看conda装的包
或者在Python 解释器中查看:
$python
Python 2.7.14 |Anaconda, Inc.| (default, Oct 16 2017, 17:29:19)
[GCC 7.2.0] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> impert
Traceback (most recent call last):
File "", line 1, in
NameError: name 'impert' is not defined
>>> import sip
>>> print(sip,sip.SIP_VERSION_STR)
(, '4.19.8')
下载压缩包 sip-4.19.8tar.gz
tar zxvf sip-4.19.8.tar.gz
cd sip-4.19.8
python configure.py
make
make install
预计是这样子的,但是到了make那一步总是报错,共享库找不到。谁知道编译是个什么鬼,一窍不通,就在别的机器上把需要的共享库放到自己的机器上。
cp过来之后,make还是不行,报出了别的错。看了sip的REANME,发现需要安装依赖的两个库:
The ``build.py`` script requires that ``flex`` and ``bison`` are installed.
我连这两个 Bison-Flex是什么都不知道好吗,查查,介绍的很多,安装倒是不这么难。
安装完,测试一下,可以了。
$sip -V
4.19.8
说来简单,足足花了我一上午的时间。
然后是安装pyqt4,有了上面的经验就快很多了。
PyQt4的安装
安装pyqt4
其他的包按照类似的方法安装,pip install、conda install、yum install、下载安装包等方法均得到了安装。
其中biom-format的安装可能要复杂一点,另外在import的时候,是import biom,不是import biom-formt。
如果你的依赖的东西够搞好的话,也可以这样安装:
Source code on Linux
STAMP can be install on Linux (tested under Ubuntu 14.04) using the following commands:
$yum install libblas-dev liblapack-dev gfortran
$yum install freetype* python-pip python-dev python-numpy python-scipy python-matplotlib
$pip install STAMP
安装了STAMP之后,提示我在命令行运行STMAP,但是我运行之后是这样的:
$STAMP
QXcbConnection: Could not connect to display
Aborted
原来我的Xshell并没有图形化界面,我今天才知道linux也可以打开图形化界面的软件。查过 Linux DISPLAY环境变量的妙用(error:QXcbConnection: Could not connect to display)之后安装了 MobaXterm ,这是一款全能型开源远程终端。在这个上面运行:
$STAMP
/root/miniconda2/lib/python2.7/site-packages/matplotlib/cbook/deprecation.py:107: MatplotlibDeprecationWarning: The mpl_toolkits.axes_grid module was deprecated in version 2.1. Use mpl_toolkits.axes_grid1 and mpl_toolkits.axisartist provies the same functionality instead.
warnings.warn(message, mplDeprecation, stacklevel=1)
QXcbConnection: XCB error: 145 (Unknown), sequence: 171, resource id: 0, major code: 139 (Unknown), minor code: 20
虽然出现了些许的报错,还是出现了这样的界面:
也就是说很可能安装成功了。
只有测试过的才是真实的
我们来测试一下。
按照微生物多样性组间差异分析神器-STAMP 的介绍,我们一步一步来,文中提到的 Fish’s exact test我在Windows上的STAMP已经测试通过了,得到了想要的画面。
我把Windows下面的测试文件拷到我的linux上,导入数据,和Windows版的一样,点几个按钮,运行测试,得到了,我预期的画面。生物学意义的讨论不在本文范围内,有时间我会慢慢品读。
在我进行加载文件和方法以及测试的时候,我的linux控制台没有变化,说明这两者之间并不像RStudio那样明显。但是还是出现了一些提示的:
$STAMP
/root/miniconda2/lib/python2.7/site-packages/matplotlib/cbook/deprecation.py:107: MatplotlibDeprecationWarning: The mpl_too lkits.axes_grid module was deprecated in version 2.1. Use mpl_toolkits.axes_grid1 and mpl_toolkits.axisartist provies the s ame functionality instead.
warnings.warn(message, mplDeprecation, stacklevel=1)
QXcbConnection: XCB error: 145 (Unknown), sequence: 171, resource id: 0, major code: 139 (Unknown), minor code: 20
QObject::disconnect: Unexpected null parameter
/root/miniconda2/lib/python2.7/site-packages/stamp/plugins/multiGroups/plots/HeatmapPlot.py:110: ClusterWarning: scipy.clus ter: The symmetric non-negative hollow observation matrix looks suspiciously like an uncondensed distance matrix
linkage = cluster.linkage(dist.squareform(d), method='average')
回到问题的开始,我怎么在能在linux上,而不是图形界面来运行呢?换言之,用代码来控制STAMP而不是按钮?毕竟按钮不方便批量操作。就像R语言那样,说到这,我想RStudio 有没有linux桌面版呢?一查还真有, R语言工程化实践:RStudio Server环境快速配置教程,原来所有双击能打开的程序都可以在linux用命令打开。