scikit-learn是python的机器学习包,sci是science的缩写,kit为工具包的意思,实现了常用的机器学习算法。由于依赖许多其他的包,因此安装起来比较麻烦,笔者在十一的最后两天花费了较大的精力安装这一系列包。现在把安装过程记录下来:
依赖的各种包:nose、lapack、atlas、numpy、blas、scipy
系统版本:Linux Red Hat 5;python版本:2.7
1.安装nose
a.下载nose:https://pypi.python.org/pypi/nose/1.3.7,下载tar.gz文件
b.运行tar -zxvf ose-1.3.7.tar.gz解压缩
进入到解压出来的目录cd nose-1.3.7
开始安装 python set.py install
注:验证nose是否安装成功,后续模块均可以通过此方法验证
python
>>> import nose
>>> nose
显示安装成功
2.安装lapack
a.下载lapck:http://www.netlib.org/lapack/#_lapack_version_3_5_0_2,(尽量下载3.5.0版本的,其他版本不确保是否有INSTALL/make.inc.gfortran,这个文件后续会用到)
3.安装atlas
a.下载atlas:http://sourceforge.net/projects/math-atlas/,(目前最新版本atlas3.10.2.tar.bz2)
b.解压缩:tar -jxvf atlas3.10.2.tar.bz2
cd ATLAS/;mkdir myobj64
cd myobj64
配置config:../configure -b 64 -Fa alg -fPIC -shared –prefix=/${atlas的安装路径}/ATLAS --with-netlib-lapack-tarfile=/${lapack压缩文件存放的路径}/lapack-3.5.0.tgz(注意加黑的部分:64是机器位数,uname -a可以查看系统位数,x86_64是64位系统;-fPIC一定要加上;用atlas和lapack存放的路径替代两个黑体字变量。配置过程大概几分钟结束)
make(这个命令执行了一个半小时)
make check(接下来这三个命令会有报错,不过我直接忽略掉了,最终似乎没有影响)
make time
make install
c.查看fortran编译器类型:fgrep 'F77 =' Make.inc
F77 = /usr/bin/gfortran
可以看到编译器类型是gfortran,后面安装numpy有用
4.安装numpy
a.下载numpy:https://pypi.python.org/pypi/numpy
b.解压缩:tar -zxvf numpy-1.9.0.tar.gz
cd numpy-1.9.0
python setup.py build --fcompiler=gnu95(如果在3的c中看到的编译器类型是g77,则运行python setup.py build --fcompiler=gnu)
注:笔者看到网上有些同学(http://blog.chinaunix.net/uid-22488454-id-3978860.html)的安装过程中配置了site.cfg文件,不过本人没有配置也安装成功了。
5.安装BLAS
a.下载blas:http://www.netlib.org/blas/blas.tgz
b.解压缩:tar -zxvf blas.tgz
c.gfortran -O3 -std=legacy -m64 -fno-second-underscore -fPIC -c *.f
ar r libfblas.a *.o
ranlib libfblas.a
rm -rf *.o
export BLAS=${BLAS所在的目录}/BLAS/libfblas.a
6.安装lapack
a.进入到第2步中的lapack目录中,
b.tar xzvf lapack-3.5.0.tgz
cd lapack-3.5.0
cp INSTALL/make.inc.gfortran make.inc
vim make.inc,修改选项如下:
FORTRAN = gfortran
OPTS = -funroll-all-loops -O3 -msse2 -mfpmath=sse -ftree-vectorize -g-fPIC
DRVOPTS = $(OPTS)
NOOPT = -fPIC
LOADER = gfortran
LOADOPTS =
make lapacklib(大概几分钟)
make clean
export LAPACK=${lapack所在路径}/lapack-3.5.0/liblapack.a
7.安装scipy
a.下载scipy:https://pypi.python.org/pypi/scipy
b.解压缩:tar -zxvf scipy-0.16.0.tar.gz
cd scipy-0.14.0(网上有些同学说要配置site.cfg,笔者仍然没有site.cfg,最终也安装成功了)
python setup.py install
8.安装scikit-learn
a.下载scikit-learn:https://pypi.python.org/pypi/scikit-learn/0.15.1#downloads
b.解压缩:tar zxvf scikit-learn-0.15.1.tar.gz
python setup.py install
经过这么8个步骤以后,安装完成
笔者在安装过程中,借鉴了以下几位同学的博客,深表感谢:
linux 下面安装numpy 和scipy
inux python 安装 nose lapack atlas numpy scipy (这里为我搜狗打个广告,这个链接是用搜狗搜索出来的,比较详细,百度楞是没搜索出来这个链接)
LAPACK库的安装
numpy & scipy on 10.04