linux下python的机器学习包scikit-learn(包含numpy、scipy等)安装

scikit-learn是python的机器学习包,sci是science的缩写,kit为工具包的意思,实现了常用的机器学习算法。由于依赖许多其他的包,因此安装起来比较麻烦,笔者在十一的最后两天花费了较大的精力安装这一系列包。现在把安装过程记录下来:

依赖的各种包:nose、lapack、atlas、numpy、blas、scipy

系统版本:Linux Red Hat 5;python版本:2.7

1.安装nose

a.下载nose:https://pypi.python.org/pypi/nose/1.3.7,下载tar.gz文件

b.运行tar -zxvf ose-1.3.7.tar.gz解压缩

   进入到解压出来的目录cd nose-1.3.7

   开始安装 python set.py install

注:验证nose是否安装成功,后续模块均可以通过此方法验证

python

>>> import nose
>>> nose

显示安装成功

2.安装lapack

a.下载lapck:http://www.netlib.org/lapack/#_lapack_version_3_5_0_2,(尽量下载3.5.0版本的,其他版本不确保是否有INSTALL/make.inc.gfortran,这个文件后续会用到)


3.安装atlas

a.下载atlas:http://sourceforge.net/projects/math-atlas/,(目前最新版本atlas3.10.2.tar.bz2)

b.解压缩:tar -jxvf atlas3.10.2.tar.bz2 

   cd ATLAS/;mkdir myobj64

   cd myobj64

   配置config:../configure -b 64 -Fa alg -fPIC -shared –prefix=/${atlas的安装路径}/ATLAS --with-netlib-lapack-tarfile=/${lapack压缩文件存放的路径}/lapack-3.5.0.tgz(注意加黑的部分:64是机器位数,uname -a可以查看系统位数,x86_64是64位系统;-fPIC一定要加上;用atlas和lapack存放的路径替代两个黑体字变量。配置过程大概几分钟结束)

   make(这个命令执行了一个半小时)

   make check(接下来这三个命令会有报错,不过我直接忽略掉了,最终似乎没有影响)

   make time

   make install

c.查看fortran编译器类型:fgrep 'F77 =' Make.inc

   F77 = /usr/bin/gfortran

   可以看到编译器类型是gfortran,后面安装numpy有用


4.安装numpy

a.下载numpy:https://pypi.python.org/pypi/numpy

b.解压缩:tar -zxvf numpy-1.9.0.tar.gz
   cd numpy-1.9.0
   python setup.py build --fcompiler=gnu95(如果在3的c中看到的编译器类型是g77,则运行python setup.py build --fcompiler=gnu)

注:笔者看到网上有些同学(http://blog.chinaunix.net/uid-22488454-id-3978860.html)的安装过程中配置了site.cfg文件,不过本人没有配置也安装成功了。


5.安装BLAS

a.下载blas:http://www.netlib.org/blas/blas.tgz

b.解压缩:tar -zxvf blas.tgz

c.gfortran -O3 -std=legacy -m64 -fno-second-underscore -fPIC -c *.f

   ar r libfblas.a *.o
   ranlib libfblas.a
   rm -rf *.o
   export BLAS=${BLAS所在的目录}/BLAS/libfblas.a


6.安装lapack

a.进入到第2步中的lapack目录中,

b.tar xzvf lapack-3.5.0.tgz
   cd lapack-3.5.0
   cp INSTALL/make.inc.gfortran make.inc  

   vim make.inc,修改选项如下:

FORTRAN  = gfortran
OPTS     = -funroll-all-loops -O3 -msse2 -mfpmath=sse -ftree-vectorize -g-fPIC
DRVOPTS  = $(OPTS)
NOOPT    = -fPIC
LOADER   = gfortran
LOADOPTS =
   make lapacklib(大概几分钟)
   make clean
   export LAPACK=${lapack所在路径}/lapack-3.5.0/liblapack.a


7.安装scipy

a.下载scipy:https://pypi.python.org/pypi/scipy

b.解压缩:tar -zxvf scipy-0.16.0.tar.gz
   cd scipy-0.14.0(网上有些同学说要配置site.cfg,笔者仍然没有site.cfg,最终也安装成功了)
   python setup.py install

8.安装scikit-learn

a.下载scikit-learn:https://pypi.python.org/pypi/scikit-learn/0.15.1#downloads

b.解压缩:tar zxvf scikit-learn-0.15.1.tar.gz

   python setup.py install


经过这么8个步骤以后,安装完成

笔者在安装过程中,借鉴了以下几位同学的博客,深表感谢:

linux 下面安装numpy 和scipy

inux python 安装 nose lapack atlas numpy scipy (这里为我搜狗打个广告,这个链接是用搜狗搜索出来的,比较详细,百度楞是没搜索出来这个链接)

LAPACK库的安装

numpy & scipy on 10.04



你可能感兴趣的:(机器学习)