win10(64位)python xgboost 详细安装教程

win10(64位)python xgboost 安装教程


在看一些数据挖掘比赛的经验分享,看到很多都用到了xgboost并取得不错效果,于是down了大神们的解决方案,结合他们的代码学习数据挖掘比赛流程。在安装xgboost 的过程中,看网上各种教程走了很多弯路,在此分享下64位win10系统下安装python xgboost包的经验,希望能帮到和我一样的新手们少走弯路。

xgboost的作者是陈天奇大神,顺便奉上其论文。

注意:由于xgboost最新版本已经不支持 visual stdio build的方法了,所以网上很多教程都GG了! 以下教程靠谱:
http://www.th7.cn/system/win/201603/157092.shtml
http://m.blog.csdn.net/article/details?id=50972530

一:安装环境

  1. windows 10 64位
  2. python 2.x/3.x 64位都可以(我用的是2.7.10)

    cmd 输入python查看版本:

C:\Users\huangcheng>python
Python 2.7.10 (default, May 23 2015, 09:44:00) [MSC v.1500         64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.

如果是装了IPython之类的IDE,注意添加系统环境变量。

二:所需软件

1.mingw-w64:mingw-w64是为了在windows环境下直接编译github上得到的xgboost项目文件。

  • 下载地址:
    https://sourceforge.net/projects/mingw-w64/files/Toolchains%20targetting%20Win64/Personal%20Builds/mingw-builds/5.3.0/threads-win32/seh/
  • 点击下载x86_64-5.3.0-release-win32-seh-rt_v4-rev0.7z,适用64位操作系统。
  • 解压到某一目录下,我放到了C盘根目录。(目录最好不要有中文字符)
  • 配置环境变量。将C:/mingw64/bin;粘贴到path环境变量下。
  • 进入目录C:/mingw64/bin,找到mingw32-make.exe 更名为make(为了使用方便)。成功后,在cmd下输入make会返回“make: *** No targets specified and no makefile found. Stop.”。

2.git:这个可装可不装,如果选择不安装则直接从github下载xgboost包 。

不过为了自动获取github上最新的xgboost包,还是安装一下,以后也会用到这个工具。git官方下载地址:https://git-scm.com/download/win。安装步骤比较简单,下一步下一步即可。

3.Cygwin:cygwin是windows平台上运行的unix模拟环境。本人选择的用git shell 和cmd,所以没有选择安装,读者有兴趣可以自己尝试。

4.pip:pip是安装扩展名为.whl的python包用的工具。

  • 下载地址:https://pypi.python.org/pypi/pip#downloads
  • 解压到一个目录下,找到setup.py位置,cmd进入该目录,输入执行python setup.py install 即可。
  • 重启cmd,输入pip,显示pip的帮助信息,则安装成功

三:命令安装

1.numpy和scipy的安装(如果装了IPython之类的IDE就不需要了,因为已经自带了这些包)

  • numpy和scipy是xgboost的依赖工具包,python下进行科学计算也是必不可少的工具。
  • 注意下载对应python版本号的的whl文件:
    http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy
    http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy
  • 将两个whl文件拷到python路径下的Scripts文件夹下,并将该文件路径添加到PATH环境变量。比如:C:/Python27/Scripts
  • 在cmd下运行:pip install XXXXX.whl 即可。
  • python命令行输入
    import numpy 
    import scipy

如果没有报错就说明安装成功。

2.打开前面安装的Git Bash依次输入以下命令:(如果直接从陈天奇大神的github下载源码的同学跳过此步)

1. git clone --recursive https://github.com/dmlc/xgboost 
2. cd xgboost
3. git submodule init
4. git submodule update

这是官方Installation Guide:http://xgboost.readthedocs.io/en/latest/build.html

  • 首先进入xgboost目录下:cd (xgboost路径)
  • 接着输入:cp make/mingw64.mk config.mk
  • 接着输入:make -j4

3.打开cmd:

  • 进入xgboost路径下的python-package:cd python-package
  • 接着输入:python setup.py install
  • OK

4.最后打开python命令行:import xgboost

如果没有报错,就安装成功了。

最后

附上wepon大神的xgboost知乎精彩回答:
https://www.zhihu.com/question/41354392


你可能感兴趣的:(数据挖掘,机器学习,数据挖掘,xgboost,python)