在看一些数据挖掘比赛的经验分享,看到很多都用到了xgboost并取得不错效果,于是down了大神们的解决方案,结合他们的代码学习数据挖掘比赛流程。在安装xgboost 的过程中,看网上各种教程走了很多弯路,在此分享下64位win10系统下安装python xgboost包的经验,希望能帮到和我一样的新手们少走弯路。
xgboost的作者是陈天奇大神,顺便奉上其论文。
注意:由于xgboost最新版本已经不支持 visual stdio build的方法了,所以网上很多教程都GG了! 以下教程靠谱:
http://www.th7.cn/system/win/201603/157092.shtml
http://m.blog.csdn.net/article/details?id=50972530
python 2.x/3.x 64位都可以(我用的是2.7.10)
cmd 输入python查看版本:
C:\Users\huangcheng>python
Python 2.7.10 (default, May 23 2015, 09:44:00) [MSC v.1500 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
如果是装了IPython之类的IDE,注意添加系统环境变量。
1.mingw-w64:mingw-w64是为了在windows环境下直接编译github上得到的xgboost项目文件。
x86_64-5.3.0-release-win32-seh-rt_v4-rev0.7z
,适用64位操作系统。C:/mingw64/bin
;粘贴到path环境变量下。C:/mingw64/bin
,找到mingw32-make.exe 更名为make(为了使用方便)。成功后,在cmd下输入make会返回“make: *** No targets specified and no makefile found. Stop.
”。2.git:这个可装可不装,如果选择不安装则直接从github下载xgboost包 。
不过为了自动获取github上最新的xgboost包,还是安装一下,以后也会用到这个工具。git官方下载地址:https://git-scm.com/download/win
。安装步骤比较简单,下一步下一步即可。
3.Cygwin:cygwin是windows平台上运行的unix模拟环境。本人选择的用git shell 和cmd,所以没有选择安装,读者有兴趣可以自己尝试。
4.pip:pip是安装扩展名为.whl的python包用的工具。
python setup.py install
即可。1.numpy和scipy的安装(如果装了IPython之类的IDE就不需要了,因为已经自带了这些包)
C:/Python27/Scripts
。pip install XXXXX.whl
即可。 import numpy
import scipy
如果没有报错就说明安装成功。
2.打开前面安装的Git Bash依次输入以下命令:(如果直接从陈天奇大神的github下载源码的同学跳过此步)
1. git clone --recursive https://github.com/dmlc/xgboost
2. cd xgboost
3. git submodule init
4. git submodule update
这是官方Installation Guide:http://xgboost.readthedocs.io/en/latest/build.html
cd (xgboost路径)
cp make/mingw64.mk config.mk
make -j4
3.打开cmd:
cd python-package
python setup.py install
4.最后打开python命令行:import xgboost
如果没有报错,就安装成功了。
附上wepon大神的xgboost知乎精彩回答:
https://www.zhihu.com/question/41354392