gcForest:探索深度神经网络以外的方法

前段时间一直在搞xgboost,测试数据集准确率达到了:98.14%左右,调参达到了瓶颈,感觉准确率无法提升了,老师给推荐了gcForest,下载了源码,用默认的参数跑了下,测试数据准确率能达到98.6%左右。然后拜读了下周老师的论文,感觉他的算法在原来集成学习的基础上做了很大的改善,吸取了很多深度学习的东西。附上gcForest简介的链接,感兴趣的了解下:https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2651994082&idx=1&sn=3a1f21ab37ea8322c6700f660b71648a&chksm=f1214313c656ca05de3d7b134570470333e2e4d9601548dad6a5bde98。

源码下载的话,建议不要用南大官网上的,版本比较老,可以从github上下载,也有人不断更新和维护,附上下载链接:https://github.com/kingfengji/gcForest,直接将gcForest-master导入到Pycharm编译器即可,打开requirements.txt文件,可以看到要求的配置,需要安装tensorflow,keras,windows安装教程如下:https://blog.csdn.net/simple84672642/article/details/78216394?locationNum=3&fps=1 ,还要有xgboost,附上windows下xgboost安装教程:http://blog.csdn.net/leo_xu06/article/details/52300869(推荐一个简单的:https://blog.csdn.net/cheney2000/article/details/79478654)

配置完环境后,打开examples包下的demo_mnist.py文件即可,这个是跑的手写数字识别的demo,如果前面import 的包提示出错,直接import相应的包就行了,一般这些包anaconda里都包括了,但是不知道为什么我使用的时候还是提示需要install包,然后install一下就可以了。这个数据集比较大,我的PC跑了一夜,还没有运行完,我就关掉了,这里就不附图了,附一张跑的我自己的数据集的图片的吧:

gcForest:探索深度神经网络以外的方法_第1张图片

PS:我也是刚开始gcForest的学习的,正在拜读周老师的论文和研究代码,为了方便学习交流建了个gcForest交流群,欢迎大家加入,群号:745317329,写的比较仓促,后期有心得再分享。

你可能感兴趣的:(大数据,机器学习)