H2O操作记录 分布式随机森林

数据集下载

数据集可以从这个网址进行下载:https://s3.amazonaws.com/h2o-public-test-data/smalldata/flow_examples/ad.data.gz。

数据集导入

2018-05-08-11-26-41.jpg

数据集解析

2018-05-08-11-28-26.jpg

点击Parse

2018-05-08-11-29-02.jpg

点击View查看数据集

2018-05-08-11-30-32.jpg

点击最后一列,查看标签列的分布情况。

模型构建

选择分布式随机森林算法:

2018-05-08-11-31-28.jpg

参数界面截图:

2018-05-08-11-35-16.jpg

2018-05-08-11-35-38.jpg

2018-05-08-11-36-04.jpg

2018-05-08-11-36-28.jpg

该算法比较重要的参数是下面这个截图:

2018-05-08-11-37-32.jpg

点击“构建”:

2018-05-08-11-38-07.jpg

模型结果

2018-05-08-11-38-52.jpg

XGBoost差不多,但是这个可以下载POJOXGBoost好像不能下载。

2018-05-08-11-39-38.jpg

2018-05-08-11-39-56.jpg

2018-05-08-11-41-02.jpg

你可能感兴趣的:(H2O操作记录 分布式随机森林)