python环境安装H2O

H2O平台介绍

概括来说是一个做分布式机器学习深度学习的平台。

H2Ocloud是它的云平台,可以在线建模,管理模型,管理App,用MLOP和AppStore这两个模块。

H2O HT是云平台建模的版块,主要是机器视觉和自然语言处理。

Driverless模块做无人驾驶的。

H2O-3是开源的分布式机器学习平台,可以安装在用户的分布式集群系统中,特色是AutoML,自动建模,进行超参数调整,生成模型的排行榜。

1.安装相关依赖包

pip install requests
pip install tabulate
pip install scikit-learn
pip install colorama

pip install future

2.安装H2O

pip install http://h2o-release.s3.amazonaws.com/h2o/rel-wright/2/Python/h2o-3.20.0.2-py2.py3-none-any.whl

具体参考:http://h2o-release.s3.amazonaws.com/h2o/rel-wright/2/index.html

H2O Deeplearning 介绍

初始化:与许多DL用无监督初始化再进行有监督训练的方法不同,H2O纯使用有监督,根据网络的大小,自适应初始化,也可以随机初始化。

激活函数:tannh,RelU,maxout

损失函数:回归:MSE均方差、误差绝对值、Huber 分类:交叉熵

正则化:L1 L2

优化:可以选取手动设置方法:带动量的梯度下降,结合学习速率退火,其中的参数手动设置。

也可以直接选自适应方法,也是动量梯度下降加退火,参数自适应。

Deeplearning的一些参数:

activation:指定激活函数

hidden:隐层神经元个数[200,200]

epochs:迭代次数

train samples per iteration:每次迭代使用样本数

seed:随机种子

adaptive rate:是否使用自适应学习速率

rho,epsilon,rate,rate annealing,rate decay这几个参数都是设置关于学习速率及其衰减函数等。

momentum start,momentum ramp,momentum stable:这几个参数设置梯度下降时的动量相关。

input dropout ratio,hidden dropout ratios:训练时随机丢弃input层和隐层神经元的概率,提高泛化性能。

l1,l2:是否使用L1或L2正则化。

loss:损失函数

stopping_...:设置结束迭代的一些条件

还有些可以设置样本权重的参数

一些关于设置交叉验证的参数等。

无监督的H2OAutoEncoderEstimator自编码神经网络

用于降维和异常检测,用原始样本训练模型,对新样本计算重构误差,根据重构误差判断样本是否异常。


 

你可能感兴趣的:(机器学习)