lightgbm学习(持续更新)

做比赛用了lightgbm,有很多需要注意的地方。在此把重点记下当做笔记(纯写算法介绍太耗时了)

直接上重点:

1.lightgbm对类别特征的处理是对类别特征进行分成两个区,这样k个特征值就有2^k-1种分区,而不是进行的Onehot,之前看一篇博客好像说Cateboost是进行onehot,但是对值少的类别划为一个类别,就相当于模型帮人做了特征工程,具体没仔细去看。

2.lightgbm用到goss是效果很好的,即使用leaf_wise建树。只要你能控制住过拟合,一般用树深度,叶子个数等,但有一点要注意的是sklearn 的goss不能支持行采样,但是支持列采样。

3.XGBoost和Lightgbm

   a.一个是level_wise,一个是leaf_wise

   b.分裂的时候可以采用父节点减一个子节点的不纯度(应该是xgb里的G^2/H+λ,需待考证)

   c.并行方面有很大不同。



你可能感兴趣的:(机器学习)