机器学习中的分类算法以及实际使用

1.决策树
详情参考:
https://blog.csdn.net/XINGBAIDE/article/details/85557138

2.随机森林

随机森林:是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。,随机森林对回归的结果在内部是取得平均
但是并不是所有的回归都是取的平均,有些是取的和,以后会发博文来解释这样的一个现象,需要整理些资料出来。
随机森林里的随机包含的意思是:
样本随机
特征随机
参数随机
模型随机(id3,c4.5)

from sklearn.ensemble import RandomForestClassifier
n_estimators_options =[10,30,50,55,58,60,65,70,80,90,100,110,120,125,130,1135,140,150,60,170,183,186,190,200,210,230,260,300]
rt = RandomForestClassifier(n_estimators=n_estimators_options[i],oob_score=True,class_weight="balanced")
rt.fit(x_train, y_train)

3.extratree
特征随机
参数随机
模型随机(ID3 ,C4.5)
分裂随机 (分裂随机指分裂时并不根据mse寻找最优分裂点,而是随机分裂)
extratree和随机森林的区别:
https://blog.csdn.net/lc574260570/article/details/81813889

你可能感兴趣的:(机器学习)