为什么选择弱分类器进行

做模型的目的是为了得到一个强学习器,使得该学习器的性能满足实际需求。

但是实际工作中强学习器并不是很容易就能得到,反而是弱学习器很容易得到,于是人们想,是不是可以利用很多弱学习器来得到一个强学习器呢?于是有了基于弱学习器的集成学习。

也就是说并不是集成学习要求弱分类器,而是我们只有弱分类器而不得不去做集成学习。 

弱分类器,更容易学习到局部的特征,从而达到预测结果的多样性,然后在进行投票。

强分类学习能力很强就没必要这么做了。

如何产生多样性呢?随机特征+样本随机采样,学习参数差异,,这本身也会导致模型变弱。
 

周老师讲过:模型必须要有差异,模型效果本身并不算差。

而实际上ensemble的主要技巧就是在保持模型相对精度的情况下,如何增加个体之间的差异度。

你可能感兴趣的:(机器学习,人工智能)