Haar分类器学习笔记

Haar分类器是什么?

Haar分类器 = Haar-like 特征 + 积分图 + AdaBoost + 强分类器的级联

1、Haar-like 特征
最基本的Haar-like特征

Haar分类器学习笔记_第1张图片

扩展的Haar-like特征

Haar分类器学习笔记_第2张图片
Haar特征值计算:v=sum白-sum黑

2、积分图
积分图概念
坐标A(x,y)的积分图是其左上角的所有像素之和。如下式:

Haar分类器学习笔记_第3张图片
3、Adaboost
Adaboost算法是一种分类器算法,其基本思想是利用大量的分类能力一般的简单分类器通过一定方法叠加起来,构成一个分类能力很强的强分类器。
弱分类器的训练:
训练一个弱分类器就是在当前权重分布的情况下,确定f(x)的最优阈值,使得这个弱分类器对所有训练样本的分类误差最低。选取最佳分类器的过程实际上就是在寻找合适的分类器阈值,使该分类器对所有样本的判读误差最低。
对于每个特征f(x),计算所有训练样本的特征值,并将其排序。对排好序的表中的每个元素,计算下面四个值:

  • 全部正样本的权重和T+
  • 全部负样本的权重和T-
  • 在此元素之前的正样本的权重和S+
  • 在此元素之前的负样本的权重和S-

最终求得每个元素的分类误差(加权错误率)如下:

强分类器的建立:

  1. 第一次迭代训练得到第一最优弱分类器
  2. 提高上一轮中被误判的样本的权重
  3. 将新的样本和上次分错的样本放在一起进行新一轮的训练
  4. T轮后得到T个最优弱分类器
  5. 组合T个最优弱分类器得到强分类器
Haar分类器学习笔记_第4张图片

当该强分类器检测图像时,相当于让构成该强分类器的所有弱分类器投票,再对投票结果按照弱分类器的错误率加权求和的结果与平均投票结果比较得出最终的结果。

4、强分类器的级联
强分类器具有很好的检测率,但误识率也比较大,不满足实际使用要求,因此诞生了级联强分类器。将若干个强分类器由简单到复杂排序,每层的强分类器经过阈值调整,使每一层都能让几乎全部的正样本通过,而拒绝很大一部分负样本。假设每个强分类器检测率为99%,但同时也有50%负样本通过,这样如果有20个强分类器级联,那么他们的总识别率为0.99^20 ≈ 98%,错误接受率也仅为0.5^20 ≈0.0001%,这样就可以满足实际使用的需求了。
Haar分类器学习笔记_第5张图片

你可能感兴趣的:(机器学习,分类,人工智能)