使用增强级联的弱分类器包括两个主要阶段:训练和检测阶段。对象检测教程中有描述使用基于 HAAR 或 LBP 模型的检测阶段。这里主要介绍训练增强分类器级联所需的功能,包括:准备训练数据、执行实际模型训练、可视化训练。
目录
一、训练数据准备
1、负样本
2、正样本
3、命令行参数
4、标注工具
二、级联训练
1、通用参数
2、级联参数
3、增强分类器参数
4、Haar-like特征参数
三、可视化级联分类器
为了训练增强的弱分类器级联,需要一组正样本(包含想要检测的实际对象)和一组负样本(包含不想检测的所有内容)。负样本集合必须手动准备,而正样本集是使用 opencv_createsamples 应用程序创建的。
负样本取自任意图像,不包含要检测的对象。这些从中生成样本的图像应该放置于独立的文件中,每行包含一个图像路径。负样本图像也称为背景样本或背景图像。
所描述的图像可能具有不同的大小。但是,每个图像都应该等于或大于所需的训练窗口大小。
目录结构:
/img
img1.jpg
img2.jpg
bg.txt
bg.txt主要是指定图像路径:
img/img1.jpg
img/img2.jpg
正样本由 opencv_createsamples 应用程序创建。增强过程使用它们来定义模型在尝试查找我们感兴趣的对象内容。支持两种生成正样本数据集的方法,建议采用第二种方法。
命令行包括正样本路径、负样本路径、输出路径、样本宽高等,具体如下:
-maxxangle
: 朝向 x 轴的最大旋转角度,单位弧度;-maxxangle
: 朝向 y 轴的最大旋转角度,单位弧度;-maxxangle
: 朝向 z 轴的最大旋转角度,单位弧度;当以这种方式运行 opencv_createsamples 时,以下过程用于创建样本对象实例:给定的源图像围绕所有三个轴随机旋转。所选角度受-maxxangle
,-maxyangle
和-maxzangle限制
。白噪声被添加到前景的强度中。如果指定-inv
,则前景像素强度会反转。最后,将获得的图像放置到背景描述文件中的任意背景上,调整宽高为-w
和-h,
并存储到由命令行指定路径-vec
。
正样本也可以从先前标记的图像集合中获得,这是构建稳定对象模型时所需的方式。这个集合是由一个类似于背景描述文件的文本文件来描述的。该文件的每一行对应一个图像。该行的第一个元素是文件名,然后是对象注释的数量,然后是描述对象边界矩形坐标(x、y、宽度、高度)的数字,描述文件如下。
目录结构:
/img
img1.jpg
img2.jpg
info.dat
info.dat中图像1包含一个矩形坐标,图像2包含2个矩形坐标,具体如下:
img/img1.jpg 1 140 100 45 45
img/img2.jpg 2 100 200 50 50 50 30 25 25
OpenCV3.x以后,提供用于生成文件的开源注释工具-info,相关参数如下:
命令行示例如下:
opencv_annotation --annotations=/xxx/annotations/file.txt --images=/xxx/image/
在准备好正样本和负样本后,对弱分类器进行级联训练。opencv_traincascade命令按照功能用途划分。
通用参数包括正负样本路径、正负样本数量、分类器输出路径、训练的级联阶段数,具体如下:
-precalcValBufSize:
预先计算的特征值的缓冲区大小(以 Mb 为单位);-precalcIdxBufSize
:预先计算的特征索引的缓冲区大小(以 Mb 为单位);-numThreads
:训练使用的最大线程数;-acceptanceRatioBreakValue
:用于确定模型应保持学习的精度以及何时停止。默认为-1,禁用此功能。级联参数包括阶段类型、特征类型、样本宽高,具体如下:
-stageType
: 阶段类型;-featureType<{HAAR(默认), LBP}>
: 特征类型:HAAR(Haar-like 特征),LBP(局部二进制模式);-w
:训练样本的宽度(以像素为单位);-h
:训练样本的高度(以像素为单位);增强分类器参数包括分类器类型、最小命中率、最大误差率,具体如下:
-bt <{DAB, RAB, LB, GAB(默认)}>
:增强分类器的类型:DAB(Discrete AdaBoost),RAB (Real AdaBoost),LB(LogitBoost),GAB(Gentle AdaBoost);-minHitRate
:分类器每个阶段的最小期望命中率;-maxFalseAlarmRate
:分类器每个阶段的最大期望误差率;-weightTrimRate
:是否使用修正权重,建议值为 0.95;-maxDepth
:弱树的最大深度,建议值为1;-maxWeakCount
:每个级联阶段的弱树的最大数量;Haar-like特征参数主要是指定特征集类型,具体如下:
-mode
:选择训练中使用的 Haar 特征集的类型。其中BASIC 仅使用直立功能,而 ALL 使用直立和 45 度旋转功能集;可视化级联分类器用于在训练过程中,看到实时训练数据视图。OpenCV提供opencv_visualisation应用程序,相关命令如下:
命令行示例如下:
opencv_visualisation --image=/data/object.png --model=/data/model.xml --data=/data/result/