1.hog描述子在opencv中为HOGDescriptor。
2.可以调用该描述子setSVMDetector方法给用于对hog特征进行分类的svm模型的系数赋值,这里的参数为HOGDescriptor::getDefaultPeopleDetector()时表示采用系统默认的参数,因为这些参数是用很多图片训练而来的。
3. 对输入图片进行行人检测时由于图片的大小不一样,所以要用到多尺度检测。这里是用hog类的方法detectMultiScale。参数解释如下:
HOGDescriptor::detectMultiScale(constGpuMat& img,vector<Rect>& found_locations,double hit_threshold=0,Size win_stride=Size(),Size padding=Size(),double scale0=1.05,int group_threshold=2)
该函数表示对输入的图片img进行多尺度行人检测 img为输入待检测的图片;found_locations为检测到目标区域列表;参数3为程序内部计算为行人目标的阈值,也就是检测到的特征到SVM分类超平面的距离;参数4为滑动窗口每次移动的距离。它必须是块移动的整数倍;参数5为图像扩充的大小;参数6为比例系数,即滑动窗口每次增加的比例;参数7为组阈值,即校正系数,当一个目标被多个窗口检测出来时,该参数此时就起了调节作用,为0时表示不起调节作用。
4. 最后对检测出来的目标矩形框,要采用一些方法处理,比如说2个目标框嵌套着,则选择最外面的那个框。 5. 因为hog检测出的矩形框比实际人体框要稍微大些,所以需要对这些矩形框大小尺寸做一些调整。
void Dialog::on_detectButton_clicked() { vector<Rect> found, found_filtered; //容器里装着Rect类型数据 cv::HOGDescriptor people_dectect_hog; //采用默认的已经训练好了的svm系数作为此次检测的模型 people_dectect_hog.setSVMDetector(cv::HOGDescriptor::getDefaultPeopleDetector()); //对输入的图片img进行多尺度行人检测 //img为输入待检测的图片;found为检测到目标区域列表;参数3为程序内部计算为行人目标的阈值,也就是检测到的特征到SVM分类超平面的距离; //参数4为滑动窗口每次移动的距离。它必须是块移动的整数倍;参数5为图像扩充的大小;参数6为比例系数,即滑动窗口每次增加的比例; //参数7为组阈值,即校正系数,当一个目标被多个窗口检测出来时,该参数此时就起了调节作用,为0时表示不起调节作用。 people_dectect_hog.detectMultiScale(img, found, 0, Size(8, 8), Size(32, 32), 1.05, 2); //从源码中可以看出: //#define __SIZE_TYPE__ long unsigned int //typedef __SIZE_TYPE__ size_t; //因此,size_t是一个long unsigned int类型 size_t i, j; for (i = 0; i < found.size(); i++ ) { Rect r = found[i]; //下面的这个for语句是找出所有没有嵌套的矩形框r,并放入found_filtered中,如果有嵌套的 //话,则取外面最大的那个矩形框放入found_filtered中 for(j = 0; j <found.size(); j++) if(j != i && (r&found[j])==r) //这可求出两个矩形的交集,如果被嵌套在里面则赶紧停止 break; if(j == found.size()) //如果没有被嵌套,则放入容器中 found_filtered.push_back(r); } //在图片img上画出矩形框,因为hog检测出的矩形框比实际人体框要稍微大些,所以这里需要 //做一些调整,X坐标增加点,Y坐标增加点,宽度和高度减少点,然后,给出 for(i = 0; i <found_filtered.size(); i++) { Rect r = found_filtered[i]; r.x += cvRound(r.width*0.1); r.width = cvRound(r.width*0.8); r.y += cvRound(r.height*0.07); r.height = cvRound(r.height*0.8); rectangle(img, r.tl(), r.br(), Scalar(0, 255, 0), 3); //画方框rectangle( image, pt1, pt2, randomColor(rng), MAX(thickness, -1), lineType ); } imwrite("../hog_test_result.jpg", img); ui->textBrowser->clear(); ui->textBrowser->append("<img src="http://archive.cnblogs.com/a/hog_test_result.jpg>"); }