这篇主要是关于行人检测的matlab程序,说明如下。
四种算法分别为svm+hog,svm+hog+lbp,adaboost+hog,adaboost+hog+ulbp+cn
每种算法都分别有两个.m文件,一个为训练过程,一个为验证过程
以svm+hog为例:
svm_hog_train.m为训练程序
训练过程:
1.训练用样本数为正样本500个,负样本500个
2.1000个样本进行随机排序后,选择75%即750作为训练样本,250个作为验证样本。
3.采用matlab自带的svmtrain进行训练,考虑到新版本中可能没有svmtrain和svmclassify,所以把相关文件也一并拷贝进svm文件夹中
训练结束后,
1.显示auc,accuracy,confusion_matrix,FR,MR
2.随机选择一个图片画出其直方图
3.画出ROC曲线图
4.保存训练模型svm_hog_struct.mat,用于测试
5.保存验证样本的label矩阵,即svm_hog_label_test.mat
6.保存验证样本的验证结果,即svm_hog_group
7.5和6保存结果用来画四种算法的对比图
预测过程:
1.选择test_images中任意一张图片作为测试图片,这里的图片中分有行人(1,2,5,6,7.png)和没有行人(3,4.png)
2.执行文件后,会显示带有检测框的图片
3.由于训练样本数少,特征未做pca,未对被检测图片做预处理,检测框的选择及候选框的筛选未做进一步完善,所以显示的带检测框的图片不够准确
生成ROC曲线:
执行roc_of_4_algorithm.m即可,如果重新执行,务必保证所有算法的训练过程验证样本数相同,我的是(500+500)*0.25=250
加载图片并显示预测结果的matlab GUI界面。
下面一点点来说明:
首先是图片裁剪,正样本:
%将正样本剪裁成64x128的图片,一共生成2416个负样本
clear all;
clc;
file_train_pos_path='I:\INRIADATA\normalized_images\train\pos\';
img_train_pos_path_list=dir(strcat(file_train_pos_path,'*.png'))
for i = 1:length(img_train_pos_path_list)
img_name=img_train_pos_path_list(i).name;
image = imread(strcat(file_train_pos_path,img_name));
b = imcrop(image,[17,17,63,127]);
% imshow(image);
% imshow(b);
a=sprintf('%04d',i);
imwrite(b,strcat('I:\new\images\trains\pos_',num2str(a),'.png'),'png'); %关键是这句
end
负样本:
%将负样本进行随机剪裁出10个64x128的图片,因为有jpg和png两种格式,分成两次处理,一共生成12180个负样本
clear all;
clc;
file_train_neg_path='I:\INRIADATA\normalized_images\train\neg\';
% img_train_neg_path_list=dir(strcat(file_train_neg_path,'*.jpg'));
img_train_neg_path_list=dir(strcat(file_train_neg_path,'*.png'))
% img_train_neg_path_list=[img_train_neg_path_list1 img_train_neg_path_list2]
for i = 1:length(img_train_neg_path_list)
img_name=img_train_neg_path_list(i).name;
image = imread(strcat(file_train_neg_path,img_name));
size_image=size(image);
edge_y=size(image,1);
edge_x=size(image,2);
for j = 1:10
rand1=randperm(edge_x-64,1);
rand2=randperm(edge_y-128,1);
b = imcrop(image,[rand1,rand2,63,127]);
% imshow(image);
% imshow(b);
a=sprintf('%04d%02d',i+306,j);
imwrite(b,strcat('I:\new\images\trains\neg\neg_',num2str(a),'.png'),'png'); %关键是这句
end
end
然后就是测试集图片。
本文提到的四种检测方法设计到四种特征的提取,分别是HOG,LBP,ULBP,CN,下面分别来看各个特征的提取方法:
hog特征:
function [feature] = hogcalculator(input_img)
%自己编写的HOG特征提取函数
%灰度化,input_image的size为(64,128,3),而hog算法处理的是位深度为8的图像,转换公式为GRAY=a*RED+b*GREEN+c*BLUE
input_img=rgb2gray(input_img);
%显示图像,实际运行过程中需要注释
% imshow(input_img);
%得到灰度化之后图像的尺寸,即64x128
[m n]=size(input_img);
%hog算法需要进行Gamma归一化,降低强光等影响
img=sqrt(double(input_img)); %伽马校正
%下面是求边缘
fy=[-1 0 1]; %定义竖直模板
fx=fy'; %定义水平模板
Iy=imfilter(img,fy,'replicate'); %竖直边缘
Ix=imfilter(img,fx,'replicate'); %水平边缘
Ied=sqrt(Ix.^2+Iy.^2); %边缘强度
Iphase=Iy./Ix; %边缘斜率,有些为inf,-inf,nan,其中nan需要再处理一下
%下面是求cell
step=8; %step*step个像素作为一个单元
orient=9; %方向直方图的方向个数
jiao=360/orient; %每个方向包含的角度数
Cell=cell(1,1); %所有的角度直方图,cell是可以动态增加的,所以先设了一个
ii=1;
jj=1;
for i=1:step:m %如果处理的m/step不是整数,最好是i=1:step:m-step
ii=1;
for j=1:step:n %注释同上
tmpx=Ix(i:i+step-1,j:j+step-1);
tmped=Ied(i:i+step-1,j:j+step-1);
tmped=tmped/sum(sum(tmped)); %局部边缘强度归一化
tmpphase=Iphase(i:i+step-1,j:j+step-1);
Hist=zeros(1,orient); %当前step*step像素块统计角度直方图,就是cell
for p=1:step
for q=1:step
if isnan(tmpphase(p,q))==1 %0/0会得到nan,如果像素是nan,重设为0
tmpphase(p,q)=0;
end
ang=atan(tmpphase(p,q)); %atan求的是[-90 90]度之间
ang=mod(ang*180/pi,360); %全部变正,-90变270
if tmpx(p,q)<0 %根据x方向确定真正的角度
if ang<90 %如果是第一象限
ang=ang+180; %移到第三象限
end
if ang>270 %如果是第四象限
ang=ang-180; %移到第二象限
end
end
ang=ang+0.0000001; %防止ang为0
Hist(ceil(ang/jiao))=Hist(ceil(ang/jiao))+tmped(p,q); %ceil向上取整,使用边缘强度加权
end
end
Hist=Hist/sum(Hist); %方向直方图归一化
Cell{ii,jj}=Hist; %放入Cell中
ii=ii+1; %针对Cell的y坐标循环变量
end
jj=jj+1; %针对Cell的x坐标循环变量
end
size(Cell);
size(Hist);
%下面是求feature,2*2个cell合成一个block,没有显式的求block
[m n]=size(Cell);
feature=cell(1,(m-1)*(n-1));
for i=1:m-1
for j=1:n-1
f=[];
f=[f Cell{i,j}(:)' Cell{i,j+1}(:)' Cell{i+1,j}(:)' Cell{i+1,j+1}(:)'];
feature{(i-1)*(n-1)+j}=f;
end
end
%到此结束,feature即为所求
% 下面是为了显示而写的
% l=length(feature);
% f=[];
% for i=1:l
% f=[f;feature{i}(:)'];
% end
% figure
% hist(f)
未完待续...