【opencv实践】人脸识别匹配——模型训练

本文由@星沉阁冰不语出品,转载请注明作者和出处。

文章链接:http://blog.csdn.net/xingchenbingbuyu/article/details/51407336

在之前的博客人脸识别之一数据收集和预处理之中,已经下载了ORL人脸数据库,并且为了识别自己的人脸写了一个拍照程序自拍。之后对拍的照片进行人脸识别和提取,最后我们得到了一个包含自己的人脸照片的文件夹s41。在博客的最后我们提到了一个非常重要的文件——at.txt。

一、csv文件的生成

当我们写人脸模型的训练程序的时候,我们需要读取人脸和人脸对应的标签。直接在数据库中读取显然是低效的。所以我们用csv文件读取。csv文件中包含两方面的内容,一是每一张图片的位置所在,二是每一个人脸对应的标签,就是为每一个人编号。这个at.txt就是我们需要的csv文件。生成之后它里面是这个样子的:

【opencv实践】人脸识别匹配——模型训练_第1张图片

前面是图片的位置,后面是图片所属人脸的人的标签。

要生成这样一个文件直接用手工的方式一个一个输入显然不可取的,毕竟这里有400多张图片。而且这种重复性的工作估计也没人想去做。所以我们可以用命令行的方式简化工作量;或者用OpenCV自带的Python脚本来自动生成。

命令行方式是这样的。比如我的数据集在C:\Users\bingbuyu\Downloads\att_faces文件夹下面,我就用下面两行命令:

【opencv实践】人脸识别匹配——模型训练_第2张图片

然后数据集文件夹下面就多出了一个at.txt文件,但是现在是只有路径没有标签的。像下面这样:

【opencv实践】人脸识别匹配——模型训练_第3张图片

标签需要手动敲上去。。。也挺麻烦的。

好在opencv教程里面为我们提供了自动生成csv文件的脚本。路径类似这样:F:\opencv\sources\modules\contrib\doc\facerec\src\create_csv.py。我不知道怎么用命令行参数的形式运行Python脚本。

用这个和大神的代码都没有实现,自己想了一个办法,非常简单,大家可以用这个方法来实现。先生成at.txt,接下来对它进行更改就可以了。代码如下:(按照自己的文件目录更改)

#include
#include
#include
using namespace std;

int main()
{

    ofstream in;
    in.open("at.txt",ios::trunc);
    for(int i=1;i<=23;i++)
       for(int j=1;j<=9;j++)
          in<<"C:\\Users\\bingbuyu\\Downloads\\att_faces\\s"<"\\"<".jpg;"<"\n";
    in.close();

    return 0;
}

然后运行这个脚本就可以生成一个既有路径又有标签的at.txt了。

在这个过程中途换了图片,本来以为不影响生成的路径标签,结果。。程序报错,重新生成后就好了。大家注意一下这个问题!

二、训练模型

现在数据集、csv文件都已经准备好了。接下来要做的就是训练模型了。

这里我们用到了opencv的Facerecognizer类。opencv中所有的人脸识别模型都是来源于这个类,这个类为所有人脸识别算法提供了一种通用的接口。文档里的一个小段包含了我们接下来要用到的几个函数:

OpenCV 自带了三个人脸识别算法:Eigenfaces,Fisherfaces 和局部二值模式直方图 (LBPH)。这里先不去深究这些算法的具体内容,直接用就是了。如果有兴趣可以去看相关论文。接下来就分别训练这三种人脸模型。这个时候就能体现出Facerecognizer类的强大了。因为每一种模型的训练只需要三行代码:

    Ptr<FaceRecognizer> model = createEigenFaceRecognizer();  
    model->train(images, labels);  
    model->save("MyFacePCAModel.xml");  

    Ptr<FaceRecognizer> model1 = createFisherFaceRecognizer();  
    model1->train(images, labels);  
    model1->save("MyFaceFisherModel.xml");  

    Ptr<FaceRecognizer> model2 = createLBPHFaceRecognizer();  
    model2->train(images, labels);  
    model2->save("MyFaceLBPHModel.xml");  

当然在这之前要先把之前图片和标签提取出来。这时候就是at.txt派上用场的时候了。

    //使用CSV文件去读图像和标签,主要使用stringstream和getline方法  
    static void read_csv(const string& filename, vector& images, vector<int>& labels, char separator = ';') {  
        std::ifstream file(filename.c_str(), ifstream::in);  
        if (!file) {  
            string error_message = "No valid input file was given, please check the given filename.";  
            CV_Error(CV_StsBadArg, error_message);  
        }  
        string line, path, classlabel;  
        while (getline(file, line)) {  
            stringstream liness(line);  
            getline(liness, path, separator);  
            getline(liness, classlabel);  
            if (!path.empty() && !classlabel.empty()) {  
                images.push_back(imread(path, 0));  
                labels.push_back(atoi(classlabel.c_str()));  
            }  
        }  
    }  

在模型训练好之后我们拿数据集中的最后一张图片做一个测试,看看结果如何。

    Mat testSample = images[images.size() - 1];  
        int testLabel = labels[labels.size() - 1];  

    "white-space:pre">    //。。。。这里省略部分代码。。。。。。。。  
        // 下面对测试图像进行预测,predictedLabel是预测标签结果  
        int predictedLabel = model->predict(testSample);  
        int predictedLabel1 = model1->predict(testSample);  
        int predictedLabel2 = model2->predict(testSample);  

        // 还有一种调用方式,可以获取结果同时得到阈值:  
        //      int predictedLabel = -1;  
        //      double confidence = 0.0;  
        //      model->predict(testSample, predictedLabel, confidence);  

        string result_message = format("Predicted class = %d / Actual class = %d.", predictedLabel, testLabel);  
        string result_message1 = format("Predicted class = %d / Actual class = %d.", predictedLabel1, testLabel);  
        string result_message2 = format("Predicted class = %d / Actual class = %d.", predictedLabel2, testLabel);  
        cout << result_message << endl;  
        cout << result_message1 << endl;  
        cout << result_message2 << endl;  



由于本来的数据集中是40个人,加上自己的人脸集就是41个。标签是从0开始标的,所以在这里我是第40个人。也即是说Actual class应该40。Predicted class也应该是40才说明预测准确。这里我们可以看到结果:

【opencv实践】人脸识别匹配——模型训练_第4张图片

结果正确。

模型训练的全部代码:

    //#include "stdafx.h"  
    #include   
    #include   
    #include   
    #include   
    #include   

    using namespace cv;  
    using namespace std;  

    static Mat norm_0_255(InputArray _src) {  
        Mat src = _src.getMat();  
        // 创建和返回一个归一化后的图像矩阵:  
        Mat dst;  
        switch (src.channels()) {  
        case1:  
            cv::normalize(_src, dst, 0, 255, NORM_MINMAX, CV_8UC1);  
            break;  
        case3:  
            cv::normalize(_src, dst, 0, 255, NORM_MINMAX, CV_8UC3);  
            break;  
        default:  
            src.copyTo(dst);  
            break;  
        }  
        return dst;  
    }  

    //使用CSV文件去读图像和标签,主要使用stringstream和getline方法  
    static void read_csv(const string& filename, vector& images, vector<int>& labels, char separator = ';') {  
        std::ifstream file(filename.c_str(), ifstream::in);  
        if (!file) {  
            string error_message = "No valid input file was given, please check the given filename.";  
            CV_Error(CV_StsBadArg, error_message);  
        }  
        string line, path, classlabel;  
        while (getline(file, line)) {  
            stringstream liness(line);  
            getline(liness, path, separator);  
            getline(liness, classlabel);  
            if (!path.empty() && !classlabel.empty()) {  
                images.push_back(imread(path, 0));  
                labels.push_back(atoi(classlabel.c_str()));  
            }  
        }  
    }  


    int main()   
    {  

        //读取你的CSV文件路径.  
        //string fn_csv = string(argv[1]);  
        string fn_csv = "at.txt";  

        // 2个容器来存放图像数据和对应的标签  
        vector images;  
        vector<int> labels;  
        // 读取数据. 如果文件不合法就会出错  
        // 输入的文件名已经有了.  
        try  
        {  
            read_csv(fn_csv, images, labels);  
        }  
        catch (cv::Exception& e)  
        {  
            cerr << "Error opening file \"" << fn_csv << "\". Reason: " << e.msg << endl;  
            // 文件有问题,我们啥也做不了了,退出了  
            exit(1);  
        }  
        // 如果没有读取到足够图片,也退出.  
        if (images.size() <= 1) {  
            string error_message = "This demo needs at least 2 images to work. Please add more images to your data set!";  
            CV_Error(CV_StsError, error_message);  
        }  

        // 下面的几行代码仅仅是从你的数据集中移除最后一张图片  
        //[gm:自然这里需要根据自己的需要修改,他这里简化了很多问题]  
        Mat testSample = images[images.size() - 1];  
        int testLabel = labels[labels.size() - 1];  
        images.pop_back();  
        labels.pop_back();  
        // 下面几行创建了一个特征脸模型用于人脸识别,  
        // 通过CSV文件读取的图像和标签训练它。  
        // T这里是一个完整的PCA变换  
        //如果你只想保留10个主成分,使用如下代码  
        //      cv::createEigenFaceRecognizer(10);  
        //  
        // 如果你还希望使用置信度阈值来初始化,使用以下语句:  
        //      cv::createEigenFaceRecognizer(10, 123.0);  
        //  
        // 如果你使用所有特征并且使用一个阈值,使用以下语句:  
        //      cv::createEigenFaceRecognizer(0, 123.0);  

        Ptr model = createEigenFaceRecognizer();  
        model->train(images, labels);  
        model->save("MyFacePCAModel.xml");  

        Ptr model1 = createFisherFaceRecognizer();  
        model1->train(images, labels);  
        model1->save("MyFaceFisherModel.xml");  

        Ptr model2 = createLBPHFaceRecognizer();  
        model2->train(images, labels);  
        model2->save("MyFaceLBPHModel.xml");  

        // 下面对测试图像进行预测,predictedLabel是预测标签结果  
        int predictedLabel = model->predict(testSample);  
        int predictedLabel1 = model1->predict(testSample);  
        int predictedLabel2 = model2->predict(testSample);  

        // 还有一种调用方式,可以获取结果同时得到阈值:  
        //      int predictedLabel = -1;  
        //      double confidence = 0.0;  
        //      model->predict(testSample, predictedLabel, confidence);  

        string result_message = format("Predicted class = %d / Actual class = %d.", predictedLabel, testLabel);  
        string result_message1 = format("Predicted class = %d / Actual class = %d.", predictedLabel1, testLabel);  
        string result_message2 = format("Predicted class = %d / Actual class = %d.", predictedLabel2, testLabel);  
        cout << result_message << endl;  
        cout << result_message1 << endl;  
        cout << result_message2 << endl;  

        waitKey(0);  
        return 0;  
    }  

生成的文件如下:

【opencv实践】人脸识别匹配——模型训练_第5张图片

你可能感兴趣的:(opencv实践,opencv,脸部识别)