OpenCV中所有人脸识别的模型都是继承自FaceRecognizer这个基类,这个类提供了人脸识别算法的统一接口。
class FaceRecognizer : public Algorithm
{
public:
//! virtual destructor
virtual ~FaceRecognizer() {}
// Trains a FaceRecognizer.
virtual void train(InputArray src, InputArray labels) = 0;
// Updates a FaceRecognizer.
virtual void update(InputArrayOfArrays src, InputArray labels);
// Gets a prediction from a FaceRecognizer.
virtual int predict(InputArray src) const = 0;
// Predicts the label and confidence for a given sample.
virtual void predict(InputArray src, int &label, double &confidence) const = 0;
// Serializes this object to a given filename.
virtual void save(const string& filename) const;
// Deserializes this object from a given filename.
virtual void load(const string& filename);
// Serializes this object to a given cv::FileStorage.
virtual void save(FileStorage& fs) const = 0;
// Deserializes this object from a given cv::FileStorage.
virtual void load(const FileStorage& fs) = 0;
};
Algorithm所有的派生类都提供了一下功能:
人脸识别的一个常用情景是待识别人脸是不是输入训练数据集。这个阈值的设置是在具体的FaceRecognizer的构造器中,并通过从Algorithm继承的set和get方法来使用阈值。
创建模型时设置阈值
// Let's say we want to keep 10 Eigenfaces and have a threshold value of 10.0
int num_components = 10;
double threshold = 10.0;
// Then if you want to have a cv::FaceRecognizer with a confidence threshold,
// create the concrete implementation with the appropiate parameters:
Ptr model = createEigenFaceRecognizer(num_components, threshold);
运行程序时获取或设置阈值
// The following line reads the threshold from the Eigenfaces model:
double current_threshold = model->getDouble("threshold");
// And this line sets the threshold to 0.0:
model->set("threshold", 0.0);
将阈值设置为0.0,如果预测类别号为-1,则说明人脸时未知的,没有在数据库中记录
Mat img = imread("person1/3.jpg", CV_LOAD_IMAGE_GRAYSCALE);
// Get a prediction from the model. Note: We've set a threshold of 0.0 above,
// since the distance is almost always larger than 0.0, you'll get -1 as
// label, which indicates, this face is unknown
int predicted_label = model->predict(img);
函数定义:
void FaceRecognizer::train(InputArrayOfArrays src, InputArray labels) = 0
函数参数为训练的图片,类型为vector
函数定义:
void FaceRecognizer::update(InputArrayOfArrays src, InputArray labels)
该方法为更新一个模型(条件是给模型可以被更新,在OpenCV中提供的人脸识别算法中,只有LBP直方图的方法才可以被更新),更新和训练接口的区别是,训练是清空已有的模型,学习一个新的模型,而更新不会删除之前的模型数据。
函数定义:
int FaceRecognizer::predict(InputArray src) const = 0
void FaceRecognizer::predict(InputArray src, int& label, double& confidence) const = 0
第三个参数是对于预测类别的相关置信度。
const后缀表示predict函数不会影响模型内部状态,所以这个方法可以安全被不同线程调用。
下面的小例子是根据训练模型来进行预测。
using namespace cv;
// Do your initialization here (create the cv::FaceRecognizer model) ...
// ...
Mat img = imread("person1/3.jpg", CV_LOAD_IMAGE_GRAYSCALE);
// Some variables for the predicted label and associated confidence (e.g. distance):
int predicted_label = -1;
double predicted_confidence = 0.0;
// Get the prediction and associated confidence from the model
model->predict(img, predicted_label, predicted_confidence);
函数定义:
void FaceRecognizer::save(const string& filename) const
void FaceRecognizer::save(FileStorage& fs) const
第一个定义是根据XML或者YAML文件名来存储模型,第二个定义是将模型存成FileStorage实例。
函数定义:
void FaceRecognizer::load(const string& filename)
void FaceRecognizer::load(const FileStorage& fs) = 0
这里载入模型参数和save函数的参数意义一样。
Ptr createEigenFaceRecognizer(int num_components=0, double threshold=DBL_MAX);
Ptr createFisherFaceRecognizer(int num_components=0, double threshold=DBL_MAX);
Ptr createLBPHFaceRecognizer(int radius=1, int neighbors=8, int grid_x=8, int grid_y=8, double threshold=DBL_MAX);
这三个接口分别对应OpenCV的三个人脸识别算法,均返回一个智能指针Ptr类的实例。
这一小节,介绍了OpenCV中人脸识别功能对应的类FaceRecognizer的大体框架,介绍了相关接口和使用方法。在后面的博客,将具体以LBPH算法为例,介绍其原理和匹配源码。