C#人脸识别入门篇--提取人脸特征值及人脸识别

如何识别多个人脸

在开始之前,先解决一个疑问,这个SDK可以识别多个人脸吗。答案当然是可以的。在上一章节中我们实现了识别单个人脸的功能。
如果要识别多个人脸,需要进行下面的设置。

定义人脸的识别数目范围

   int nMaxFaceNum = 50;/*定义人脸识别的数目,有效范围为1-50*/

修改人脸识别的程序。

在上一章节中, 我们的方法是只取到识别到的第一个人脸,因此我们只需要一个显示人脸的地方就可以了。要识别多个人脸,首先就是修改视图。

C#人脸识别入门篇--提取人脸特征值及人脸识别_第1张图片
界面截图

然后,修改程序为循环。


//识别每一幅图像

for (int i = 0; i < faceRes.nFace; i++)
{
    MRECT rect = (MRECT)Marshal.PtrToStructure(faceRes.rcFace + Marshal.SizeOf(typeof(MRECT)) * i, typeof(MRECT));

   Image image = CutFace(bitmap, rect.left, rect.top, rect.right - rect.left, rect.bottom - rect.top);


   if (i == 0)
   {
    /*第一个识别到的人脸保存在原位置*/
       this.pictureBox2.Image = image;
        this.pictureBox2.Tag = faceImageName[i];
    }
   else
   {
        /*后面识别到的人脸按顺序并排显示在下面,使用临时创建PictureBox控件的方式显示图片内容*/


       PictureBox tempPicture = new PictureBox();
       tempPicture.Width = 100;
       tempPicture.Height = 120;
       tempPicture.SizeMode = PictureBoxSizeMode.Zoom;
       tempPicture.Location = new System.Drawing.Point(10 + ((i-1) % 7) * 120, 10 + ((i-1) / 7) * 120);
       tempPicture.Image = image;
       tempPicture.Tag =faceImageName[i];
       this.panel1.Controls.Add(tempPicture);
   }

一步步实现人脸识别

先来看一下我们这节的效果

C#人脸识别入门篇--提取人脸特征值及人脸识别_第2张图片
效果图

本节我们主要讲解如何根据识别到的人脸信息提取人脸数据特征,并在此基础上讲解一下如何做人脸识别

在人脸识别领域,首先是检测是否有人脸,人脸的区域是哪里,然后对这个区域进行特征点提取,在提取结束后,告诉计算机,这个人脸是谁。

C#人脸识别入门篇--提取人脸特征值及人脸识别_第3张图片
image

计算机把这些特征信息和人脸的名称保存下来,就形成了人脸库,在识别人脸时,计算机通过一定的算法,检索库中是否有匹配到的人脸结果,给出相似度数据。当人脸的相似度数据达到一定的数值时,就可以认为同一张人脸。

相似度通常是一个0-1的小数。一般来说,数值越大,表示两个人越相近。

注:不同人脸引擎的人脸相似度不具有可比性,例如,我们从Face ++ 拿到的同一个人的人脸相似度可能会在0.8-0.9,虹软的只能在0.6-0.8之间,这并不能说明Face ++ ,它们只是算法的标准不同,例如,虹软在不同人脸0.1-0.2的时候,Face++达到了0.3-0.5
人脸检测并建立人脸库的过程如下

C#人脸识别入门篇--提取人脸特征值及人脸识别_第4张图片
建立人脸库

通过人脸检测或者人脸跟踪,获取到人脸信息并识别人脸的过程如下:

C#人脸识别入门篇--提取人脸特征值及人脸识别_第5张图片
从人脸库中识别

本次教程我们以目录结构作为人脸的存档方式,每张人脸对应一张人脸标识和一个人脸特征。人脸标识和特征使用同一个文件名称来关联,例如人脸a.jpg的特征用a.dat来表示。

好,我们开始我们的课程

集成人脸识别SDK库

我们本次使用到的虹软的SDK包中,提供了人脸识别的库,它的名字叫face_recongnition.dll,我们找到它的SDK文档。
来建立各个结构体和API的C#映射。

首先是结构体

从本节开始,我们不再讲解原始SDK文档中的数据结构和C#数组结构如何映射的,也不再讲解P/Invoke的知识,如果需要了解相关知识,请参考我们上篇文档的相关内容。

AFR_FSDK_FaceInput

    public struct AFR_FSDK_FaceInput
    {
        public  MRECT rcFace;
        public int lOrient;
    }

这个结构体是FD识别的输出结构体,我们在上一章节标记人脸时使用了此结构体。

AFR_FSDK_FaceModel

  public  struct AFR_FSDK_FaceModel
    {
     public IntPtr pbFeature;
     public int lFeatureSize;
    }

这个结构体是人脸模型数据,也就是我们说的人脸特征。人脸识别就基于这个结构。

参数名 说明
pbFeature 提取到的脸部特征
lFeatureSize 特征信息长度

其中pbFeature是人脸数据,虹软当前版本的人脸数据为一个20K大小的二进制数组,在使用时,我们把它保存为byte[]数组。

AFR_FSDK_Version

   public struct AFR_FSDK_Version
    {
      
        public int lCodebase;
        public int lMajor;
        public int lMinor;
        public int lBuild;
        public int lFeatureLevel;
        public string Version;
        public string BuildDate;
        public string CopyRight;
    }

定义识别方法类

我们将SDK中的对应方法提取到C#类中,和上面的章节保持一致,我们称之为AFRFunction。

   public class AFRFunction
    {
       /**
        *Init Engine 
        */
       [System.Runtime.InteropServices.DllImportAttribute("libarcsoft_fsdk_face_recognition.dll", EntryPoint = "AFR_FSDK_InitialEngine", CallingConvention = CallingConvention.Cdecl)]
       public static extern int AFR_FSDK_InitialEngine(string AppId, string SDKKey,  System.IntPtr pMem, int lMemSize, ref System.IntPtr phEngine);

        /**
        * 提取人脸特征值
        */
       [System.Runtime.InteropServices.DllImportAttribute("libarcsoft_fsdk_face_recognition.dll", EntryPoint = "AFR_FSDK_ExtractFRFeature", CallingConvention = CallingConvention.Cdecl)]
       public static extern int AFR_FSDK_ExtractFRFeature(System.IntPtr hEngine,  System.IntPtr pInputImage,  System.IntPtr pFaceRes, System.IntPtr pFaceModels);

        /*
        * 比较两个人脸特征值之间的相似度
        **/
       [System.Runtime.InteropServices.DllImportAttribute("libarcsoft_fsdk_face_recognition.dll", EntryPoint = "AFR_FSDK_FacePairMatching", CallingConvention = CallingConvention.Cdecl)]
       public static extern int AFR_FSDK_FacePairMatching(System.IntPtr hEngine, ref System.IntPtr reffeature, ref System.IntPtr probefeature, ref float pfSimilScore);


        /**
        *销毁引擎
        */
       [System.Runtime.InteropServices.DllImportAttribute("libarcsoft_fsdk_face_recognition.dll", EntryPoint = "AFR_FSDK_UninitialEngine", CallingConvention = CallingConvention.Cdecl)]
       public static extern int AFR_FSDK_UninitialEngine(System.IntPtr hEngine);


        /**
        *获取人脸的版本号
        */

       [System.Runtime.InteropServices.DllImportAttribute("libarcsoft_fsdk_face_recognition.dll", EntryPoint = "AFR_FSDK_GetVersion", CallingConvention = CallingConvention.Cdecl)]
       public static extern System.IntPtr AFR_FSDK_GetVersion(System.IntPtr hEngine);

   
   }

开始之前的准备

定义人脸库的位置

本次我们使用简单的基于目录存储人脸库

 private String FaceLibraryPath = "G:\\Test\\";

定义人脸识别引擎的变量

IntPtr detectEngine = IntPtr.Zero;
//新增人脸识别引擎的定义
IntPtr recognizeEngine = IntPtr.Zero;

在构造函数中我们对人脸识别引擎进行初始化

int detectSize = 40 * 1024 * 1024;
int nScale = 50;
int nMaxFaceNum = 50;
IntPtr pMem = Marshal.AllocHGlobal(detectSize);
IntPtr pMemRecongnize = Marshal.AllocHGlobal(detectSize);

注意:detectSize为人脸识别的内存大小,一般来说,你可以根据你的应用程序的规模来设置一个适当的数值,数值过小会报内存不足的ERROR。

int retCode2 = AFR.AFRFunction.AFR_FSDK_InitialEngine(appId, sdkFRKey, pMemRecongnize, detectSize, ref recognizeEngine);


 if (retCode2 != 0)
{
    MessageBox.Show("引擎FR初始化失败:错误码为:" + retCode2);
    this.Close();
}

这里需要注意FR Key,虹软这次开源了1:1和1:N的SDK,不同的SDK,其对应的KEY是不一样的。

提取人脸特征值

我们来提取人脸特征值。打开我们的checkAndMarkFace方法。

人脸特征值是一个二进制的byte数组,其内容对虹软来说是属于技术机密,里面保存了人脸的特征。这里的特征可以在人脸相似度比较时用到,人脸的特征包含了人脸的关键点信息。可惜的是,虹软这方面并没有开源。同样的,人脸的相似度比较算法也没有开源。不过不开源也有不开源的好处,至少我们用起来不用担心这里面的细节。

首先,我们定义一个变量数组,用于保存图片名称的数组。 这里我们简单的对每个识别到的人脸,用GUID命名。

在我们上一节的,输出识别到的人脸数据之前,我们增加一下我们的业务逻辑。找到下面的代码

if (faceRes.nFace > 0)

我们在后面增加定义

//定义用到保存识别到的图片的名称的数组
List faceImageName = new List(faceRes.nFace);

for (int i = 0; i < faceRes.nFace; i++)
{
    faceImageName.Add(Guid.NewGuid().ToString());
}

在识别到的每个人脸以后,我们把识别到的人脸保存下来

Image image = CutFace(bitmap, rect.left, rect.top, rect.right - rect.left, rect.bottom - rect.top);

image.Save(FaceLibraryPath+faceImageName[i]+".jpg",ImageFormat.Jpeg);

如何进行人脸特征值的读取

人脸特征值依赖于人脸识别的结果,其原理是利用识别到的人脸区域信息,在原图中对人脸部分进行运算,输出人脸的特征数据。
通过前面的定义,可以知道人脸特征提取函数的需要的参数信息如下

  • recognizeEngine:人脸识别引擎
  • offInputPtr:输入的图像信息,和FD的信息相同。同为ASVLOFFSCREEN结构体,我们可以直接使用上一步已经定义好的这个变量。
  • faceInputPtr:人脸区域信息,包括人脸的角度信息,以及人脸的坐标范围,对应的参数类型为MRECT,也就是在FD中识别到的人脸的区域坐标,
  • 输出参数为faceModel结构体。包括长度信息和人脸特征数组

我们来一步步解决。

定义faceInput结构体并指定它的引用互操作类型

AFR_FSDK_FaceInput faceinput = new AFR_FSDK_FaceInput();
faceinput.lOrient =(int)Marshal.PtrToStructure( faceRes.lfaceOrient,typeof(int));
  
MRECT rect = (MRECT)Marshal.PtrToStructure(faceRes.rcFace + Marshal.SizeOf(typeof(MRECT)) * i, typeof(MRECT));
faceinput.rcFace = rect;

IntPtr faceInputPtr = Marshal.AllocHGlobal(Marshal.SizeOf(faceinput));
                Marshal.StructureToPtr(faceinput, faceInputPtr, false);

定义faceModel变量用于保存识别到的特征值信息

AFR_FSDK_FaceModel faceModel = new AFR_FSDK_FaceModel();
IntPtr faceModelPtr = Marshal.AllocHGlobal(Marshal.SizeOf(faceModel));

调用FR引擎进行特征信息提取

   int ret = AFRFunction.AFR_FSDK_ExtractFRFeature(recognizeEngine, offInputPtr, faceInputPtr,
                        faceModelPtr);

如果ret=0,则提取成功,我们再调用Marshal的方法将对应的信息取出来

faceModel = (AFR_FSDK_FaceModel) Marshal.PtrToStructure(faceModelPtr, typeof (AFR_FSDK_FaceModel));
Marshal.FreeHGlobal(faceModelPtr);



byte[] featureContent = new byte[faceModel.lFeatureSize];
Marshal.Copy(faceModel.pbFeature, featureContent, 0, faceModel.lFeatureSize);

保存获取到的结果,为了后面的匹配方便,和图片命名保持一致

System.IO.File.WriteAllBytes(FaceLibraryPath+faceImageName[i]+".dat",featureContent);

通过图像库识别图像中的特征

现在我们要做的是人脸识别功能呢,我们想要的功能是,打开一张照片,如果里面有人脸,那么我们就识别这个人脸是否已经在我们的人脸库中出现过,如果已经出现 ,就显示人脸的图像编号。

依然打开项目,增加一个按钮。识别人脸,并增加一个pictureBox用于保存匹配到的人脸的对应的人脸信息。双击刚才新加的按钮进入事件处理代码编辑窗口。

为了不增加重新提取特征脸的工作量,我们将上一步获取到的特征脸重用。在上一步中,对识别到的人脸的第一个保存在了pictureBox中,并把相关的特征信息保存在对应命名的dat文件中。在保存时,使用

         this.pictureBox2.Tag = faceImageName[i];

保存图像特征数据的文件名,因此在这里我们使用

string faceFeaturePath = pictureBox2.Tag as string;

获取图像文件名。

这里我们需要读文件,读取这个特征信息。

C# 读取二进制文件和写二进制文件都相当的方便,你可以使用C#的序列化操作把变量保为dat文件,然后使用反操作把文件重新读取以初始化对象。这里使用的是简单的二进制读取的方法,当然你也可以尝试序列化来完成这个操作。

byte[] sourceFeature = System.IO.File.ReadAllBytes(FaceLibraryPath + faceFeaturePath + ".dat");

接下来我们要使用人脸匹配的方法来进行匹配。这里使用的方法是AFR_FSDK_FacePairMatching
方法。再来看一下这个方法的定义

参数名称 输入输出 说明
hEngine [in] 引擎 handle
reffeature [in] 已有脸部特征信息
probefeature [in] 被比较的脸部特征信息
pfSimilScore [out] 相似程度数值

我们先来定义被比较的脸部信息。这里原来的参数名称有点拗口,我们使用localFaceModel来定义本地的

AFR_FSDK_FaceModel localFaceModels = new AFR_FSDK_FaceModel();
IntPtr sourceFeaturePtr = Marshal.AllocHGlobal(sourceFeature.Length);
Marshal.Copy(sourceFeature, 0, sourceFeaturePtr, sourceFeature.Length);
localFaceModels.lFeatureSize = sourceFeature.Length;
localFaceModels.pbFeature = sourceFeaturePtr;

由于使用了文件保存人脸特征信息,因此我们的人脸遍历算法就变得很简单了。我们这里使用1:1的方法。

我们直接使用存储的人脸信息来进行搜索,方法自然是先遍历读取所有特征数据,提取特征值并进行比较

     foreach (var b in System.IO.Directory.GetFiles(FaceLibraryPath,"*.dat"))
                {
                    byte[] libaryFeature = System.IO.File.ReadAllBytes(b);
                    float result=0f;

                    //TODO:构造AFR_FSDK_FaceModel,调用API,获取比较结果

                    if (result>0.7&&result<0.99)
                    {
                        //  MessageBox.Show(b);

                        Image image = Image.FromFile(b.Replace(".dat",".jpg"));

                        this.pictureBox3.Image = new Bitmap(image);
                        MessageBox.Show(result.ToString());
                        break;

                    }
                }

我们来完成TODO的部分
首先我们定义库Model和本地Model的结构体指针
定义库的指针

IntPtr libaryFeaturePtr = Marshal.AllocHGlobal(libaryFeature.Length);

Marshal.Copy(libaryFeature, 0, libaryFeaturePtr, libaryFeature.Length);

AFR_FSDK_FaceModel libraryFaceModel = new AFR_FSDK_FaceModel();

libraryFaceModel.lFeatureSize = libaryFeature.Length;

libraryFaceModel.pbFeature = libaryFeaturePtr;
IntPtr firstPtr = Marshal.AllocHGlobal(Marshal.SizeOf(localFaceModels));

Marshal.StructureToPtr(localFaceModels, firstPtr, false);

定义本地Model的指针

IntPtr firstPtr = Marshal.AllocHGlobal(Marshal.SizeOf(localFaceModels));

Marshal.StructureToPtr(localFaceModels, firstPtr, false);

调用方法输出匹配结果

int ret = AFRFunction.AFR_FSDK_FacePairMatching(recognizeEngine, firstPtr, secondPtr, ref result);

从这里可以看出,人脸识别并没有特别高深的地方,其基础理论依然是特征值匹配搜索的理论,
虽然这里面的难点是特征值的提取和匹配算法,但因为虹软已经免费给我们提供了对应的SDK,我们只需要调用相关的接口就可能了。如果要提高人脸匹配的速度,除了可以联系虹软寻找技术支持以外,也可以利用我们在其它算法方面的积累来尝试解决方案。

后记

本次我们学习了人脸特征的提取和人脸特征的保存,实际上,在业务系统中,人脸通常是保存在数据库中的,并且在匹配的时候,为了性能考虑,更多的是把特征保存在内存中,20K的特征值如果在2GB的业务系统中,可以很轻松的保存10W+的特征信息。人脸检测和识别是CPU密集型和内存密集型的应用,保持良好的计算机配置有助于提高识别的性能,离线SDK的良好扩展性也为我们提高系统的性能提供了可行性。

这两章节都是从静态图像出发的人脸检测和人脸识别,从下一章节开始,我们将先从视频的人脸识别讲起。然后结合摄像头的实时图像采集,我们来讲解一下简单的人脸识别门禁系统的实现。请继续关注。

你可能感兴趣的:(C#人脸识别入门篇--提取人脸特征值及人脸识别)