项目需求:某市级组织考试,在考试前需审核考生采集表中的考生照片是否合格,由于要审核的考生信息采集表有很多,原先进行的是手动人工审核,比较费时费力,审核的要求也很简单,并不判断考生是否是图片本人(身份验证有另外一套程序来进行),只是看考生采集表中考生头像是否是人脸(是否存在辨识不清楚,不是人脸)。因此提出需求,看是否能用程序来检测考生信息采集表中的照片,只需找出来疑似不是人脸的考生所在文档位置(pdf文档)即可,存疑的考生再由人工进行审核。
PDF文档中有很多页,每一页都是如图中的结构。
经过百度摸索,采用了C#+WPF+Spire.PDF+Emgu CV+MvvmLight来进行人脸判断的技术选型。
Emgu CV(https://sourceforge.net/projects/emgucv/files/emgucv/)是.NET平台下对OpenCV图像处理库的封装,也就是.NET版的
OpenCV的全称是:Open Source Computer Vision Library。OpenCV是一个基于(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows和Mac OS操作系统上。Emgu CV官方带的有训练过的人脸识别模板,可以直接使用。
Spire.PDF可以来读取PDF文档,同时可以读取到PDF文档中的图片。
MvvmLight是WPF可以使用的一种MVVM模式的实现框架。
项目技术选型确定以后,下面就是代码的编写。
项目引用Emgu CV、Spire.PDF、MvvmLight
从官网下载Emgu CV后,我们把它项目中的haarcascade_eye.xml、haarcascade_frontalface_alt.xml两个训练过的人脸识别模板放到bin/debug下,供Emgu CV使用时调用。
引用MvvmLight后,会自动在项目中创建ViewModel目录,我们在此目录中新建一个Pdf2FaceInfoModel.cs类,用来做为检测结果的通知类。
using System.ComponentModel; namespace Pdf2Face.ViewModel { public class Pdf2FaceInfoModel : INotifyPropertyChanged { public event PropertyChangedEventHandler PropertyChanged; private string pdfName { get; set; } ////// Pdf文件名 /// public string PdfName { get => pdfName; set { pdfName = value; PropertyChanged?.Invoke(this,new PropertyChangedEventArgs("PdfName")); } } private int pdfImgCount { get; set; } = 0; ////// Pdf中图片数量 /// public int PdfImgCount { get => pdfImgCount; set { pdfImgCount = value; PropertyChanged?.Invoke(this, new PropertyChangedEventArgs("PdfImgCount")); } } private int pdfFaceCount { get; set; } = 0; ////// Pdf中人脸数量 /// public int PdfFaceCount { get => pdfFaceCount; set { pdfFaceCount = value; PropertyChanged?.Invoke(this, new PropertyChangedEventArgs("PdfFaceCount")); } } private string pdfFaceSuccess { get; set; } ="否"; ////// 数量相对是否存疑 0 正常 1存疑 /// public string PdfFaceSuccess { get => pdfFaceSuccess; set { pdfFaceSuccess = value; PropertyChanged?.Invoke(this, new PropertyChangedEventArgs("PdfFaceSuccess")); } } } }
主程序只有一个界面,界面两个按钮,一个用来选择要检测pdf所在文件夹,一个用来开始检测。
主程序代码:
using System; using System.Collections.Generic; using System.Collections.ObjectModel; using System.ComponentModel; using System.Drawing; using System.Drawing.Imaging; using System.IO; using System.Linq; using System.Threading; using System.Threading.Tasks; using System.Windows; using Emgu.CV; using Emgu.CV.Structure; using Microsoft.WindowsAPICodePack.Dialogs; using Pdf2Face.ViewModel; using Spire.Pdf; namespace Pdf2Face { ////// 人脸检测功能的交互逻辑 /// public partial class MainWindow : Window { private string _pdfDirPath; private readonly string _pdfFaceSaveDir; private readonly ObservableCollectionfacelist = new ObservableCollection (); public MainWindow() { InitializeComponent(); Thread.Sleep(10000); dataGrid.ItemsSource = facelist; _pdfFaceSaveDir = $"{AppDomain.CurrentDomain.BaseDirectory}face"; if (!Directory.Exists(_pdfFaceSaveDir)) { Directory.CreateDirectory(_pdfFaceSaveDir); } } /// /// 选择Pdf所在目录 /// /// /// private void BtnChooseDir_OnClick(object sender, RoutedEventArgs e) { using (var folderBrowser = new CommonOpenFileDialog()) { folderBrowser.IsFolderPicker = true; folderBrowser.Multiselect = false; folderBrowser.Title = "选择考生照片所在文件夹"; if (folderBrowser.ShowDialog(GetWindow(this)) != CommonFileDialogResult.Ok) return; _pdfDirPath = folderBrowser.FileName; txtBlockPath.Text = _pdfDirPath; } } ////// 人脸识别检测 /// /// /// private void BtnCheck_OnClick(object sender, RoutedEventArgs e) { if (string.IsNullOrEmpty(_pdfDirPath) || !Directory.Exists(_pdfDirPath)) { MessageBox.Show("目录无法访问。", "错误", MessageBoxButton.OK, MessageBoxImage.Error); return; } var pdfs = FileSearch(_pdfDirPath, "*.pdf", SearchOption.AllDirectories, x => x.Length > 6); if (pdfs.Length == 0) { MessageBox.Show("指定的目录中没有发现PDF文件。", "错误", MessageBoxButton.OK, MessageBoxImage.Information); return; } txtBlockInfo.Text = $"Pdf文件数量{pdfs.Length}"; var doc = new PdfDocument(); Dispatcher?.InvokeAsync(async () => { await Task.Run(() => { foreach (var pdf in pdfs) { doc.LoadFromFile(pdf); var pagenum = 1; foreach (PdfPageBase page in doc.Pages) { var newPdfFaceSaveDir = $"{_pdfFaceSaveDir}\\{pdf.Substring(pdf.LastIndexOf('\\') + 1)}"; if (page.ExtractImages() != null) { if (!Directory.Exists(newPdfFaceSaveDir)) { Directory.CreateDirectory(newPdfFaceSaveDir); } var images = new List(); var model = new Pdf2FaceInfoModel { PdfName = $"{pdf.Substring(pdf.LastIndexOf('\\') + 1)}_第{pagenum}页" }; Dispatcher?.Invoke(() => { facelist.Add(model); }); var c = 0; foreach (var image in page.ExtractImages()) { images.Add(image); var filename = $"{newPdfFaceSaveDir}\\{pagenum}_{c}.png"; image.Save(filename, ImageFormat.Png); #region 人脸判断 //检测是否是人脸 //如果支持用显卡,则用显卡运算 CvInvoke.UseOpenCL = CvInvoke.HaveOpenCLCompatibleGpuDevice; //构建级联分类器,利用已经训练好的数据,识别人脸 var face = new CascadeClassifier("haarcascade_frontalface_alt.xml"); var eyes = new CascadeClassifier("haarcascade_eye.xml"); //加载要识别的图片 var img = new Image (filename); var img2 = new Image (img.ToBitmap()); //把图片从彩色转灰度 CvInvoke.CvtColor(img, img2, Emgu.CV.CvEnum.ColorConversion.Bgr2Gray); //亮度增强 CvInvoke.EqualizeHist(img2, img2); //返回的是人脸所在的位置和大小 var facesDetected = face.DetectMultiScale(img2, 1.1, 10, new System.Drawing.Size(50, 50)); if (facesDetected.Length > 0) { model.PdfFaceCount += facesDetected.Length; model.PdfFaceSuccess = facesDetected.Length > 1 ? "是" : "否"; //删除图片,留下的都是无法正确识别的 try { File.Delete(filename); } catch (Exception exception) { // } } img.Dispose(); img2.Dispose(); face.Dispose(); #endregion c += 1; } model.PdfImgCount = images.Count; } pagenum += 1; } doc.Close(); } }); }); } private string[] FileSearch(string directoryPath, string searchFilter, SearchOption option, Func func) { if (!Directory.Exists(directoryPath)) return null; var s = Directory.GetFiles(directoryPath, searchFilter, option).Where(func).ToArray(); return s; } private void MainWindow_OnClosing(object sender, CancelEventArgs e) { Application.Current.Shutdown(0); } } }
程序运行效果: