基于Python+OpenCV的人脸口罩识别检测

以下编程在Jupyter notbook平台上进行

目录

  • 一、OpenCV下载安装
  • 二、人脸口罩数据集下载处理
    • (一)人脸口罩数据集下载
    • (二)人脸口罩数据集的处理
  • 三、训练人脸口罩数据集模型
  • 四、进行人脸口罩检测

一、OpenCV下载安装

参考网址:
https://blog.csdn.net/cungudafa/article/details/84451066

二、人脸口罩数据集下载处理

(一)人脸口罩数据集下载

下载人脸口罩数据集的目的是利用OpenCV进行模型训练,这里采用口罩数据集的正负比列为1:3,即500张戴口罩的人脸图片和1500张不戴口罩的人脸图片。
链接:https://pan.baidu.com/s/11PBCmDDx7Dtx_ckjwZR2uw
提取码:n2um
解压之后,将压缩包中的mask文件自行选择文件夹放置,以便之后的操作。
基于Python+OpenCV的人脸口罩识别检测_第1张图片

(二)人脸口罩数据集的处理

1、将数据集重命名为连续序列
因为数据集中的图片序列是不连续的,因此这里需要编程将数据集的正负样本重命名为连续序列,以便像素调整。
重命名正样本序列Python代码:

#对数据集重命名
#coding:utf-8
import os
path = "D:\\facemask\\mask\\have_mask" #人脸口罩数据集正样本的路径
filelist = os.listdir(path)
count=1000 #开始文件名1000.jpg
for file in filelist:   
    Olddir=os.path.join(path,file)  
    if os.path.isdir(Olddir):  
        continue
    filename=os.path.splitext(file)[0]   
    filetype=os.path.splitext(file)[1]
 
    Newdir=os.path.join(path,str(count)+filetype)  
    os.rename(Olddir,Newdir)
    count+=1

命名之后,正样本序列如下:
基于Python+OpenCV的人脸口罩识别检测_第2张图片
重命名负样本序列Python代码:

#对数据集重命名
#coding:utf-8
import os
path = "D:\\facemask\\mask\\no_mask" #人脸口罩数据集的路径
filelist = os.listdir(path)
count=10000 #开始文件名1000.jpg
for file in filelist:   
    Olddir=os.path.join(path,file)  
    if os.path.isdir(Olddir):  
        continue
    filename=os.path.splitext(file)[0]   
    filetype=os.path.splitext(file)[1]
 
    Newdir=os.path.join(path,str(count)+filetype)  
    os.rename(Olddir,Newdir)
    count+=1

重命名之后,负样本序列如下:
基于Python+OpenCV的人脸口罩识别检测_第3张图片
2、正负样本数据集像素处理

正样本数据集的像素最佳设为20x20,这样的模型训练精度更高;负样本数据集像素不低于50x50,这样处理可以加快模型训练的速度。
修改正样本数据集像素为20x20Python代码:

#修改正样本像素
import pandas as pd
import cv2
for n in range(1000,1606):#代表正数据集中开始和结束照片的数字
    path='D:\\facemask\\mask\\have_mask\\'+str(n)+'.jpg'
    # 读取图片
    img = cv2.imread(path)
    img=cv2.resize(img,(20,20)) #修改样本像素为20x20
    cv2.imwrite('D:\\facemask\\mask\\have_mask\\' + str(n) + '.jpg', img)
    n += 1

修改像素之后,序列如下:
基于Python+OpenCV的人脸口罩识别检测_第4张图片
修改负样本数据集像素为80x80Python代码:

#修改负样本像素
import pandas as pd
import cv2
for n in range(10000,11790):#代表负样本数据集中开始和结束照片的数字
    path='D:\\facemask\\mask\\no_mask\\'+str(n)+'.jpg'
    # 读取图片
    img = cv2.imread(path)
    img=cv2.resize(img,(80,80)) #修改样本像素为60x60
    cv2.imwrite('D:\\facemask\\mask\\no_mask\\' + str(n) + '.jpg', img)
    n += 1

修改像素之后,序列如下:
基于Python+OpenCV的人脸口罩识别检测_第5张图片
3、创建正负样本数据集路径的txt文件
(1)创建正样本数据集txt文件
win+R打开窗口输入cmd,进入命令提示符界面,进入have_mask文件夹
基于Python+OpenCV的人脸口罩识别检测_第6张图片
输入命令创建路径文件

dir /b/s/p/w *.jpg > have_mask.txt

在这里插入图片描述
have_mask.txt文件位置在正样本数据集文件夹中

基于Python+OpenCV的人脸口罩识别检测_第7张图片
(2)创建负样本数据集txt文件(方法同正样本数据集一样)
基于Python+OpenCV的人脸口罩识别检测_第8张图片
基于Python+OpenCV的人脸口罩识别检测_第9张图片
然后将have_mask.txt和no_mask.txt文件放到mask目录下
基于Python+OpenCV的人脸口罩识别检测_第10张图片

三、训练人脸口罩数据集模型

1、创建xml文件夹存放训练好的模型
基于Python+OpenCV的人脸口罩识别检测_第11张图片
2、将OpenCV安装路径 \opencv\build\x64\vc14\bin下的opencv_createsamples.exe可执行文件和opencv_traincascade.exe可执行文件及另外两个下图文件复制到数据集同级目录,如下所示:
基于Python+OpenCV的人脸口罩识别检测_第12张图片
基于Python+OpenCV的人脸口罩识别检测_第13张图片
3、对正负样本txt文档进行预处理
正负样本需要生成 .vec格式的文档进行模型训练,因此需要通过对txt文档进行预处理,向have_mask.txt文件中末尾加入 1 0 0 20 20。
正样本处理Python代码:

#正样本文件预处理 没行目录结尾加入 1 0 0 20 20 
#coding:utf-8
import os
#Houzui="_Apple"
Houzui=r" 1 0 0 20 20" #后缀
filelist = open('D:\\facemask\\mask\\have_mask.txt','r+',encoding = 'utf-8')
line = filelist.readlines()
for file in line:
    file=file.strip('\n')+Houzui+'\n'
    print(file)
    filelist.write(file)

负样本处理Python代码:

#负样本文件预处理 没行目录结尾加入 1 0 0 60 60
#coding:utf-8
import os
#Houzui="_Apple"
Houzui=r" 1 0 0 80 80" #后缀
filelist = open('D:\\facemask\\mask\\no_mask.txt','r+',encoding = 'utf-8')
line = filelist.readlines()
for file in line:
    file=file.strip('\n')+Houzui+'\n'
    print(file)
    filelist.write(file)

这个处理不会自动覆盖之前的文件内容,所以需要手动将之前的内容剪切出来 ,保存为have_mask1.txt文件,have_mask.txt文件中只保留末尾为1 0 0 20 20的内容,如下:
基于Python+OpenCV的人脸口罩识别检测_第14张图片
同理,对no_mask.txt文件执行同样的操作手动将之前的内容剪切出来 ,保存为no_mask1.txt文件,no_mask.txt文件中只保留末尾为1 0 0 80 80的内容,如下:
基于Python+OpenCV的人脸口罩识别检测_第15张图片
4、生成正样本havemask.vec文件和nomask.vec文件
这里操作在cmd终端中进行,进入mask文件夹下,输入以下内容:
生成正样本havemask.vec文件:

opencv_createsamples.exe -vec havemask.vec -info have_mask.txt -num 410 -w 20 -h 20

基于Python+OpenCV的人脸口罩识别检测_第16张图片
生成负样本nomask.vec文件:

opencv_createsamples.exe -vec nomask.vec -info no_mask.txt -num 1688 -w 80 -h 80

基于Python+OpenCV的人脸口罩识别检测_第17张图片
上述命令内容阐述:

  • info:样本说明文件
  • vec:样本描述文件名和路径
  • num:样本个数,这里为410个样本
  • w h:样本尺寸,这里为20x20

生成文件如下:
基于Python+OpenCV的人脸口罩识别检测_第18张图片
5、训练模型
(1)在mask目录下创建txt文件,写入以下内容:

opencv_traincascade.exe -data xml -vec havemask.vec -bg no_mask.txt -numPos 350 -numNeg 400 -numStages 20 -w 20 -h 20 -mode ALL

pause

(2)将创建的txt文件命名为traincascade.bat
基于Python+OpenCV的人脸口罩识别检测_第19张图片
(3)删的have_mask.txt和no_mask,txt,然后将have_mask1.txt和no_mask1.txt改为have_mask.txt和no_mask.txt
(4)打开traincascade.bat,开始训练人脸口罩数据集模型
基于Python+OpenCV的人脸口罩识别检测_第20张图片
在这里训练模型的时间会很长,耐心等待…
基于Python+OpenCV的人脸口罩识别检测_第21张图片
训练结束

四、进行人脸口罩检测

Python代码:

import cv2
detector= cv2.CascadeClassifier('C:\\Users\\asus\\AppData\\Local\\Programs\\Python\\Python35\\Lib\\site-packages\\cv2\\data\\haarcascade_frontalface_default.xml')
mask_detector=cv2.CascadeClassifier('D:\\facemask\\mask\\xml\\cascade.xml')
cap = cv2.VideoCapture(0)
while True:
    ret, img = cap.read()
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    faces = detector.detectMultiScale(gray, 1.1, 3)
    for (x, y, w, h) in faces:
        #参数分别为 图片、左上角坐标,右下角坐标,颜色,厚度
        face=img[y:y+h,x:x+w]  # 裁剪坐标为[y0:y1, x0:x1]
        mask_face=mask_detector.detectMultiScale(gray, 1.1, 5)
        for (x2,y2,w2,h2) in mask_face:
            cv2.rectangle(img, (x2, y2), (x2 + w2, y2 + h2), (0, 0, 255), 2)
    cv2.imshow('Mask Detector', img)
    cv2.waitKey(3)
cap.release()
cv2.destroyAllWindows()

haarcascade_frontalface_default.xml是Python安装目录下的模型,自带人脸识别模型文件,在此之前需要安装opencv-python库。
运行结果:
未佩戴口罩不会做标记:
基于Python+OpenCV的人脸口罩识别检测_第22张图片
而佩戴口罩会做出标记
基于Python+OpenCV的人脸口罩识别检测_第23张图片
这中间有问题,识别精度有点低,原因在于训练的数据集太少了,有条件的话可以多找一点图片来进行训练。

你可能感兴趣的:(人工智能与机器学习,人脸识别,opencv,python)