DaveBobo

【OpenCV学习笔记 022】人脸识别小试牛刀

现代人脸检测技术有十分广泛的应用领域，传言iphone8可以进行人脸解锁，这项技术将给用户带来全新的体验。人脸识别技术究竟为何物呢？
人脸识别包括人脸检测和人脸匹配两个部分。在人脸检测算法被提出和发展的过程中，最具有代表性莫过于基于AdaBoost的人脸检测算法。AdaBoost算法主要包括五个关键技术分别为PAC学习模型、Harr-like特征、积分图、分类器训练及检测器级联。一篇通俗易懂的文章推荐给大家，《浅析人脸检测之Haar分类器方法：Haar特征、积分图、 AdaBoost 、级联》。在进行人脸检测时我们需要用到一个.xml的级联分类器，该文件存在于OpenCV安装目录下的\sources\data\haarcascades内，也可以自己训练生成，参考：《【OpenCV学习笔记 021】haartraining训练生成xml过程》。

一、人脸检测

以下为人脸检测代码的实现：

#include "opencv2/core/core.hpp"  
#include "opencv2/objdetect/objdetect.hpp"  
#include "opencv2/highgui/highgui.hpp"  
#include "opencv2/imgproc/imgproc.hpp"  

#include   
#include   

using namespace std;
using namespace cv;
string face_cascade_name = "haarcascade_frontalface_alt.xml";
//该文件存在于OpenCV安装目录下的\sources\data\haarcascades内，需要将该xml文件复制到当前工程目录下  
CascadeClassifier face_cascade;
void detectAndDisplay(Mat frame);
int main(int argc, char** argv){
    Mat image;
    image = imread("img1.jpg", 1);  //当前工程的image目录下的mm.jpg文件，注意目录符号  

    detectAndDisplay(image); //调用人脸检测函数  
    waitKey(0);
    //暂停显示一下。  
}

void detectAndDisplay(Mat face){
    vector faces;
    Mat face_gray;

    if (!face_cascade.load(face_cascade_name)){
        printf("级联分类器错误，可能未找到文件，拷贝该文件到工程目录下！\n");
        return;
    }

    cvtColor(face, face_gray, CV_BGR2GRAY);  //rgb类型转换为灰度类型        
    equalizeHist(face_gray, face_gray);   //直方图均衡化  

    face_cascade.detectMultiScale(face_gray, faces, 1.1, 2, 0 | CV_HAAR_SCALE_IMAGE, Size(1, 1));

    for (int i = 0; i < faces.size(); i++){
        Point center(faces[i].x + faces[i].width*0.5, faces[i].y + faces[i].height*0.5);
        ellipse(face, center, Size(faces[i].width*0.5, faces[i].height*0.5), 0, 0, 360, Scalar(255, 0, 0), 2, 7, 0);
    }

    imshow("人脸检测", face);
}

检测结果：

关键函数解读：

（1）直方图均衡化函数

//! normalizes the grayscale image brightness and contrast by normalizing its histogram
CV_EXPORTS_W void equalizeHist( InputArray src, OutputArray dst );

src 源图像

dst 目标 (均衡化后) 图像

直方图均衡化是通过拉伸像素强度分布范围来增强图像对比度的一种方法。详细内容可以参考OpenCV API imgproc模块图像处理直方图均衡化： http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/tutorials/imgproc/histograms/histogram_equalization/histogram_equalization.html

（2）CascadeClassifier初始化函数

bool CascadeClassifier::read(constFileNode&root)

{

    if( !data.read(root) )//data成员变量的读取

        return false;

    // load features---特征的读取

    featureEvaluator= FeatureEvaluator::create(data.featureType);

    FileNodefn =root[CC_FEATURES];

    if( fn.empty() )

        return false;

    return featureEvaluator->read(fn);
}

CascadeClassifier类中既有load也有read函数，二者是相同的，load将引用read函数。read的结果一是初始化了分类器的特征类型、最小检测窗口size等参数；二是建立级联的分类器树；三是提取了xml中的特征池。

（3）多尺度检测函数

在load分类器之后，可以调用该函数对一幅图像做多尺度检测。detectMultiscale只是对detectSingleScale做了一次多尺度的封装。在单一尺度的图像中使用detectSingleScale进行检测。

 CV_WRAP virtual void detectMultiScale( const Mat& image,
                                   CV_OUT vector& objects,
                                   double scaleFactor=1.1,
                                   int minNeighbors=3, int flags=0,
                                   Size minSize=Size(),
                                   Size maxSize=Size() );

image—Mat类型的图像

objects—检测得到的矩形

scaleFactor—指定在每个图像缩放处缩小图像大小的参数

minNeighbors—参数指定每个候选矩形应该保留多少个领域

flags—参数具有与在函数cvHaarDetectObjects中的旧级联相同的含义。它不用于新的级联。

minSize—最小可能的对象大小。小于该值的对象将被忽略。

maxSize—最大可能的对象大小。大于该值的对象将被忽略。

（4）ellipse绘制椭圆圆弧和椭圆扇形

//! draws an elliptic arc, ellipse sector or a rotated ellipse in the image
CV_EXPORTS_W void ellipse(CV_IN_OUT Mat& img, Point center, Size axes,
                        double angle, double startAngle, double endAngle,
                        const Scalar& color, int thickness=1,
                        int lineType=8, int shift=0);

image—Mat类型的图像

center—椭圆圆心坐标

axes—轴的长度

angle—偏转的角度

startAngle—圆弧起始角的角度

endAngle—圆弧终结角的角度

color—线条的颜色

thickness—线条的粗细程度

lineType—线条的类型,见CVLINE的描述

shift—圆心坐标点和数轴的精度

二、PCA人脸识别

以下为PCA人脸识别代码的实现：

#include 
#include "cv.h"
#include "cvaux.h"
#include "highgui.h"
#include "time.h"
#include "iostream"

using namespace cv;
using namespace std;

//定义几个重要的全局变量
IplImage **faceImgArr = 0;//指向训练人脸和测试人脸的指针（在学习和识别阶段指向不同）
CvMat *personNumTruthMat = 0;//人脸图像的ID号
int nTrainFaces = 0;//训练图像的数目
int nEigens = 0;//自己取的主要特征值数目
IplImage *pAvgTrainImg = 0;//训练人脸数据的平均值
IplImage **eigenVectArr = 0;//投影矩阵，也即主特征向量
CvMat *eigenValMat = 0;//特征值
CvMat *projectedTrainFaceMat = 0; //训练图像的投影 

//函数原型
void learn();
void recognize();
void doPCA();
void storeTrainingData();
int loadTrainingData(CvMat **pTrainPersonNumMat);
int findNearestNeighbor(float * projectedTestFace);
int loadFaceImgArray(char * filename);
void printUsage();

//主函数，主要包括学习和识别两个阶段，需要运行两次，通过命令行传入的参数区分
int main(){

	//learn();
	recognize();
}

void learn(){

	cout << "开始训练过程" << endl;
	//开始计时
	clock_t start, finish;
	double duration;
	start = clock();
	int i, offset;
	//加载训练图像集
	nTrainFaces = loadFaceImgArray("train.txt");
	if (nTrainFaces < 2)
	{
		fprintf(stderr,"Need 2 or more training faces\n" "Input file contains only %d\n", nTrainFaces);
		return;
	}
	//进行主成分分析
	doPCA();
	//将训练图集投影到子空间中
	projectedTrainFaceMat = cvCreateMat(nTrainFaces, nEigens, CV_32FC1);
	offset = projectedTrainFaceMat->step / sizeof(float);
	for (i = 0; i < nTrainFaces;i++)
	{
		cvEigenDecomposite(faceImgArr[i], nEigens, eigenVectArr, 0, 0, pAvgTrainImg, projectedTrainFaceMat->data.fl + i*offset);
	}

	//将训练阶段得到的特征值，投影矩阵等数据存为.xml文件，以备测试时使用
	storeTrainingData();
	//结束计时
	finish = clock();
	duration = (double)(finish - start) / CLOCKS_PER_SEC;
	cout << "训练过程结束，共耗时：" << duration << "秒" << endl;

}

//识别阶段代码
void recognize(){

	cout << "开始识别过程" << endl;
	//开始计时
	clock_t start, finish;
	double duration;
	start = clock();

	//测试人脸数
	int i, nTestFaces = 0;
	//训练阶段的人脸数
	CvMat * trainPersonNumMat = 0;
	float * projectedTestFace = 0;
	//加载测试图像，并返回人脸数
	nTestFaces = loadFaceImgArray("test.txt");
	printf("%d test faces loaded\n", nTestFaces);
	//加载保存在.xml文件中的训练结果
	if (!loadTrainingData(&trainPersonNumMat))
		return;
	projectedTestFace = (float*)cvAlloc(nEigens*sizeof(float));

	for (i = 0; i, nTestFaces;i++)
	{
		int iNearest, nearest, truth;
		//将测试图像投影到子空间中
		cvEigenDecomposite(faceImgArr[i], nEigens, eigenVectArr, 0, 0, pAvgTrainImg, projectedTestFace);
		iNearest = findNearestNeighbor(projectedTestFace);
		truth = personNumTruthMat->data.i[i];
		nearest = trainPersonNumMat->data.i[iNearest];
		printf("nearest = %d, Truth = %d\n", nearest, truth);
	}

	//结束计时
	finish = clock();
	duration = (double)(finish - start) / CLOCKS_PER_SEC;
	cout << "识别过程结束,共耗时：" << duration << "秒" << endl;
}

//加载保存过的训练结果
int loadTrainingData(CvMat ** pTrainPersonNumMat)
{

	CvFileStorage * fileStorage;
	int i;
	fileStorage = cvOpenFileStorage("facedata.xml", 0, CV_STORAGE_READ);
	if (!fileStorage)
	{
		fprintf(stderr, "Can't open facedata.xml\n");
		return 0;
	}

	nEigens = cvReadIntByName(fileStorage, 0, "nEigens", 0);
	nTrainFaces = cvReadIntByName(fileStorage, 0, "nTrainFaces", 0);
	*pTrainPersonNumMat = (CvMat *)cvReadByName(fileStorage, 0, "trainPersonNumMat", 0);
	eigenValMat = (CvMat *)cvReadByName(fileStorage, 0, "eigenValMat", 0);
	projectedTrainFaceMat = (CvMat *)cvReadByName(fileStorage, 0, "projectedTrainFaceMat", 0);
	pAvgTrainImg = (IplImage *)cvReadByName(fileStorage, 0, "avgTrainImg", 0);
	eigenVectArr = (IplImage **)cvAlloc(nTrainFaces*sizeof(IplImage *));
	for (i = 0; i < nEigens; i++)
	{
		char varname[200];
		sprintf(varname, "eigenVect_%d", i);
		eigenVectArr[i] = (IplImage *)cvReadByName(fileStorage, 0, varname, 0);
	}
	cvReleaseFileStorage(&fileStorage);
	return 1;
}

//存储训练结果
void storeTrainingData(){

	CvFileStorage * fileStorage;
	int i;
	fileStorage = cvOpenFileStorage("facedata.xml", 0, CV_STORAGE_WRITE);
	//存储特征值，投影矩阵，平均矩阵等训练结果
	cvWriteInt(fileStorage, "nEigens", nEigens);
	cvWriteInt(fileStorage, "nTrainFaces", nTrainFaces);
	cvWrite(fileStorage, "trainPersonNumMat", personNumTruthMat, cvAttrList(0, 0));
	cvWrite(fileStorage, "eigenValMat", eigenValMat, cvAttrList(0, 0));
	cvWrite(fileStorage, "projectedTrainFaceMat", projectedTrainFaceMat, cvAttrList(0, 0));
	cvWrite(fileStorage, "avgTrainImg", pAvgTrainImg, cvAttrList(0, 0));

	for (i = 0; i < nEigens; i++)
	{

		char varname[200];
		sprintf(varname, "eigenVect_%d", i);
		cvWrite(fileStorage, varname, eigenVectArr[i], cvAttrList(0, 0));
		cvNormalize(eigenVectArr[i], eigenVectArr[i], 255, 0, CV_L2, 0);
		cvNamedWindow("demo", CV_WINDOW_AUTOSIZE);
		cvShowImage("demo", eigenVectArr[i]);
		cvWaitKey(100);
	}

	cvNormalize(pAvgTrainImg, pAvgTrainImg, 255, 0, CV_L1, 0);
	cvNamedWindow("demo", CV_WINDOW_AUTOSIZE);
	cvShowImage("demo", pAvgTrainImg);
	cvWaitKey(100);
	cvReleaseFileStorage(&fileStorage);
}

//寻找最接近的图像
int findNearestNeighbor(float * projectedTestFace){

	//定义最小距离，并初始化为无穷大
	double leastDistSq = DBL_MAX, accuracy;
	int i, iTrain, iNearest = 0;
	double a[10];
	for (iTrain = 0; iTrain < nTrainFaces; iTrain++)
	{
		double distSq = 0;
		for (i = 0; i < nEigens; i++)
		{
			float d_i =projectedTestFace[i] -projectedTrainFaceMat->data.fl[iTrain*nEigens + i];

			// Mahalanobis算法计算的距离
			//distSq += d_i*d_i; // Euclidean算法计算的距离
			distSq += d_i*d_i / eigenValMat->data.fl[i];
		}
		a[iTrain] = distSq;
		if (distSq < leastDistSq)
		{

			leastDistSq = distSq;
			iNearest = iTrain;
		}
	}
	//求阈值

	double max = a[0], threshold;
	int j;
	for (j = 1; j < 10; j++)
	{

		if (max < a[j])
			max = a[j];
		else
			max = max;
	}

	threshold = max / 2;
	//求相似率
	accuracy = 1 - leastDistSq / threshold;
	cout << "相似率为:" << accuracy << endl;
	return iNearest;
}

//主成分分析
void doPCA()
{

	int i;
	//终止算法准则
	CvTermCriteria calcLimit;
	//构造图像
	CvSize faceImgSize;
	// 自己设置主特征值个数
	nEigens = nTrainFaces - 1;
	//分配特征向量存储空间
	faceImgSize.width = faceImgArr[0]->width;
	faceImgSize.height = faceImgArr[0]->height;

	//分配个数为主特征值个数
	eigenVectArr = (IplImage**)cvAlloc(sizeof(IplImage*) * nEigens);
	for (i = 0; i < nEigens; i++)
		eigenVectArr[i] = cvCreateImage(faceImgSize, IPL_DEPTH_32F, 1);
	//分配主特征值存储空间
	eigenValMat = cvCreateMat(1, nEigens, CV_32FC1);
	// 分配平均图像存储空间
	pAvgTrainImg = cvCreateImage(faceImgSize, IPL_DEPTH_32F, 1);
	// 设定PCA分析结束条件
	calcLimit = cvTermCriteria(CV_TERMCRIT_ITER, nEigens, 1);
	// 计算平均图像，特征值，特征向量

		cvCalcEigenObjects(
		nTrainFaces,
		(void*)faceImgArr,
		(void*)eigenVectArr,
		CV_EIGOBJ_NO_CALLBACK,
		0,
		0,
		&calcLimit,
		pAvgTrainImg,
		eigenValMat->data.fl);
	//归一化大小
	cvNormalize(eigenValMat, eigenValMat, 1, 0, CV_L1, 0);

}

//加载txt文件的列举的图像
int loadFaceImgArray(char * filename)
{

	FILE * imgListFile = 0;
	char imgFilename[512];
	int iFace, nFaces = 0;
	if (!(imgListFile = fopen(filename, "r")))
	{
		fprintf(stderr, "Can\'t open file %s\n", filename);
		return 0;
	}

	// 统计人脸数
	while (fgets(imgFilename, 512, imgListFile)) ++nFaces;
	rewind(imgListFile);
	// 分配人脸图像存储空间和人脸ID号存储空间
	faceImgArr = (IplImage **)cvAlloc(nFaces*sizeof(IplImage *));
	personNumTruthMat = cvCreateMat(1, nFaces, CV_32SC1);
	for (iFace = 0; iFace < nFaces; iFace++)
	{
		// 从文件中读取序号和人脸名称
		fscanf(imgListFile,
			"%d %s", personNumTruthMat->data.i + iFace, imgFilename);

		// 加载人脸图像
		faceImgArr[iFace] = cvLoadImage(imgFilename, CV_LOAD_IMAGE_GRAYSCALE);
		if (!faceImgArr[iFace])
		{
			fprintf(stderr, "Can\'t load image from %s\n", imgFilename);
			return 0;
		}

		cvNamedWindow("demo", CV_WINDOW_AUTOSIZE);
		cvShowImage("demo", faceImgArr[iFace]);
		cvWaitKey(100);
	}
	fclose(imgListFile);
	return nFaces;
}

void printUsage()
{
	printf("Usage: eigenface \n"," Valid commands are\n"" train\n"" test\n");
}

获得特征空间的函数：

/* Calculates eigen values and vectors of covariation matrix of a set of
   arrays */
CVAPI(void)  cvCalcEigenObjects( int nObjects, void* input, void* output,
                                 int ioFlags, int ioBufSize, void* userData,
                                 CvTermCriteria* calcLimit, IplImage* avg,
                                 float* eigVals );

nObjects：目标的数目，即输入训练图片的数目。
input：输入训练的图片。
output：输出特征脸，总共有nEigens
ioFlags、ioBufSize：默认为0
userData：指向回调函数(callback function)必须数据结构体的指针。
calcLimit：终止迭代计算目标特征的条件。根据calcLimit的参数，计算会在前nEigens主要特征目标被提取后结束（这句话有点绕，应该就是提取了前nEigens个特征值，），另一种结束的情况是：目前特征值同最s大特征值的比值降至calcLimit的epsilon值之下。
赋值如下calcLimit = cvTermCriteria( CV_TERMCRIT_ITER, nEigens, 1);

图像在特征空间的投影：

/* Projects image to eigen space (finds all decomposion coefficients */
CVAPI(void)  cvEigenDecomposite( IplImage* obj, int nEigObjs, void* eigInput,
                                 int ioFlags, void* userData, IplImage* avg,
                                 float* coeffs );

obj—输入图像，训练或识别图像

nEigObjs—特征空间的eigen数量

eigInput—特征空间中的特征脸

ioFlags— 默认为0

userData—默认为0

avg—特征空间中的平均图像

coeffs—这是唯一一个输出，即人脸在子空间的投影，特征值

Reference:

http://blog.csdn.net/liulina603/article/details/28633403

http://blog.csdn.net/delltdk/article/details/9186875

http://kns.cnki.NET/KCMS/detail/detail.aspx?dbcode=CMFD&dbname=CMFD2011&filename=1011112112.nh&uid=WEEvREcwSlJHSldRa1FhcEE0NXdnek9UdVllQVRuUVNSSGU2VEMxUEs5bz0=$9A4hF_YAuvQ5obgVAqNKPCYcEjKensW4ggI8Fm4gTkoUKaID8j8gFw!!&v=MTQ4NzFxRnlEblY3dktWRjI2SDdLNUhORE5yWkViUElSOGVYMUx1eFlTN0RoMVQzcVRyV00xRnJDVVJMMmZaZVI=

http://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CMFD&dbname=CMFD201402&filename=1014268233.nh&uid=WEEvREcwSlJHSldRa1FhcTdWZDlscUEvR2E2bTdjZHczQnRHTWVoWFprRT0=$9A4hF_YAuvQ5obgVAqNKPCYcEjKensW4ggI8Fm4gTkoUKaID8j8gFw!!&v=MDE1NjFGMjZHckcrRnRQUHJKRWJQSVI4ZVgxTHV4WVM3RGgxVDNxVHJXTTFGckNVUkwyZlplUnBGeTNnVTcvS1Y=

http://blog.csdn.net/delltdk/article/details/9984719

http://docs.opencv.org/2.4/modules/objdetect/doc/cascade_classification.html

http://blog.csdn.net/gxiaob/article/details/9396955

https://wenku.baidu.com/view/4db3187152ea551811a68728.html

http://blog.csdn.net/liulina603/article/details/8089023

树莓派中 Python+opencv打开摄像头 68lizi 光电设计 python
树莓派中Python+opencv打开摄像头注意不要使用cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)，我在树莓派使用这个的时候会报错，在windows不会报错，具体原因不清楚cap=cv2.VideoCapture(0)#使用cap=cv2.VideoCapture(0,cv2.CAP_DSHOW)会报错whileTrue:status,img=cap.read()i
Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
基于OpenCV-python的人脸识别系统 transuperb 完整代码 opencv python 人工智能
importsysimportosimporttkinterastkfromtkinter.ttkimportStyleimportnumpyasnpimportcv2fromPILimportImageTk,ImageDraw,ImageFontfrompanel.models.tabulatorimportthemefromModelimport*fromtkinterimportttk,fi
Python视觉实战项目31讲源码地址机械小蛟龙笔记 opencv python 深度学习
Python视觉实战项目31讲源码地址来源：公众号小白学视觉2月1日使用OpenCV实现猜词游戏https://github.com/spmallick/learnopencv/tree/master/Hangman使用OpenCV实现图像修复https://github.com/spmallick/learnopencv/tree/master/Image-Inpainting自适应显着性的图像
视线实时跟踪项目云博士的AI课堂基于Python计算机视觉视线跟踪 python 计算机视觉机器视觉 opencv 视线检测
GitHub项目antoinelame/GazeTracking的详细介绍，包括项目概述、功能、解决的问题、应用场景、安装与使用说明等：项目概述GazeTracking是一个基于Python的开源库，利用普通网络摄像头实现实时眼动追踪。它能够检测用户瞳孔的精确位置和视线方向，支持Python2和3。该项目通过结合OpenCV和Dlib库，提供了一种低成本、高精度的眼动追踪解决方案，适用于多种应用场
基于OpenCV的银行卡识别 Yang了个羊 OpenCV opencv 人工智能计算机视觉
一、设计思路1、预处理银行卡号序列模版，对其进行一系列形态学操作，继而进行轮廓识别，构建与各个轮廓所对应的数字元组。2、对将要识别的银行卡进行灰度处理、二值化、阈值处理，sobel算子边缘检测等预处理，再通过模版匹配方法找出与已知轮廓高度符合的数字。二、代码复现预操作：自定义一个cv_show函数，便于后来的图像展示。#绘图展示defcv_show(name,img):cv2.imshow(nam
OpenCV实现相机标定的棋盘格制作与应用 BIG-HO
本文还有配套的精品资源，点击获取简介：在计算机视觉领域，棋盘格标定板用于获取相机参数，实现图像校正和三维重建。OpenCV库提供了绘制棋盘格和相机标定的功能。本文将详细介绍如何使用OpenCV制作棋盘格标定板，包括设计、绘制、保存、相机标定过程和应用。通过实际案例，如畸变矫正、三维重建、AR应用和机器人导航，展示棋盘格标定板在视觉技术中的关键作用。1.棋盘格设计与绘制1.1棋盘格的基本概念与应用棋
OpenCV双目视觉棋盘格标定、特征匹配及三维坐标计算
OpenCV双目视觉棋盘格标定、特征匹配及三维坐标计算【下载地址】OpenCV双目视觉棋盘格标定特征匹配及三维坐标计算OpenCV双目视觉棋盘格标定、特征匹配及三维坐标计算本资源库提供了基于OpenCV的双目视觉系统标定和三维重建基础教程，专注于利用棋盘格作为特征目标进行相机校准，特征点匹配以及随后的三维坐标计算项目地址:https://gitcode.com/open-source-toolki
用python解决关于opencv对图片色点选取并与原图形成对照，代码与常见问题枕书眠月 opencv opencv 人工智能计算机视觉 python 嵌入式硬件开发语言
下面我们将学习opencv和HSV，因为RGB相同的颜色在各种照明条件下可能看起来不同，HSV模型将颜色信息（色调）与亮度和强度分开，这使得检测黄色、红色或绿色等颜色变得更加容易，尤其是在不同的光照条件下HSV更胜一筹，RGB不太适合颜色检测。所以使用HSV（色相、饱和度、值）颜色模型来检测图像中的红色。接下来逐步完成每个步骤，包括导入库、加载图像、将图像转换为HSV色彩空间、创建红色蒙版、查找轮
Qt, OpenCV与OpenGL协同作战：图像处理与三维图形界面的完美结合奇树谦 QT qt opencv 图像处理
原文链接：https://developer.aliyun.com/article/1463740文章目录Qt,OpenCV与OpenGL协同作战：图像处理与三维图形界面的完美结合1.引言图像处理与三维图形界面的重要性Qt,OpenCV与OpenGL简介与应用场景QtOpenCVOpenGL结合Qt,OpenCV与OpenGL的优势与价值2.Qt基础知识与特性Qt库的组成与功能Qt库的安装与使用Q
【人工智能】微调的秘密武器：释放大模型的无限潜能蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在人工智能迅猛发展的今天，大规模语言模型（LLMs）以其强大的通用能力席卷各行各业。然而，如何让这些通用模型在特定领域或任务中发挥最大潜力？答案是微调（Fine-tuning）。本文深入探讨微调的理论基础、技术细节与实践方法，揭示其作为解锁大模型隐藏潜力
【运维】Python与Ansible协同作战：打造自动化服务器配置管理的终极解决方案蒙娜丽宁 Python杂谈人工智能运维 python ansible
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在现代IT运维中，服务器配置管理是一项繁琐但至关重要的任务。手动配置多台服务器不仅耗时，还容易出错。本文深入探讨如何利用Python结合Ansible工具实现自动化服务器配置管理与环境部署。通过Python脚本调用AnsibleAPI，我们可以动态生成配
c语言opencv所用库函数,Py之cv2：cv2库(OpenCV，opencv-python)的简介、安装、使用方法(常见函数、方法等)最强详细攻略... weixin_39729272 c语言opencv所用库函数
##关于OpenCV简介##OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库，可以运行在Linux、Windows、Android和MacOS操作系统上。它轻量级而且高效——由一系列C函数和少量C++类构成，同时提供了Python、Ruby、MATLAB等语言的接口，实现了图像处理和计算机视觉方面的很多通用算法。OpenCV用C++语言编写，它的主要接口也是C++语言，但是依然保留
Python之cv2：cv2(OpenCV，opencv-python)库pip下载超时、下载失败、无法下载的解决方案大全猫头虎 python opencv pip 人工智能目标检测计算机视觉机器学习
Python之cv2：cv2(OpenCV，opencv-python)库pip下载超时、下载失败、无法下载的解决方案大全在学习和使用OpenCV（Python包名：opencv-python或简称cv2）的过程中，很多初学者常常会遇到通过pipinstallopencv-python下载超时、下载失败或无法下载的问题。本文将从环境检查、网络配置、国内镜像源、手动下载与离线安装、以及替代方案等多个
【CMake基础入门教程】第七课：查找并使用第三方库（以 find_package() 为核心）奇异果冻 CMake入门学习 CMake bash c++开发语言
很好！我们进入第七课：查找并使用第三方库（以find_package()为核心）。本课目标学会使用CMake的find_package()引入外部库；理解find_package背后的机制（Config模式/Module模式）；以常用库如OpenCV/Qt/Boost为例进行实战；掌握target_link_libraries()的现代CMake使用方式。一、什么是find_package()？C
OpenCV中创建Mat对象 Ethan@LM opencv 人工智能计算机视觉
第1章创建Mat对象1.1.创建空的Mat对象cv::Matmat;1.2.创建灰度图像//创建一个3行4列、8位无符号单通道矩阵（相当于灰度图）cv::Matmat(3,4,CV_8UC1);1.3.创建彩色图像//创建三通道矩阵（相当于彩色图像）cv::Matmat_color(480,640,CV_8UC3);CV_8UC1：8位无符号，单通道（灰度图）CV_8UC3：8位无符号，三通道（彩
编译OpenCV支持CUDA视频解码 AI标书 python openvc cuda nvidia docker build
如何在Ubuntu上编译OpenCV并启用CUDA视频解码支持（cudacodec）在深度学习、视频处理等高性能计算领域，OpenCV的GPU加速功能非常重要。特别是它的cudacodec模块，能直接利用NVIDIA硬件实现高效的视频解码，极大提升性能。本文将基于Ubuntu环境，详细介绍从环境准备到编译安装OpenCV，并开启cudacodec模块的全过程。完整的shell脚本以及本次编译所用到
OpenCV CUDA模块设备层-----逐通道的正弦运算函数sin() 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述OpenCV的CUDA模块（cv::cudev）中的一个设备端数学函数，用于在CUDA核函数中对uchar4类型（即4通道无符号字符类型）进行逐通道的正弦运算，并将结果转换为float4类型输出。将一个uchar4类型像素值（每个通道取值范围[0,255]）逐通道
零基础学 OpenCV + Python 图像处理：手把手带你做人脸识别（附代码+典型案例）猫头虎 #Python专栏 opencv python 图像处理计算机视觉 AIGC AI编程人工智能
零基础学OpenCV+Python图像处理：手把手带你做人脸识别（附代码+典型案例）关键词：opencv-python、opencv图像处理、opencv人脸识别代码python、python安装opencv库亮点提示：本文面向零基础读者，手把手教你从环境搭建到实战应用，一步步深入，让你快速掌握OpenCV+Python图像处理与人脸识别技术。文中附带完整示例代码与典型案例，可直接复制、运行与深度
AI人工智能领域中OpenCV的深度学习融合 AI大模型应用实战人工智能 opencv 深度学习 ai
AI人工智能领域中OpenCV的深度学习融合关键词：AI人工智能、OpenCV、深度学习融合、计算机视觉、图像识别摘要：本文深入探讨了在AI人工智能领域中OpenCV与深度学习的融合。我们将先介绍OpenCV和深度学习的基本概念，再讲解它们融合的原理和方式，通过实际代码案例展示融合的具体操作，探讨其在不同场景的应用，推荐相关工具和资源，分析未来发展趋势与挑战。希望能让大家对这一融合有全面且深入的了
计算机视觉实战：OpenCV 与深度学习结合 QuantumWalker 计算机视觉 opencv 深度学习 python
```html计算机视觉实战：OpenCV与深度学习结合计算机视觉实战：OpenCV与深度学习结合在当今数字化时代，计算机视觉技术已经渗透到我们生活的方方面面。从智能手机的面部识别解锁，到自动驾驶汽车的环境感知，计算机视觉正在改变我们的世界。而在这个领域中，OpenCV和深度学习的结合，更是推动了计算机视觉技术的发展。什么是OpenCV？OpenCV（OpenSourceComputerVisio
java鱼眼相机标定_鱼眼相机标定以及OpenCV实现元宿six java鱼眼相机标定
开始标定doublefisheye::calibrate(InputArrayOfArraysobjectPoints,InputArrayOfArraysimagePoints,constSize&image_size,InputOutputArrayK,InputOutputArrayD,OutputArrayOfArraysrvecs,OutputArrayOfArraystvecs,int
C++ OpenCV4 实现鱼眼镜头矫正朝风工作室 c++开发语言
一、为什么需要鱼眼镜头矫正？鱼眼镜头通过特殊的光学设计实现180°甚至更广的视野，广泛应用于全景相机、自动驾驶、安防监控等领域。但这种广角特性会引入严重的桶形畸变：直线边缘会向内弯曲（如图像边缘的门框变成弧线），物体尺寸在边缘区域会被拉伸。矫正的核心目标：将鱼眼镜头拍摄的畸变图像还原为接近人眼视觉的正常图像，便于后续的目标检测、图像拼接等处理。矫正前后效果对比（此处可插入图片）矫正前图像（鱼眼畸变
鱼眼相机标定与畸变矫正：高效提升图像质量的利器何盼思Kit
鱼眼相机标定与畸变矫正：高效提升图像质量的利器【下载地址】鱼眼相机标定及畸变矫正工具包`fisheye_cali.zip`包含了一套完整的解决方案，通过使用OpenCV库的功能，本工具能够帮助用户准确地完成鱼眼相机的参数标定，进一步执行图像的畸变矫正。此过程对于增强图像处理应用的精确度至关重要，特别是在需要广阔视野的应用场景中项目地址:https://gitcode.com/open-source
从零理解鱼眼相机的标定与矫正（含 OpenCV 代码与原理讲解）
本文适合初学者系统掌握鱼眼镜头的标定与矫正原理，图文结合，带你从0到1理解K,D,u,v等参数的真实含义。一句话总结鱼眼相机由于镜头视角宽、畸变大，拍出来的画面会“鼓起来”或者变形。通过标定得到的参数，可以让计算机“理解”这种变形是怎么发生的，并据此把图像“拉回正形”。一、什么是内参矩阵K？定义在OpenCV中，内参矩阵（CameraIntrinsicMatrix）通常是一个3x3的矩阵：cfg.
揭开计算机视觉的神秘面纱：从像素到数字图像 DragonAlchemy OpenCV历程计算机视觉
揭开计算机视觉的神秘面纱：从像素到数字图像欢迎来到计算机视觉的奇妙世界！在我们深入研究如何使用OpenCV这样的强大工具来让计算机“看懂”图像和视频之前，理解一些最基本的概念至关重要。就像学习任何新语言都需要先掌握字母和单词一样，计算机视觉也有它的“字母表”。今天，我们就来一起探索这些基础构建块：像素、颜色空间以及图像时如何以数字形式表示的。一、像素(Pixel)：图像的“原子”想象一下，你正在欣
OpenCV边缘填充方式详解慕婉0307 opencv基础 opencv 计算机视觉人工智能
一、边缘填充概述在图像处理中，边缘填充（BorderPadding）是一项基础而重要的技术，特别是在进行卷积操作（如滤波、边缘检测等）时，处理图像边缘像素需要用到周围的像素值。由于图像边缘的像素没有完整的邻域，因此需要通过某种方式对图像边界进行扩展。边缘填充的主要应用场景包括：图像滤波（如高斯滤波、中值滤波等）卷积神经网络（CNN）中的卷积层形态学操作（如膨胀、腐蚀）图像特征提取二、OpenCV中
聚焦OpenVINO与OpenCV颜色通道转换的实践指南
颜色通道顺序问题：OpenVINO模型RGB输入与OpenCVBGR格式的转换在计算机视觉任务中，框架间的颜色通道差异常导致模型推理错误。以下方法解决OpenVINO模型需要RGB输入而OpenCV默认输出BGR的问题。理解核心差异OpenCV的imread()函数遵循BGR通道顺序，源于历史摄像头硬件的数据格式。而OpenVINO等深度学习框架多采用RGB顺序，与TensorFlow/PyTor
用OpenCV实现图像分割：提取Logo中的特定元素并重新着色 Wave还没秃 opencv 人工智能计算机视觉
用OpenCV实现图像分割：提取Logo中的特定元素并重新着色任务：将图片中三个圆形图案以及字母（共四个）单独取出，分别保存为四个新图片，图片大小与原图一致，图案尽量位于图片中心。三个圆形图案在新图片中改成不与于原来的填充色。步骤总览1.读取图片2.预处理：二值化或色彩分割找目标区域3.提取每个圆形图案（红、绿、蓝）和文字区域的掩膜4.将掩膜区域提取出来并改变颜色（对圆形）5.让内容居中对齐，保存
基于 opencv+yolov8+easyocr的车牌追踪识别（ECUT）Edward-tan 人工智能--CV python进阶全栈开发 opencv yolov8 ocr python
（本项目所有代码打包至我的资源中，大家可在我的文章底部选择下载）目录需求实现效果学习视频大致思路代码实现资源下载需求通过车辆识别技术，识别视频中每个车辆及其车牌号，车辆应进行追踪，避免重复计数量。实现效果车牌识别学习视频使用Python、Yolov8和EasyOCR自动识别车牌计算机视觉教程_哔哩哔哩_bilibili大致思路通过opencv将视频转换为帧，对帧应用车辆识别模型，并使用model.
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

【OpenCV学习笔记 022】人脸识别 小试牛刀

一、人脸检测

二、PCA人脸识别

你可能感兴趣的:(OpenCV,opencv编程笔记)

【OpenCV学习笔记 022】人脸识别小试牛刀