eastlhu

人脸识别之人眼定位、人脸矫正、人脸尺寸标准化---

代码来源于<Mastering OpenCV with Practical Computer Vision Projects >

她的另外几篇文章，也翻译的很好

http://blog.csdn.net/raby_gyl/article/details/12611861

http://blog.csdn.net/raby_gyl/article/details/12623539

http://blog.csdn.net/raby_gyl/article/details/12338371

我感觉下面的程序——对人眼定位，人脸矫正，人脸尺寸化，对于初学人脸识别，做人脸的预处理非常有帮助~

程序的思路是：首先通过人脸检测级联器检测到人脸区域，对于人脸区域我们采用经验理论（即不同的人眼检测器在不同的人脸搜索区域具有最优性），也即人眼在人脸区域中的位置，得到人眼的大体位置，采用opencv的人眼级联检测器检测人眼，获取每一个人眼的中心位置，两个人眼的连线与水平位置的夹角来确定人脸旋转、矫正的角度。同时通过我们想要得到的目标图像来计算得到仿射矩阵的scale尺度因子，即图像缩放的比例，以及通过平移来计算得到的距离，进而实现定位人眼在目的图像的位置。

代码如下：

[cpp] view plain copy

#include "stdafx.h"
#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/highgui/highgui.hpp"
#include "opencv2/opencv.hpp"
#include<iostream>
#include<vector>
using namespace std;
using namespace cv;
const double DESIRED_LEFT_EYE_X = 0.16; // 控制处理后人脸的多少部分是可见的
const double DESIRED_LEFT_EYE_Y = 0.14;
const double FACE_ELLIPSE_CY = 0.40;
const double FACE_ELLIPSE_W = 0.50; // 应当至少为0.5
const double FACE_ELLIPSE_H = 0.80; //控制人脸掩码的高度
/*--------------------------------------目标检测-------------------------------------*/
void detectObjectsCustom(const Mat &img, CascadeClassifier &cascade, vector<Rect> &objects, int scaledWidth, int flags, Size minFeatureSize, float searchScaleFactor, int minNeighbors);
void detectLargestObject(const Mat &img, CascadeClassifier &cascade, Rect &largestObject, int scaledWidth);
void detectManyObjects(const Mat &img, CascadeClassifier &cascade, vector<Rect> &objects, int scaledWidth);
/*------------------------------------- end------------------------------------------*/
void detectBothEyes(const Mat &face, CascadeClassifier &eyeCascade1, CascadeClassifier &eyeCascade2, Point &leftEye, Point &rightEye, Rect *searchedLeftEye, Rect *searchedRightEye);
Mat getPreprocessedFace(Mat &srcImg, int desiredFaceWidth, CascadeClassifier &faceCascade, CascadeClassifier &eyeCascade1, CascadeClassifier &eyeCascade2, bool doLeftAndRightSeparately, Rect *storeFaceRect, Point *storeLeftEye, Point *storeRightEye, Rect *searchedLeftEye, Rect *searchedRightEye);
int main(int argc,char **argv)
{
CascadeClassifier faceDetector;
CascadeClassifier eyeDetector1;
CascadeClassifier eyeDetector2;//未初始化不用
try{
//faceDetector.load("E:\\OpenCV-2.3.0\\data\\haarcascades\\haarcascade_frontalface_alt.xml");
faceDetector.load("E:\\OpenCV-2.3.0\\data\\lbpcascades\\lbpcascade_frontalface.xml");
eyeDetector1.load("E:\\OpenCV-2.3.0\\data\\haarcascades\\haarcascade_eye.xml");
eyeDetector2.load("E:\\OpenCV-2.3.0\\data\\haarcascades\\haarcascade_eye_tree_eyeglasses.xml");
}catch (cv::Exception e){}
if(faceDetector.empty())
{
cerr<<"error:couldn't load face detector (";
cerr<<"lbpcascade_frontalface.xml)!"<<endl;
exit(1);
}
Mat img=imread(argv[1],1);
Rect largestObject;
const int scaledWidth=320;
detectLargestObject(img,faceDetector,largestObject,scaledWidth);
Mat img_rect(img,largestObject);
Point leftEye,rightEye;
Rect searchedLeftEye,searchedRightEye;
detectBothEyes(img_rect,eyeDetector1,eyeDetector2,leftEye,rightEye,&searchedLeftEye,&searchedRightEye);
//仿射变换
Point2f eyesCenter;
eyesCenter.x=(leftEye.x+rightEye.x)*0.5f;
eyesCenter.y=(leftEye.y+rightEye.y)*0.5f;
cout<<"左眼中心坐标 "<<leftEye.x<<" and "<<leftEye.y<<endl;
cout<<"右眼中心坐标 "<<rightEye.x<<" and "<<rightEye.y<<endl;
//获取两个人眼的角度
double dy=(rightEye.y-leftEye.y);
double dx=(rightEye.x-leftEye.x);
double len=sqrt(dx*dx+dy*dy);
cout<<"dx is "<<dx<<endl;
cout<<"dy is "<<dy<<endl;
cout<<"len is "<<len<<endl;
double angle=atan2(dy,dx)*180.0/CV_PI;
const double DESIRED_RIGHT_EYE_X=1.0f-0.16;
//得到我们想要的尺度化大小
const int DESIRED_FACE_WIDTH=70;
const int DESIRED_FACE_HEIGHT=70;
double desiredLen=(DESIRED_RIGHT_EYE_X-0.16);
cout<<"desiredlen is "<<desiredLen<<endl;
double scale=desiredLen*DESIRED_FACE_WIDTH/len;
cout<<"the scale is "<<scale<<endl;
Mat rot_mat = getRotationMatrix2D(eyesCenter, angle, scale);
double ex=DESIRED_FACE_WIDTH * 0.5f - eyesCenter.x;
double ey = DESIRED_FACE_HEIGHT * DESIRED_LEFT_EYE_Y-eyesCenter.y;
rot_mat.at<double>(0, 2) += ex;
rot_mat.at<double>(1, 2) += ey;
Mat warped = Mat(DESIRED_FACE_HEIGHT, DESIRED_FACE_WIDTH,CV_8U, Scalar(128));
warpAffine(img_rect, warped, rot_mat, warped.size());
imshow("warped",warped);
rectangle(img,Point(largestObject.x,largestObject.y),Point(largestObject.x+largestObject.width,largestObject.y+largestObject.height),Scalar(0,0,255),2,8);
rectangle(img_rect,Point(searchedLeftEye.x,searchedLeftEye.y),Point(searchedLeftEye.x+searchedLeftEye.width,searchedLeftEye.y+searchedLeftEye.height),Scalar(0,255,0),2,8);
rectangle(img_rect,Point(searchedRightEye.x,searchedRightEye.y),Point(searchedRightEye.x+searchedRightEye.width,searchedRightEye.y+searchedRightEye.height),Scalar(0,255,0),2,8);
//getPreprocessedFace
imshow("img_rect",img_rect);
imwrite("img_rect.jpg",img_rect);
imshow("img",img);
waitKey();
}
/*
1、采用给出的参数在图像中寻找目标，例如人脸
2、可以使用Haar级联器或者LBP级联器做人脸检测，或者甚至眼睛，鼻子，汽车检测
3、为了使检测更快，输入图像暂时被缩小到'scaledWidth'，因为寻找人脸200的尺度已经足够了。
*/
void detectObjectsCustom(const Mat &img, CascadeClassifier &cascade, vector<Rect> &objects, int scaledWidth, int flags, Size minFeatureSize, float searchScaleFactor, int minNeighbors)
{
//如果输入的图像不是灰度图像,那么将BRG或者BGRA彩色图像转换为灰度图像
Mat gray;
if (img.channels() == 3) {
cvtColor(img, gray, CV_BGR2GRAY);
}
else if (img.channels() == 4) {
cvtColor(img, gray, CV_BGRA2GRAY);
}
else {
// 直接使用输入图像，既然它已经是灰度图像
gray = img;
}
// 可能的缩小图像，是检索更快
Mat inputImg;
float scale = img.cols / (float)scaledWidth;
if (img.cols > scaledWidth) {
// 缩小图像并保持同样的宽高比
int scaledHeight = cvRound(img.rows / scale);
resize(gray, inputImg, Size(scaledWidth, scaledHeight));
}
else {
// 直接使用输入图像，既然它已经小了
inputImg = gray;
}
//标准化亮度和对比度来改善暗的图像
Mat equalizedImg;
equalizeHist(inputImg, equalizedImg);
// 在小的灰色图像中检索目标
cascade.detectMultiScale(equalizedImg, objects, searchScaleFactor, minNeighbors, flags, minFeatureSize);
// 如果图像在检测之前暂时的被缩小了，则放大结果图像
if (img.cols > scaledWidth) {
for (int i = 0; i < (int)objects.size(); i++ ) {
objects[i].x = cvRound(objects[i].x * scale);
objects[i].y = cvRound(objects[i].y * scale);
objects[i].width = cvRound(objects[i].width * scale);
objects[i].height = cvRound(objects[i].height * scale);
}
}
//确保目标全部在图像内部，以防它在边界上
for (int i = 0; i < (int)objects.size(); i++ ) {
if (objects[i].x < 0)
objects[i].x = 0;
if (objects[i].y < 0)
objects[i].y = 0;
if (objects[i].x + objects[i].width > img.cols)
objects[i].x = img.cols - objects[i].width;
if (objects[i].y + objects[i].height > img.rows)
objects[i].y = img.rows - objects[i].height;
}
// 返回检测到的人脸矩形，存储在objects中
}
/*
1、仅寻找图像中的单个目标，例如最大的人脸，存储结果到largestObject
2、可以使用Haar级联器或者LBP级联器做人脸检测，或者甚至眼睛，鼻子，汽车检测
3、为了使检测更快，输入图像暂时被缩小到'scaledWidth'，因为寻找人脸200的尺度已经足够了。
4、注释：detectLargestObject()要比 detectManyObjects()快。
*/
void detectLargestObject(const Mat &img, CascadeClassifier &cascade, Rect &largestObject, int scaledWidth)
{
//仅寻找一个目标 (图像中最大的).
int flags = CV_HAAR_FIND_BIGGEST_OBJECT;// | CASCADE_DO_ROUGH_SEARCH;
// 最小的目标大小.
Size minFeatureSize = Size(20, 20);
// 寻找细节,尺度因子,必须比1大
float searchScaleFactor = 1.1f;
// 多少检测结果应当被滤掉，这依赖于你的检测系统是多坏,如果minNeighbors=2 ，大量的good or bad 被检测到。如果
// minNeighbors=6，意味着只good检测结果，但是一些将漏掉。即可靠性 VS 检测人脸数量
int minNeighbors = 4;
// 执行目标或者人脸检测，仅寻找一个目标（图像中最大的）
vector<Rect> objects;
detectObjectsCustom(img, cascade, objects, scaledWidth, flags, minFeatureSize, searchScaleFactor, minNeighbors);
if (objects.size() > 0) {
// 返回仅检测到的目标
largestObject = (Rect)objects.at(0);
}
else {
// 返回一个无效的矩阵
largestObject = Rect(-1,-1,-1,-1);
}
}
void detectManyObjects(const Mat &img, CascadeClassifier &cascade, vector<Rect> &objects, int scaledWidth)
{
// 寻找图像中的许多目标
int flags = CV_HAAR_SCALE_IMAGE;
// 最小的目标大小.
Size minFeatureSize = Size(20, 20);
// 寻找细节,尺度因子,必须比1大
float searchScaleFactor = 1.1f;
// 多少检测结果应当被滤掉，这依赖于你的检测系统是多坏,如果minNeighbors=2 ，大量的good or bad 被检测到。如果
// minNeighbors=6，意味着只good检测结果，但是一些将漏掉。即可靠性 VS 检测人脸数量
int minNeighbors = 4;
// 执行目标或者人脸检测，寻找图像中的许多目标
detectObjectsCustom(img, cascade, objects, scaledWidth, flags, minFeatureSize, searchScaleFactor, minNeighbors);
}
/*
1、在给出的人脸图像中寻找双眼，返回左眼和右眼的中心，如果当找不到人眼时,或者设置为Point(-1,-1)
2、注意如果你想用两个不同的级联器寻找人眼，你可以传递第二个人眼检测器，例如如果你使用的一个常规人眼检测器和带眼镜的人眼检测器一样好，或者左眼检测器和右眼检测器一样好，
或者如果你不想第二个检测器，仅传一个未初始化级联检测器。
3、如果需要的话，也可以存储检测到的左眼和右眼的区域
*/
void detectBothEyes(const Mat &face, CascadeClassifier &eyeCascade1, CascadeClassifier &eyeCascade2, Point &leftEye, Point &rightEye, Rect *searchedLeftEye, Rect *searchedRightEye)
{
//跳过人脸边界，因为它们经常是头发和耳朵，这不是我们关心的
/*
// For "2splits.xml": Finds both eyes in roughly 60% of detected faces, also detects closed eyes.
const float EYE_SX = 0.12f;
const float EYE_SY = 0.17f;
const float EYE_SW = 0.37f;
const float EYE_SH = 0.36f;
*/
/*
// For mcs.xml: Finds both eyes in roughly 80% of detected faces, also detects closed eyes.
const float EYE_SX = 0.10f;
const float EYE_SY = 0.19f;
const float EYE_SW = 0.40f;
const float EYE_SH = 0.36f;
*/
// For default eye.xml or eyeglasses.xml: Finds both eyes in roughly 40% of detected faces, but does not detect closed eyes.
//haarcascade_eye.xml检测器在由下面确定的人脸区域内搜索最优。
const float EYE_SX = 0.16f;//x
const float EYE_SY = 0.26f;//y
const float EYE_SW = 0.30f;//width
const float EYE_SH = 0.28f;//height
int leftX = cvRound(face.cols * EYE_SX);
int topY = cvRound(face.rows * EYE_SY);
int widthX = cvRound(face.cols * EYE_SW);
int heightY = cvRound(face.rows * EYE_SH);
int rightX = cvRound(face.cols * (1.0-EYE_SX-EYE_SW) ); // 右眼的开始区域
Mat topLeftOfFace = face(Rect(leftX, topY, widthX, heightY));
Mat topRightOfFace = face(Rect(rightX, topY, widthX, heightY));
Rect leftEyeRect, rightEyeRect;
// 如果需要的话，然后搜索到的窗口给调用者
if (searchedLeftEye)
*searchedLeftEye = Rect(leftX, topY, widthX, heightY);
if (searchedRightEye)
*searchedRightEye = Rect(rightX, topY, widthX, heightY);
// 寻找左区域，然后右区域使用第一个人眼检测器
detectLargestObject(topLeftOfFace, eyeCascade1, leftEyeRect, topLeftOfFace.cols);
detectLargestObject(topRightOfFace, eyeCascade1, rightEyeRect, topRightOfFace.cols);
// 如果人眼没有检测到，尝试另外一个不同的级联检测器
if (leftEyeRect.width <= 0 && !eyeCascade2.empty()) {
detectLargestObject(topLeftOfFace, eyeCascade2, leftEyeRect, topLeftOfFace.cols);
//if (leftEyeRect.width > 0)
// cout << "2nd eye detector LEFT SUCCESS" << endl;
//else
// cout << "2nd eye detector LEFT failed" << endl;
}
//else
// cout << "1st eye detector LEFT SUCCESS" << endl;
// 如果人眼没有检测到，尝试另外一个不同的级联检测器
if (rightEyeRect.width <= 0 && !eyeCascade2.empty()) {
detectLargestObject(topRightOfFace, eyeCascade2, rightEyeRect, topRightOfFace.cols);
//if (rightEyeRect.width > 0)
// cout << "2nd eye detector RIGHT SUCCESS" << endl;
//else
// cout << "2nd eye detector RIGHT failed" << endl;
}
//else
// cout << "1st eye detector RIGHT SUCCESS" << endl;
if (leftEyeRect.width > 0) { // 检查眼是否被检测到
leftEyeRect.x += leftX; //矫正左眼矩形，因为人脸边界被去除掉了
leftEyeRect.y += topY;
leftEye = Point(leftEyeRect.x + leftEyeRect.width/2, leftEyeRect.y + leftEyeRect.height/2);
}
else {
leftEye = Point(-1, -1); // 返回一个无效的点
}
if (rightEyeRect.width > 0) { //检查眼是否被检测到
rightEyeRect.x += rightX; // 矫正左眼矩形，因为它从图像的右边界开始
rightEyeRect.y += topY; // 矫正右眼矩形，因为人脸边界被去除掉了
rightEye = Point(rightEyeRect.x + rightEyeRect.width/2, rightEyeRect.y + rightEyeRect.height/2);
}
else {
rightEye = Point(-1, -1); // 返回一个无效的点
}
}

运行效果图：

1、

2、检测到的人脸矩形区域：

3、人脸矫正和尺寸归一化到70*70后的结果图：

我要说的：

1、代码是截取的原文中的一小部分，搭配好环境可以直接运行，人家的程序可能适用于网络摄像头拍的正对着人脸的，一个人脸图像。而不是针对一般的有一群人，人脸小一些的，或者人脸不是正面的图像，你可以那lena图像试一下，它只能检测到一只左眼（真实的右眼），而另外一只检测不到，那么就会返回一个无效的点Point(-1,-1)作为眼睛的中心，那么更别提后面的旋转了，即后面的旋转肯定也是不对的。在你用本程序测试的时候，一定要选择一个合理的图像。

2、我讲一下关于旋转平移的代码的理解：

首先我们看下图：

这是我们的目的图像，满足的要求为:

(1)大小为70*70;

(2)两个眼睛直接的距离为（1-0.16）*70;（图中的（0.16，0.14）是左眼中心在图像中比例位置，由于人眼时对称的，则右眼所在比例位置为（0.68，0.14），要想获得真实的位置乘以70即可，对于本例是这样的）

(3)两个人眼连线的中心位置；

有了上述三个条件，我们就可以固定一双人眼在一个大小（这里是70*70）固定的图像中的具体位置。下面的代码就是要实现这个功能：

[cpp] view plain copy

Point2f eyesCenter;//原图像两个眼睛连续的中心点（参考下图参）
eyesCenter.x=(leftEye.x+rightEye.x)*0.5f;
eyesCenter.y=(leftEye.y+rightEye.y)*0.5f;
double dy=(rightEye.y-leftEye.y);
double dx=(rightEye.x-leftEye.x);
double len=sqrt(dx*dx+dy*dy);//原图像两个眼睛之间的距离
double angle=atan2(dy,dx)*180.0/CV_PI;//计算出来的旋转角度

[cpp] view plain copy

//目标图像的位置
const double DESIRED_RIGHT_EYE_X=1.0f-0.16;
const int DESIRED_FACE_WIDTH=70;
const int DESIRED_FACE_HEIGHT=70;
double desiredLen=(DESIRED_RIGHT_EYE_X-0.16);//目标图像两个眼睛直接的比例距离,乘以WIDTH=70即得到距离
double scale=desiredLen*DESIRED_FACE_WIDTH/len;//通过目的图像两个眼睛距离除以原图像两个眼睛的距离，得到旋转矩阵的尺度因子.

[cpp] view plain copy

Mat rot_mat = getRotationMatrix2D(eyesCenter, angle, scale);//绕原图像两眼连线中心点旋转，旋转角度为angle，缩放尺度为scale

[cpp] view plain copy

//难点部分理解,实现中心点的平移，来控制两个眼睛在图像中的位置：
double ex=DESIRED_FACE_WIDTH * 0.5f - eyesCenter.x;//获取x方向的平移因子,即目标两眼连线中心点的x坐标—原图像两眼连线中心点x坐标
double ey = DESIRED_FACE_HEIGHT * DESIRED_LEFT_EYE_Y-eyesCenter.y;//获取x方向的平移因子,即目标两眼连线中心点的x坐标—原图像两眼连线中心点x坐标
rot_mat.at<double>(0, 2) += ex;//将上述结果加到旋转矩阵中控制x平移的位置
rot_mat.at<double>(1, 2) += ey;//将上述结果加到旋转矩阵中控制y平移的位置
Mat warped = Mat(DESIRED_FACE_HEIGHT, DESIRED_FACE_WIDTH,CV_8U, Scalar(128));
warpAffine(img_rect, warped, rot_mat, warped.size());

我们可以假想一下，上边的代码如果没有最后一个中心点的平移，之前的旋转矩阵只能控制图像的缩放和两个眼睛直接的相对位置，但是控制不了两个眼睛在图像中的位置，即固定两个眼在图像中的位置。

补充知识(仿射变换)：

上图中a0,b0为控制平移的因子，如果我们领a2=1,a1=0,b2=0,b1=1，即变为u=x+a0,v=y+b0;
参考图：

【第4章】项目实战-亿级电商系统需求分析 cherry5230 架构需求分析大数据数据库架构
1-14项目背景介绍项目基本背景平台类型:B2B电商平台年交易额:超200亿元客户定位:行业龙头企业项目规模:历时:1年以上总投入:450+人月费用等级:千万级业务背景解析1.平台业务模式演进初始阶段自营模式:自有品牌商品完整生产链:设计→生产→制造→销售主要客户:企业采购业务特点:自产自销发展阶段平台扩展:引入供应商体系商品结构:自有商品供应商商品客户服务升级:提供综合商品包一站式采购解决方案2
摄像头技术OpenCV yzx991013 计算机视觉项目机器学习人工智能 python
进一步添加功能：运动检测、调整亮度对比度、截图时添加日期水印、保存视频时可选择不同编码格式完整代码：importcv2importtimeimportdatetimedefcamera_system():#打开摄像头cap=cv2.VideoCapture(0)ifnotcap.isOpened():print("无法打开摄像头")return#获取摄像头的宽度和高度frame_width=int
PHP前置知识-HTML学习 freesec html 学习前端
HTML学习1、因特网和万维网1.1、Internet因特网：全球资源的总汇，连接网络的网络1.2、TCP/IP协议簇：传输层/网络层协议1.3、万维网：www（worldwideweb）HTTP超文本传输协议作用：接受和发布HTMl页面URL统一资源定位符协议://域名:端口号/文件路径/文件名.文件后缀http://www.QQ.com.cn:80/tq/index.html1.4、W3C组织
程序员都在偷偷用的黑科技工具，老板发现后竟主动要求加薪？后端
上周三凌晨两点，我正对着满屏的SQL报错信息抓耳挠腮。同事老王突然在微信群里甩来一行代码："试试用DeepSeek分析你的数据库日志。"我半信半疑地复制粘贴，没想到这个看似普通的指令，居然在十秒内就定位到了索引缺失的根源。更魔幻的是，第二天早会上，那个总板着脸的CTO居然在全员面前点名表扬了我的"超强问题排查能力"。这就是DeepSeek最让我着迷的地方——它总能把复杂的代码问题变成幼儿园算术题。
深度学习框架PyTorch——从入门到精通（4）数据转换 Fansv587 Torch框架学习深度学习 pytorch 人工智能 python 经验分享
转换（Transforms）很多时候，数据并不总是以训练机器学习算法所需的最终处理形式出现。所以我们需要使用变换对数据进行一些处理，使其适合训练。所有TorchVision数据集都有两个参数——transform来修改特征，target_transform来修改标签——接受包含转换逻辑的可调用项。torchvision.transform模块提供了几个开箱即用的转换。FashionMNIST数据集
《Operating System Concepts》阅读笔记：p389-p407 操作系统
《OperatingSystemConcepts》学习第33天，p389-p407总结，总计19页。一、技术总结1.virtualmemeory(1)定义Atechniquethatallowstheexecutionofaprocessthatisnotcompletelyinmemory.Also,separationofcomputermemoryaddressspacefromphysic
Spring基本使用沉下心来学技术 spring java 后端
Spring是什么？Spring是一个开源框架，它由RodJohnson创建，于2003年发布。Spring框架的主要目标是简化Java企业级应用的开发，通过提供一组全面的解决方案，如依赖注入、控制反转（IOC）、面向切面编程（AOP）、事务管理等，使得开发者能够更加专注于业务逻辑的实现，而不是底层的细节。官网：https://spring.io/projects/spring-framework
oracle cdc logminer与oracle xstream 24k小善 java 大数据 flink
以下为OracleCDC技术中XStream与LogMiner的核心差异解析，结合技术背景、实现原理、性能表现等维度进行系统化对比。一、技术背景与定位差异LogMiner：官方日志分析工具的非正式应用最初设计用于数据库管理员（DBA）审计和分析历史日志，非专为CDC场景优化[1][9][16]。通过解析归档日志（ArchiveLog）或在线日志（OnlineRedoLog）提取变更记录，采用轮询机
大语言模型的训练数据清洗策略 gs80140 AI python
目录大语言模型的训练数据清洗策略1.数据去重与标准化问题解决方案示例代码（Python实现数据去重）：2.过滤有害内容问题解决方案示例代码（基于关键词过滤有害内容）：3.纠正数据不均衡问题解决方案示例代码（欠采样非均衡数据）：4.识别和纠正刻板印象问题解决方案示例代码（简单的数据增强）：5.处理低质量与无关数据问题解决方案示例代码（去除HTML标签）：6.处理时效性数据问题解决方案示例代码（基于时
如何用贡献法破解90%的数组难题？5大经典案例深度解析六七_Shmily 数据结构与算法分析 python 算法开发语言
如何用贡献法破解90%的数组难题？5大经典案例深度解析引言在算法竞赛和面试中，数组类问题始终占据着重要地位。面对看似复杂的数组题目，老手们往往能一眼看穿本质——因为他们掌握了一个被称为"贡献法"的核武器。这种方法能将时间复杂度从O(n²)优化到O(n)，将空间复杂度从O(n)压缩到O(1)。本文将深入剖析贡献法的核心思想，并通过5个经典案例揭示其精妙之处。一、贡献法的底层逻辑贡献法（Contrib
WebRTC 介绍 KillFuckBugs webrtc
WebRTC简介WebRTC（WebRealTimeCommunication，网页实时通信）是一个开源项目和技术标准，旨在为浏览器和应用程序提供实时通信功能，无需额外的插件或第三方软件。它最初由Google在2011年发起，现由W3C（万维网联盟）和IETF（互联网工程任务组）共同维护和标准化。WebRTC的核心目标是实现低延迟、高质量的音视频通信以及点对点数据传输，广泛应用于视频会议、实时聊天
手机租赁系统开发核心技术解析红点租赁系统开发其他
内容概要如果把手机租赁系统比作一台精密运转的智能管家，那它的骨架可不是用代码随便搭的乐高积木。这玩意儿得同时搞定三件事：让用户像刷短视频一样流畅下单，让风控系统比小区门禁还难糊弄，还得让物流信息比外卖小哥的定位更透明。想象一下，当你在APP里滑动挑选最新款折叠屏手机时，后台其实正在上演三重加密的信用评分大战——你的芝麻信用分、电商平台消费记录甚至社交账号活跃度，都被塞进算法熔炉里炼成租赁权限的通行
微软开源神器OmniParser V2.0 介绍魔王阿卡纳兹开源项目观察大模型知识札记 microsoft OmniParser 开源项目
微软开源的OmniParserV2.0是一款基于纯视觉技术的GUI智能体解析工具，旨在将用户界面（UI）截图转换为结构化数据，从而实现对计算机屏幕上的可交互元素的高效识别和操控。这一工具通过结合先进的视觉解析技术和大型语言模型（LLM），显著提升了AI智能体在复杂环境下的识别能力和操作效率。核心功能与特点高精度识别：OmniParserV2.0在检测小尺寸可交互UI元素时的准确率显著提升，达到了3
IBM提出新的企业信息化架构是什么自由鬼产品分析对比行业发展架构企业信息化架构
一、传统企业信息化架构特点：模块化架构：以传统的ESB（企业服务总线）作为数据和业务逻辑的集成枢纽。包括ERP、HR、资金管理、MES（制造执行系统）、BPM（业务流程管理）等业务模块。数据控制和分层：数据通过静态数据和实时数据分层进行管理。静态数据包含EPC、布置图等，实时数据主要覆盖生产运营中的动态信息。标准化体系：强调开发、接口、制图、采集等方面的标准化。安全性与基础环境：数据管理较为传统，
深度学习中的Channel，通道数是什么？ %KT% 深度学习深度学习人工智能
参考文章：直观理解深度学习的卷积操作，超赞！-CSDN博客如何理解卷积神经网络中的通道（channel）_神经网络通道数-CSDN博客深度学习-卷积神经网络—卷积操作详细介绍_深度卷积的作用-CSDN博客正文：在跑深度学习代码的过程中，经常遇到的一个报错是：模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是：torch.size([16,3,24,24])。这四个参数的含义如下：16
JavaScript基础-获取元素難釋懷 javascript 开发语言
在Web开发中，使用JavaScript动态地访问和操作网页上的元素是一项基本技能。通过获取页面上的特定元素，我们可以对其进行各种操作，比如修改内容、样式或属性等。本文将详细介绍几种获取DOM元素的方法，并探讨它们的特点及适用场景。一、为什么需要获取元素？在现代Web应用中，交互性是关键。无论是响应用户的输入、更新页面内容还是实现动画效果，首先都需要定位到相关的HTML元素。掌握不同的获取元素的方
lxml学习笔记 weixin_33843409 python
问题1：有一个XML文件，如何解析问题2：解析后，如果查找、定位某个标签问题3：定位后如何操作标签，比如访问属性、文本内容等fromlxmlimportetree->导入模块，该库常用的XML处理功能都在lxml.etree中requests+lxml解析小from lxml import etree import requests page = 1 url = 'http://www.
基于STM32单片机的人脸识别电子密码锁RFID刷卡门禁锁设计+红外避障检测人流量液晶显示设计DIY25-147 通旺科技单片机 stm32 嵌入式硬件
STM32单片机+红外人流量统计+人脸识别(管理)+RFID刷卡+密码可设+TFT屏+舵机+蜂鸣器+矩阵按键本系统由STM32F103C8T6单片机核心板、1.44寸TFT彩屏、红外避障传感器、人脸识别模块、RFID射频卡读写模块、舵机驱动电路、蜂鸣器报警电路、矩阵按键电路及电源组成。【1】设备识别到已录入的人脸信息、已录入的RFID卡号信息、输入密码正确，则进行舵机控制，打开门禁；同时液晶能够显
鸿蒙30道高频面试题总结 zero_godv harmonyos 面试华为
1.什么是弹性布局？Flex容器，弹性布局分为单行布局和多行布局，单行内：当子元素尺寸总和大于Flex容器尺寸是，子元素会自动挤压。多行内：用wrap属性控制自动换行2.绝对定位和相对定位的区别？绝对定位：position，相对父组件左上角进行偏移，不占位置相对定位：offset，相对自身左上角进行便宜，占位置3.什么是层叠布局？Stack：实现位置的固定定位与层叠，后一个子元素覆盖前一个子元素通
谈谈 TypeScript 中的模块系统，如何使用 ES Modules 和 CommonJS 模块？程序员黄同学 TypeScript 前端开发 JavaScript typescript ubuntu javascript
模块系统是TypeScript项目组织代码的核心机制，主要用于代码拆分、复用和依赖管理。TypeScript支持ESModules（ESM）和CommonJS两种主流模块系统，理解它们的差异和使用场景是前端开发中的必备技能。以下从基础语法、配置、互操作性到实战建议展开说明。一、ESModules（ESM）：标准化的模块系统1.基础语法ESM使用import/export语法，是ECMAScript
高亮动态物体——前景提取与动态物体检测器（opencv实现） WenJGo AI学习之路 Python之路 opencv 计算机视觉人工智能深度学习神经网络
目录代码说明1.导入库2.创建背景建模对象3.打开视频源4.逐帧处理视频5.应用背景建模获得前景掩码6.形态学操作去除噪声6.1定义形态学核6.2开运算去除噪点6.3膨胀操作填补前景区域空洞7.轮廓检测识别动态物体8.绘制轮廓和边界框9.显示处理结果10.退出控制与资源释放整体代码效果展示代码说明主要功能是通过背景建模检测视频中的运动目标。其工作流程如下：读取视频帧；利用MOG2算法生成前景掩码；
征程 6 VP简介与单算子实操自动驾驶算法
1.如何理解VPVP，全称VisionProcess，指UCP中的视觉处理功能模块。Backends，指UCP框架中的可分配处理单元。VP模块主要用于模型的前后处理环节，在地平线统一架构中，多种硬件均已搭载了图像处理的算子，而VP模块将图像处理相关的硬件调用进行了封装，通过设置backend来选择不同的硬件方案（若不指定backend，UCP会自动适配负载更低的处理单元），从而平衡开发板负载。VP
《基于Workspace.java的Launcher3改造：HotSeat区域动态阻断文件夹生成机制》 KdanMin 【高通 Android 系统开发系列】开发语言 android
1.需求背景与技术挑战在Android13系统Launcher3定制化开发中，需实现禁止HotSeat区域创建文件夹的功能。原始逻辑中，当用户拖拽应用图标至HotSeat区域相邻图标时，会触发FolderIcon的实例化。本文将深入分析Launcher3的文件夹创建机制，并提供可靠的解决方案。2.核心修改文件定位复制packages/apps/Launcher3/src/com/android/l
“查找”功能发展到今天，便利了生活哪些地方？北京自在科技科技生活 findmy ios Google
在智能设备普及的今天，苹果的FindMy与谷歌的FindMyDevice两大定位系统，已从简单的“防丢工具”演变为重塑生活方式的数字基础设施。它们以技术创新为基石，在物品追踪、跨设备协同、隐私保护等维度深刻改变了人们的日常体验。一、物品防丢：从钥匙到宠物的全方位守护高频物品的精准定位苹果FindMy通过AirTag等配件，结合GPS、蓝牙信标和UWB超宽带技术，可对钥匙、钱包等小物件实现厘米级定位
使用Windbg分析dump文件定位软件异常的方法与操作步骤 dvlinker C++软件调试异常排查 Windbg Windbg命令 dump文件 pdb符号文件函数调用堆栈
目录1、Windbg简介2、Windbg版本与安装3、Windbg常用命令4、静态分析dump文件的一般步骤4.1、查看异常类型4.2、使用.ecxr命令切换到发生异常的线程上下文，查看发生异常的那条汇编指令4.3、使用kn/kv/kp命令查看异常发生时的函数调用堆栈4.4、使用lm命令查看模块的时间戳，找到对应的pdb文件，设置到Windbg中5、实战问题分析实例说明6、使用Windbg详细分析
通过查看Windbg中变量的值，快速定位因内存不足引发bad alloc异常（C++ EH exception - code e06d7363）导致程序崩溃的问题 dvlinker C/C++实战专栏 C++软件调试 code e06d7363 Windbg 内存不足 bad alloc 内存申请失败
目录1、概述2、C++EHexception-codee06d7363与标准C++异常2.1、C++EHexception-codee06d7363说明2.2、C++标准库与C++异常2.2.1、C++抛出异常与捕获异常2.2.2、C++异常类3、查看函数调用堆栈，发现抛出了badalloc内存分配失败的异常4、在调用堆栈中看到CreateBmp创建位图的接口，怀疑可能是使用了异常大的宽高值，导致
前端架构师具备什么能力？前端性能优化全链路指南 kerwin_1727 前端架构师具备什么能力前端性能优化
前端性能优化全链路指南——从构建到运行，让你的页面飞起来！一、性能优化全链路概览性能优化不是“一招鲜”，而是从构建时到运行时的全流程优化。以下是核心链路：构建时：减少打包体积（TreeShaking、CodeSplitting）。加载时：加速资源加载（懒加载、预加载）。运行时：提升渲染效率（虚拟列表、WebWorker）。监控与诊断：用工具定位问题（ChromePerformance、Lighth
【资料分享】标准规范汇总(2025.3.13更新) 交换机路由器测试之路网络协议网络协议国标行标 ITU TR069 802.11 IEEE
引言学习标准规范不仅是测试人员的基本职责，也是确保测试质量、提升产品竞争力和降低风险的关键。通过掌握和应用标准规范，测试工作可以更加规范、高效和权威，为产品和项目的成功提供有力保障。本文分享交换机路由器测试中涉及到标准规范。国标行标国家标准由国家市场监督管理总局和国家标准化管理委员会负责管理，代号为GB（国标拼音首字母），分GB（强制性标准）和GB/T（推荐性标准）。通信行业标准是针对通信技术和设
5大陷阱+实战：C#日志分析，从‘日志迷宫’到‘监控神殿’的逆袭全攻略！墨瑾轩 C#乐园 c#网络开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣你的日志还在‘打哑谜’吗？“错误日志像‘天书’读不懂？监控告警像‘哑巴’不发声？”——别慌！今天用C#日志分析，让你的系统像“福尔摩斯”一样精准破案，从实时监控到根因定位，从此告别“黑盒运维”！权威背书：日志分析≠‘抄作业’！“90%的故障因‘日志解析缺失’导
OpenCV-Python实战（1）——OpenCV简介与图像处理基础数字化转型2025 AI人工智能方向 opencv python 图像处理
OpenCV介绍Python安装OpenCV：对于Linux和Windows操作系统，首先需要在shell或cmd中运行以下命令安装NumPy：pipinstallnumpy。然后再安装OpenCV，可以选择仅安装主模块包：pipinstallopencv-python，或者安装完整包（包括主模块和附加模块）：pipinstallopencv-contrib-python。OpenCV主要模块：O
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/

人脸识别之人眼定位、人脸矫正、人脸尺寸标准化---

你可能感兴趣的:(人脸识别之人眼定位、人脸矫正、人脸尺寸标准化---)