zhaocj

Opencv2.4.9源码分析——Cascade Classification（三）

前两篇文章分别介绍了级联分类器的原理和源码解析，下面我们给出一个具体的应用实例。

下面我们以车牌识别为例，具体讲解OpenCV的级联分类器的用法。在这里我们只对蓝底白字的普通车牌进行识别判断，对于其他车牌不在考虑范围内。而且车牌是正面照，略微倾斜可以，倾斜程度太大也是不在识别范围内的。

我们通过不同渠道共收集了1545幅符合要求的带有车牌图像的照片（很遗憾，我只能得到这么多车牌照片，如果能再多一些就更好了！），通过ACDSee软件手工把车牌图像从照片中剪切出来，并统一保存为jpg格式。为便于后续处理，我们把文件名按照数字顺序命名，如图8所示。然后我们把这些车牌图像保存到pos文件夹内。

图8 蓝底白字车牌图像

需要注意的是，在这里我们没有必要把车牌图像缩放成统一的尺寸（即正样本图像的大小），更没有必要把它们转换成灰度图像，这些工作完全可以由系统完成。我们只需要告诉系统车牌图像文件、车牌的位置，以及车牌的尺寸大小即可。

为了高效的完成上述工作，我们编写了以下代码：

#include "opencv2/core/core.hpp"
#include "opencv2/highgui/highgui.hpp"
#include "opencv2/imgproc/imgproc.hpp"

#include 
#include  
#include 
using namespace cv;
using namespace std;

int main( int argc, char** argv )
{	
	ofstream postxt("pos.txt",ios::out);    //创建pox.txt文件
	if ( !postxt.is_open() )
	{
		cout<<"can not creat pos txt file!";
		return false;
	}
    //N表示车牌图像的总数，c表示最终可以利用的车牌样本图像的数量
	int N = 1545, c = 0; 
	int width, height, i;
	String filename;

	Mat posimage;

	for(i=0;i

 
   
  执行完该程序后，在终端输出得到的c值为1390，这说明有155（1545-1390）个车牌图像由于尺寸过小而被剔除。另外，在当前目录下我们还得到了pos.txt文件，该文件正是系统所需要的，它的文件内容如图9所示。 
   
  图9 pos.txt文件 
  在pos.txt文件中，每一行代表一个图像文件。我们以第一行为例，它表示pos文件夹内的0.jpg文件，后面的“1”表示该文件只有一个样本图像（即车牌），再后面的“0  0”表示该样本图像的左上角坐标，由于我们已经对图像进行了剪切，每个jpg文件就是一幅完成的车牌，所以所有行的这三个变量都是“1  0  0”。最后的“450  140”表示0.jpg文件的宽和高。 
    
  我们收集了10589幅大小不同的不含车牌图像的无水印、无logo、无日期的照片。这些照片统一转换为jpg格式，并且也是按照数字的顺序命名，如图10所示。然后我们把这些照片放入neg文件夹内。 
   
  图10 不含车牌图像的照片 
  这些照片的尺寸没有要求，只要大于正样本图像的尺寸即可，因为系统是对这些照片进行剪切，从而得到与正样本图像尺寸相同的负样本图像，所以一幅照片可以得到若干个负样本图像。这些照片尽量保证多样性，并且每幅照片的内容尽可能的丰富，当然最重要的一点是不能含有车牌信息。 
  我们还需要为系统提供一个保存有这些照片信息的文本文件。同样的，我们也写了一段简单的程序来完成这个工作： 
  #include "opencv2/core/core.hpp"
#include "opencv2/highgui/highgui.hpp"
#include "opencv2/imgproc/imgproc.hpp"

#include 
#include  
#include 
using namespace cv;
using namespace std;

int main( int argc, char** argv )
{	
	ofstream negtxt("neg.txt",ios::out);    //创建neg.txt文件
	if ( !negtxt.is_open() )
	{
		cout<<"can not creat neg txt file!";
		return false;
	}
    //N表示照片的总数，c表示最终得到的照片的数量
	int N = 10589, c=0;
	int i;
	String filename;

	Mat posimage;

	for(i=0;i
 
  执行完该程序后，在当前目录下得到了neg.txt文件，它的文件内容如图11所示。 
   
  图11 neg.txt文件 
    
  以上内容准备好后，我们就可以利用Opencv提供的相关程序得到能够识别车牌的级联分类器了。 
  首先在D盘下新建plate文件夹，我们把前面提到的保存有大量照片图像的pos和neg这两个文件夹、以及pos.txt和neg.txt这两个文本文件复制到plate文件夹内，再在plate文件夹内新建data文件夹（后面需要）。由于本人的电脑是64位win7系统，编译器使用的是Microsoft Visual Studio 2012，因此需要从opencv/build/x64/vc11/bin文件夹内复制opencv_createsamples.exe和opencv_traincascade.exe这两个文件到plate文件夹内。opencv_createsamples.exe用于创建系统所需的正样本vec文件，opencv_traincascade.exe用于训练级联分类器。这两个文件都需要在命令行下运行。 
  opencv_createsamples.exe所需的参数较多，这里我们只把要用到的参数进行讲解： 
  -info：用于表示含有车牌照片的文本文件，即pos.txt 
  -bg：用于表示不含车牌照片的文本文件，即neg.txt 
  -vec：输出的正样本vec文件名，我们把这个文件命名为pos.vec 
  -num：车牌照片图像的数量，即1390 
  -w：正样本图像的宽（像素） 
  -h：正样本图像的高（像素） 
  后两个参数需要我们根据实际情况填写，由于我们只对蓝底白字的车牌进行识别，这类车牌的实际尺寸为440mm×140mm，我们必须要保持正样本图像的宽和高也是这个比例，而且宽和高不能过大，更不能过小。综合考虑，我们选择：-w为58，-h为18。 
  在前面我们准备车牌照片时，并没有把车牌缩放成58×18这个尺寸，这是因为opencv_createsamples.exe会根据-w和-h这两个参数对图像进行统一缩放处理的，所以前面就没有处理。 
  最终的opencv_createsamples.exe命令为： 
  opencv_createsamples.exe  -info  pos.txt  -bg  neg.txt -vec  pos.vec  -num  1390  -w 58  -h  18 
  为方便起见，我们把这个命令保存到createsamples.bat批处理文件中，这样只要执行该文件即可。执行的结果如图12所示，并且在plate文件夹内会生成pos.vec文件。 
   
  图12 opencv_createsamples.exe执行结果 
    
  下面就要执行opencv_traincascade.exe来训练级联分类器，该命令所需要的参数也较多，但都很重要，它们的含义如下： 
  -data：文件夹名，用于保存训练生成的各种xml文件，该文件夹一定要事先创建好，否则系统会报错，在这里，我们定义该文件夹名为data，它已在前面创建好 
  -vec：由opencv_createsamples.exe程序生成的正样本vec文件，即pos.vec 
  -bg：用于表示不含车牌照片的文本文件，即neg.txt 
  -numPos：训练级联分类器的每一级分类器（即强分类器）时所用的正样本数目 
  -numNeg：训练级联分类器的每一级分类器（即强分类器）时所用的负样本数目 
  -numStages：最终得到的级联分类器的级数，我们设置为12 
  -precalcValBufSize：用于存储预先计算特征值的内存空间大小，单位为MB 
  -precalcIdxBufSize：用于存储预先计算特征索引的内存空间大小，单位为MB 
  -stageType：强分类器的类型，目前只实现了AdaBoost，因此唯一的值（缺省值）为BOOST 
  -featureType：特征类型，HAAR（缺省值），LBP或HOG 
  -w：正样本图像的宽，必须与opencv_createsamples.exe命令的参数一致，即58 
  -h：正样本图像的高，必须与opencv_createsamples.exe命令的参数一致，即18 
  -bt：AdaBoost的类型，DAB，RAB，LB或GAB（缺省值） 
  -minHitRate：原理部分提到的每级分类器的最小识别率 
  -maxFalseAlarmRate：原理部分提到的每级分类器的最大错误率 
  -weightTrimRate：用于决策树的剪枝，缺省值为0.95 
  -maxDepth：决策树的最大深度，缺省值为1，即该决策树为二叉树（树墩形） 
  -maxWeakCount：强分类器所包含的最大决策树的数量，该值也与最大错误率有关，我们定义该值为150 
  -mode：如果特征为HAAR，则该参数决定了使用哪种HAAR状特征（见图1），BASIC（缺省值）、CORE或ALL 
  下面我们就重点介绍几个重要参数的选取。由于本人的计算机的内存为16G，为了最大化的利用该内存，我们把-precalcValBufSize和-precalcIdxBufSize这两个参数值都定义为5000，即5G。最小识别率和最大错误率决定了训练时间的长短和识别的质量，我们定义这两个值分别为0.999和0.25。-numPos指的是训练强分类器时所用的正样本数量，它并不是全体正样本的数量，原则上该值越大，分类器的质量越好，但还要考虑识别率，如果识别率设置得不高，会有一些正样本被识别为负样本，因此要有一定的冗余，当然系统也考虑到了这点，即如果正样本都用完了，并且还没有达到numPos所指定的数量，则系统会调整该值为实际的数量（详细内容见前面的源码分析部分）。我们设置该值为1300。-numNeg设置为多大似乎还没有定论，但通过阅读Viola & Jones算法的原文发现，他们使用9832个正样本（4916个人脸图像，再加上它们的垂直镜像图像）和10000个负样本，正、负样本的数量接近于1：1，因此我们设置numNeg为1350。 
  最终的opencv_traincascade.exe命令为： 
  opencv_traincascade.exe  -data  data -vec  pos.vec  -bg  neg.txt -numPos  1300  -numNeg  1350  -numStages  12  -precalcValBufSize  5000  -precalcIdxBufSize  5000  -w 58  -h  18  -maxWeakCount  150  -mode ALL  -minHitRate  0.999  -maxFalseAlarmRate 0.25 
  同理，我们也把这个命令保存到批处理文件train.bat中。这里还需要注意一点的是：参数的大小写一定要分区，否则系统出错。 
   
  图13 opencv_traincascade.exe执行过程中输出的参数信息 
   
  图14 opencv_traincascade.exe执行过程中输出的第3级强分类器的信息 
  在执行该命令时，终端首先输出一些参数信息，如图13所示。然后是输出级联分类器的每级强分类器的训练信息，因为我们设置了numStages为12，所以一共有12个强分类器：0-stage至11-stage。图14所示为第3级强分类器的信息。下面我们逐条分析这些信息的含义： 
  ===== TRAINING 3-stage ===== 
   
  表示开始训练第3级强分类器。 
  POS count : consumed   1300 : 1302 
  在训练本级强分类器时，能够使用1300个正样本图像，而这1300个正样本图像是从1302个正样本图像集中选取出来的，也就是说此时有两个正样本没有被识别出来。前面的1300正是opencv_traincascade.exe命令中参数numPos所指定的数量，有时这个值会小于numPos，说明numPos设置过大，并且最小识别率设置的较小，从而导致正样本图像数量不足。后面的1302可以用来表示当前级联分类器的识别率，即由0-stage、1-stage、2-stage组成的级联分类器的识别率。此时的识别率为99.846%，因为1300÷1302=0.99846。 
  NEG count : acceptanceRatio    1350 : 0.00620359 
  在训练本级强分类器时，能够使用1350个负样本图像，这个数正是opencv_traincascade.exe命令中参数numNeg所指定的数量，当然这个数也有可能小于numNeg，这是因为前面信息中POS count的数值不等于numPos所致，具体数值的大小见源码分析。后面的0.00620359表示负样本的接受率，也就是当前强分类器之前的所有强分类器（0-stage、1-stage、2-stage）构成的级联分类器的错误率，即经过当前级联分类器预测后，这些被预测为正样本而实际为负样本的1350幅图像是从多少个负样本图像中得到的。级联分类器的特点是后一级的强分类器只接收那些前面分类器认为是正样本的数据，把负样本预测为正样本，这种情况会随着训练级数的增加，困难程度也在增加，当然这种困难程度还与opencv_traincascade.exe命令中所设置的最大错误率maxFalseAlarmRate有关，错误率设置的越低，困难程度会越大。以本级为例，这1350个负样本是从二十多万个负样本中选择出来的，计算公式为：1350÷0.00620359≈217615。在本例的最后一级强分类器的训练中，这个数值甚至会高达十亿。所以训练过程中的时间消耗主要就在这里。在没有显示该行信息之前，终端输出的是下列信息：NEG current samples: XXXX。XXXX代表着当前时刻得到的负样本数量，这个数值会逐渐增加，当增加到1350时，则会正常显示上面的信息。当此时得到的级联分类器的错误率小于我们所设置的错误率时（以此时为例，当前已得到了3个强分类器：0-stage、1-stage、2-stage，现在要训练第4个强分类器3-stage，当这个强分类器训练好后，这4个强分类器构成的级联分类器应该满足的最大错误率为：0.25×0.25×0.25×0.25=0.00390625），则系统会停止训练，因为当前得到的级联分类器已经满足了要求，无需再训练下去了。 
  Precalculation time:  52.337 
  表示预先计算特征值所消耗的时间，即在没有构建强分类器之前，我们就把一部分特征值计算好了，该值与opencv_traincascade.exe命令中的参数precalcValBufSize和precalcIdxBufSize有关，也就是我们事先为此开辟的内存越大，所保存的特征值就越多，因此计算这些特征值所花费的时间就越长。由于在构建强分类器之前，要用到的特征值都已计算好，所以构建强分类器的时间就大大缩短了。 
  +------+-------------+-------------+ 
  |  N|   HR  |   FA   | 
  +------+-------------+-------------+ 
  |  1|       1|       1| 
  +------+-------------+-------------+ 
  |  2|       1|       1| 
  +------+-------------+-------------+ 
       ……   …… 
  +------+-------------+-------------+ 
  |  10|0.999231|0.336296| 
  +------+-------------+-------------+ 
  |  11|0.999231|0.228148| 
  +------+-------------+-------------+ 
  N表示当前强分类器的弱分类器（即决策树）的训练得到的数量，HR表示当前强分类器的识别率，FA表示当前强分类器的错误率。我们从倒数第2行开始，此时训练得到了10棵决策树，识别率为99.9231%，错误率为33.6296%，识别率满足了要求，即大于最小识别率99.9%，但错误率不满足要求，即它大于最大错误率25%，所以还需要继续训练，当又得到了一棵决策树时（即此时有11棵决策树），识别率和错误率都满足了要求（99.9231%>99.9%，22.8148%<25%）。 
  END> 
  表示此时该级的强分类器已经得到，因为识别率和错误率都满足了要求，所以此级强分类器的训练结束。 
  Training until now has taken 0 days 0 hours27 minutes 2 seconds. 
  表示到目前为止，训练级联分类器共用时27分2秒。 
   
  图15 opencv_traincascade.exe命令执行结束 
  图15显示了整个级联分类器训练完成后的界面，可以看出一共训练了10多个小时。我的计算机的CPU是Intel Core i5-4690K。如果我们把识别率和错误率分别改为0.9995和0.2，则需要一天多的时间，如果再把级数调整为13级，则需要6天。 
  当训练结束后，在data文件夹内会得到cascade.xml文件，这正是我们需要的级联分类器数据，我们利用它就可以识别出车牌。 
  下面的程序是一个简单的应用： 
  #include "opencv2/core/core.hpp"
#include "opencv2/highgui/highgui.hpp"
#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/objdetect/objdetect.hpp"

#include 
#include  
#include 
using namespace cv;
using namespace std;


int main( int argc, char** argv )
{	
	CascadeClassifier classifier("cascade.xml");    //实例化级联分类器
	Mat img = imread("car.jpg");    //读取照片
	vector plates;    //代表车牌区域
    //车牌识别，默认识别的最小车牌为正样本的面积（这里就是58×18），最大为整幅照片的面积，即只能识别面积为58×18以上的车牌
	classifier.detectMultiScale(img, plates);
	for(int I = 0; i < plates.size(); i++)    //画出车牌区域
		rectangle(img, plates[i], Scalar(255, 0, 255), 2);

	imshow("plates", img);
	waitKey(0);

	return 0;
}
 
   
  
 
  图16 识别结果 
  图16为运行的效果。由于手上的车牌照片不多，无法对识别效果做全面的衡量，但从不多的实验结果来看，虽然有错检的情况，检测到的车牌也有不完整的现象，但基本上能够满足要求。我通过一些实验发现，单纯的提高识别率或降低错误率、以及增加级数似乎都不能改善上述问题，我认为只有增大正样本的数量才是提高识别质量的有效方法。 
  下面是对视频文件进行车牌识别： 
  #include "opencv2/core/core.hpp"
#include "opencv2/highgui/highgui.hpp"
#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/objdetect/objdetect.hpp"

#include 
#include  
#include 
using namespace cv;
using namespace std;


int main( int argc, char** argv )
{	
	VideoCapture vedio("cars.avi");    //读取视频
	if(!vedio.isOpened())
	{
		cout<<"视频打开失败！"< plates;
        //车牌检测，这里设定车牌的最大尺寸为190×60
		classifier.detectMultiScale(frame, plates, 1.1, 3, 0, Size(), Size(190, 60));
				
		for(int i = 0; i < plates.size(); i++)
			rectangle(frame, plates[i], Scalar(255, 0, 255), 2);
		//加上文字
putText(frame,"http://blog.csdn.net/zhaocj",Point(50,60),CV_FONT_HERSHEY_COMPLEX,0.7,Scalar(255,0,0), 2);
		writer.write(frame);    //写视频
		
		if (cv::waitKey(delay)>=0)
			break;
	}
	vedio.release();
	return 0;
}
 
  我把视频的结果上传到了下列网址。该视频为3分钟，可以看出，在车牌的可识别尺寸范围内，能够准确识别车牌，当然，也有错检和车牌识别不完整的现象： 
  http://v.youku.com/v_show/id_XMjI4ODM3Mjk1Ng==.html 
    
  另外，我把cascade.xml文件也上传到了下列网址，大家可以下载检验： 
  http://download.csdn.net/detail/zhaocj/9737259

opencv + opengl显示摄像头视频流 jbjhzstsl opencv 计算机视觉
完整代码github建议学习LearnOpenGL教程，学到入门的纹理一节1.OpenGL依赖安装1.1.安装GLFWsudoaptinstalllibglfw3libglfw3-devlibglfw3：GLFW运行时库libglfw3-dev：GLFW开发库（用于编译）1.2.安装OpenGL相关依赖sudoaptinstalllibgl1-mesa-devxorg-devlibgl1-mesa
AttributeError: partially initialized module ‘cv2‘ has no attribute ‘_registerMatType‘ (most likely hunter206206 python pyopencv python
这个错误表明在导入cv2（OpenCV）模块时，发生了循环导入问题，导致模块未能正确初始化。具体来说，cv2模块在初始化过程中尝试调用_registerMatType方法，但由于循环导入，该方法尚未定义。以下是可能的原因和解决方法：1.OpenCV安装问题可能是OpenCV安装不完整或损坏。可以尝试重新安装OpenCV。解决方法：使用pip重新安装OpenCV：pipuninstallopencv
Halcon 和 opencv比有什么区别与优劣 yuanpan opencv 人工智能计算机视觉
Halcon和OpenCV都是机器视觉领域的重要工具，但它们的设计目标、功能特点和适用场景有所不同。以下是两者的详细对比：1.定位与目标用户Halcon：定位：商业机器视觉软件，专注于工业应用。目标用户：工业自动化、质量控制、机器人引导等领域的专业开发者。OpenCV：定位：开源计算机视觉库，适用于通用图像处理和计算机视觉任务。目标用户：学术研究、教育、初创公司以及需要低成本解决方案的开发者。2.
解决 Python 中 `cv2` 模块部分初始化导致的 `AttributeError` Leuanghing python 开发语言
解决Python中cv2模块部分初始化导致的AttributeError在Python开发中，尤其是使用OpenCV库进行图像处理时，可能会遇到一些令人困惑的错误。今天，我们就来探讨一个常见的错误：AttributeError:partiallyinitializedmodule'cv2'hasnoattribute'gapi_wip_gst_GStreamerPipeline'，并提供一个有效的
使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发 UwoiGit tensorflow opencv pygame
在本篇文章中，我们将介绍如何结合使用TensorFlow、OpenCV和Pygame来进行图像处理和游戏开发。这三个工具在机器学习、计算机视觉和游戏开发领域都非常流行，并且它们的结合可以提供强大的功能和无限的创造力。我们将逐步介绍如何安装和配置这些工具，并提供相关的源代码示例。安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架，提供了丰富的工具和库来构建和训练各种深度
摄像头技术OpenCV yzx991013 计算机视觉项目机器学习人工智能 python
进一步添加功能：运动检测、调整亮度对比度、截图时添加日期水印、保存视频时可选择不同编码格式完整代码：importcv2importtimeimportdatetimedefcamera_system():#打开摄像头cap=cv2.VideoCapture(0)ifnotcap.isOpened():print("无法打开摄像头")return#获取摄像头的宽度和高度frame_width=int
高亮动态物体——前景提取与动态物体检测器（opencv实现） WenJGo AI学习之路 Python之路 opencv 计算机视觉人工智能深度学习神经网络
目录代码说明1.导入库2.创建背景建模对象3.打开视频源4.逐帧处理视频5.应用背景建模获得前景掩码6.形态学操作去除噪声6.1定义形态学核6.2开运算去除噪点6.3膨胀操作填补前景区域空洞7.轮廓检测识别动态物体8.绘制轮廓和边界框9.显示处理结果10.退出控制与资源释放整体代码效果展示代码说明主要功能是通过背景建模检测视频中的运动目标。其工作流程如下：读取视频帧；利用MOG2算法生成前景掩码；
OpenCV-Python实战（1）——OpenCV简介与图像处理基础数字化转型2025 AI人工智能方向 opencv python 图像处理
OpenCV介绍Python安装OpenCV：对于Linux和Windows操作系统，首先需要在shell或cmd中运行以下命令安装NumPy：pipinstallnumpy。然后再安装OpenCV，可以选择仅安装主模块包：pipinstallopencv-python，或者安装完整包（包括主模块和附加模块）：pipinstallopencv-contrib-python。OpenCV主要模块：O
OpenCV图像拼接（2）特征查找与图像匹配之基于仿射变换的图像匹配的一个类cv::detail::AffineBestOf2NearestMatcher 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::AffineBestOf2NearestMatcher是OpenCV库中用于实现基于仿射变换的图像匹配的一个类。这个类主要用于在图像拼接流程中，寻找图像间的对应关系，并假设图像间存在仿射变换（即考虑缩放、旋转和平移的变换）。它通过使用“最佳
OpenCV多分辨率模板匹配与容错优化实战指南追寻向上 opencv 人工智能计算机视觉
第一章：问题背景与挑战1.1传统模板匹配的局限性模板匹配（TemplateMatching）是计算机视觉中基础且广泛使用的技术，其核心思想是通过滑动窗口在目标图像中寻找与模板最相似的位置。然而，传统方法（如OpenCV的cv2.matchTemplate）在实际应用中存在以下问题：尺寸敏感性当目标的实际尺寸与模板不一致时，匹配结果会严重偏离。例如，在工业检测中，摄像头与物体的距离变化会导致目标缩放
OpenCV计算摄影学（23)艺术化风格化处理函数stylization() 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述风格化的目的是生成不以照片写实为目标的多种多样数字图像效果。边缘感知滤波器是风格化处理的理想选择，因为它们能够弱化低对比度区域，同时保留或增强高对比度特征。该函数通过艺术化风格化处理，将输入图像转换为具有油画或卡通风格的图像，增强边缘和纹理的对比度，同时保留主要颜
python使用importlib进行动态导入py文件 *Major* python 开发语言 opencv
python动态导入py文件importimportlibdefdynamic_import(module):returnimportlib.import_module(module)实例importimportlibimportcv2defdynamic_import(module):returnimportlib.import_module(module)classOpenCVAlgo:def
LVI-SAM、VINS-Mono、LIO-SAM算法的阅读参考和m2dgr数据集上的复现（留作学习使用）再坚持一下！！！学习
ROS一键安装参考：ROS的最简单安装——鱼香一键安装_鱼香ros一键安装-CSDN博客opencv官网下载4.2.0参考：https://opencv.org/releases/page/3/nvidia驱动安装:ubuntu18.04安装显卡驱动-开始战斗-博客园cuda搭配使用1+2cuda安装1：Ubuntu18.04下安装CUDA_ubuntu18.04安装cuda-CSDN博客cuda
利用 OpenCV 库进行实时目标物体检测欣然～ opencv 人工智能计算机视觉
一、代码概述此代码利用OpenCV库实现了基于特征匹配的实时物体检测系统。通过摄像头捕获实时视频帧，将其与预先加载的参考图像进行特征匹配，从而识别出视频帧中是否存在与参考图像匹配的物体。二、环境依赖OpenCV：用于图像处理、特征提取和匹配等操作。NumPy：用于数值计算，OpenCV依赖于NumPy进行数组操作。可以使用以下命令安装所需库：bashpipinstallopencv-pythonn
OpenCV | 图像读取与显示 ToBeCertain OpenCV opencv 人工智能计算机视觉
OpenCV对图像进行处理时，常用API如下：API描述cv.imread根据给定的磁盘路径加载对应的图像，默认使用BGR方式加载cv.imshow展示图像cv.imwrite将图像保存到磁盘中cv.waitKey暂停一段时间，接受键盘输出后，继续执行程序cv.destroyAllWindows释放所有资源目录一.OpenCV基本操作函数1.cv.imread()图像读取2.cv.imshow()
opencv图像视频的加载和显示 NDNPOMDFLR opencv python
opencv图像视频的加载和显示基于上篇文章，在开始之前需要在上级目录里打开jupyternotebook首先需要进入scrips目录里进行激活，然后如果在该目录下输入jupyternotebook的话，不太好所以需要进入上级目录创建和显示窗口需要牢记的命令namedWindow()创建命令窗口imshow()显示窗口destroyAllwindows()摧毁窗口resizeWindow()改变窗
cv2.imshow报错残影飞雪 Python python
pipinstallopencv-contrib-pythoncv2.error:OpenCV(4.1.0)C:\projects\opencv-python\opencv\modules\highgui\src\window.cpp:627:error:(-2:Unspecifiederror)Thefunctionisnotimplemented.RebuildthelibrarywithWi
解决OpenCV读取目标图像，cv2.imshow出现闪退的问题写python的鑫哥 OpenCV入门与进阶 opencv 人工智能计算机视觉 python 图像显示闪退
前言本文是该专栏的第17篇，后面将持续分享OpenCV计算机视觉的干货知识，记得关注。最近有粉丝朋友询问到OpenCV读取目标图像出现的一个问题，在基于python语言“使用OpenCV读取目标图像的时候，利用cv2.imshow函数出现闪退”的情况。而本文，笔者将详细介绍针对上述问题，给出一个详细的应对思路以及解决方法。废话不多说，具体的细节部分以及详细的解决方案，跟着笔者直接往下看正文详细内容
windows python opencv imshow图片报错解决热爱生活热爱你 python3 opencv 人工智能计算机视觉
importcv2#检查版本print(cv2.__version__)#加载一张图片（确保你有一个名为'test.jpg'的文件在当前目录）image=cv2.imread('C:\\test1.jpg')#显示图片cv2.imshow('image',image)cv2.waitKey(0)cv2.destroyAllWindows()cv2意思是opencvc++o(*￣︶￣*)o建议使用A
OpenCV 深度学习模块 cv2.dnn 与其他深度学习框架的优缺点对比及适用场景白.夜深度学习 opencv
OpenCV提供了一个深度学习模块cv2.dnn，让开发者能够在计算机视觉项目中轻松加载和推理深度学习模型。相比于TensorFlow、PyTorch等其他深度学习框架，cv2.dnn有其独特的优点与缺点，适用于不同的应用场景。在这篇文章中，我们将详细分析cv2.dnn的优缺点，并讨论它的适用场景。一、cv2.dnn的优点1.简单易用cv2.dnn提供了一个相对简单且易于使用的接口，适合已经在使用
深度学习中的 blob 格式：与普通 image 的区别及转换原因白.夜深度学习人工智能
在深度学习模型推理过程中，我们经常会用到cv2.dnn.blobFromImage函数将普通图像转换为blob格式。那么，blob格式到底是什么？它和普通image有什么区别？为什么在模型推理中需要这种转换？本文将用通俗的语言为你解答这些问题。1.什么是blob格式？blob是OpenCV中用于深度学习模型输入的一种特殊数据格式，全称为BinaryLargeObject。它本质上是一个多维数组（通
python opencv轮廓检测_python opencv中的不规则形状检测和测量 weixin_39584529 python opencv轮廓检测
正如我在评论中提到的那样,对于这个问题,分水岭似乎是一个很好的方法.但是当你回答时,定义标记的前景和背景是困难的部分！我的想法是使用形态梯度沿着冰晶获得良好的边缘并从那里开始工作;形态梯度似乎很有效.importnumpyasnpimportcv2img=cv2.imread('image.png')blur=cv2.GaussianBlur(img,(7,7),2)h,w=img.shape[:
OpenCV学习(二十一) ：计算图像连通分量:connectedComponents(),connectedComponentsWithStats() Leon_Chen0 OpenCV
OpenCV学习(二十一)：计算图像连通分量:connectedComponents(),connectedComponentsWithStats()1、connectedComponents()函数ConnectedComponents即连通体算法用id标注图中每个连通体，将连通体中序号最小的顶点的id作为连通体的id。如果在图G中，任意2个顶点之间都存在路径，那么称G为连通图，否则称该图为非连
OpenCV图像基础天行者@ opencv 人工智能计算机视觉
OpenCV其实就是一堆C和C++语言的源代码文件,这些源代码文件中实现了许多常用的计算机视觉算法。OpenCV的全称是OpenSourceComputerVisionLibrary,是一个开放源代码的计算机视觉库OpenCV最初由英特尔公司发起并开发,以BSD许可证授权发行,可以在商业和研究领域中免费使用,现在美国WillowGarage为OpenCV提供主要的支持OpenCV可用于开发实时的图
android 基于OpenCV4.8微笑检测自动拍照 mmsx android 作业源码分享 android opencv
一，前言1、基于OpenCV4.8微笑检测自动拍照存储2、左侧有一个预览小框，有人脸时候会有红色框框。3、当真人入境时候，微笑。相机预览捕捉到了人的微笑，自动拍照保存。opencv库的编译就不说了。这篇有介绍：androidopencv导入进行编译_编译androidopencv-CSDN博客二、加载人脸特征和微笑特征文件faceCascade=loadCascade(R.raw.haarcasc
67-OpenCVSharp 创建实现Halcon的tile_images_offset算子（用于图像拼接，对每张图像设置偏移量）搬码驿站 #opencv 计算机视觉人工智能算法图像处理
以下是基于OpenCvSharp实现的Halcontile_images_offset算子的高性能函数。该函数不仅支持图像拼接，还允许对每张图像设置偏移量（offset），以灵活布局图像。代码中包含了详细注释和性能优化策略。为了优化运行时间和性能，我们可以从以下几个方面对代码进行改进：并行处理：利用多核CPU的能力，通过Parallel.For或其他并行技术加速图像复制操作。减少边界检查开销：在确
【视频】V4L2、ffmpeg、OpenCV中对YUV的定义郭老二视频音视频 ffmpeg opencv
1、常见的YUV格式1.1YUV420每像素16位IMC1：YYYYYYYYVV--UU–IMC3：YYYYYYYYUU--VV–每像素12位I420:YYYYYYYYUUVV=>YUV420PYV12:YYYYYYYYVVUU=>YUV420PNV12:YYYYYYYYUVUV=>YUV420SP（最受欢迎格式）NV21:YYYYYYYYVUVU=>YUV420SPIMC2：YYYYYYYYYY
20250310：OpenCV mat对象与base64互转微风❤水墨 AI模型部署 Mat转base64
代码：https://github.com/ReneNyffenegger/cpp-base64指南：https://renenyffenegger.ch/notes/development/Base64/Encoding-and-decoding-base-64-with-cpp/实操：
opencv python 光流法 weixin_34241036 人工智能 python
OpticalFlow光流法光流是由对象或相机的移动引起的两个连续帧之间的图像对象的明显运动的模式.它是2D矢量场，其中每个矢量是位移矢量，表示从第一帧到第二帧的点的移动.上图表示的是一个球在连续的5帧图像中的运动,箭头显示其位移矢量.光流法原理的基础：目标像素强度在连续帧之间不变相邻像素具有相似的运动第一帧的像素I(x,y,t),在dt时间之后的下一帧中移动距离(dx，dy),因为这些像素是相同
OpenCV-Python 光流 LeonDL168 Opencv-Python opencv python 人工智能
40.1光流由于目标对象或者摄像机的移动造成的图像对象在连续两帧图像中的移动被称为光流。它是一个2D向量场，可以用来显示一个点从第一帧图像到第二帧图像之间的移动。如下图所示（ImageCourtesy:WikipediaarticleonOpticalFlow）：OpticalFlow上图显示了一个点在连续的五帧图像间的移动。箭头表示光流场向量。光流在很多领域中都很有用：•由运动重建结构•视频压缩
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

Opencv2.4.9源码分析——Cascade Classification（三）

你可能感兴趣的:(opencv)