sufangqi123

使用OpenCV完成车道线检测功能

实验名称：车道线检测

1.实验摘要

2.实验介绍

本项目是基于反透视变换和Hough直线检测完成的。要理解反透视变换首先要理解摄像机坐标系，成像坐标系和图像坐标系的关系。

1）图像坐标系(Pixel coordinate system)
摄像机采集的数字图像在计算机内可以存储为数组，数组中的每一个元素(象素，pixel)的值即是图像点的亮度(灰度)，在图像上定义直角坐标系u-v，每一象素的坐标(u,v)分别是该象素在数组中的列数和行数。故(u,v)是以象素为单位的图像坐标系坐标。

2）成像平面坐标系(Retinal coordinate system)

由于图像坐标系只表示象素位于数字图像的列数和行数，并没有用物理单位表示出该象素在图像中的物理位置，因而需要再建立以物理单位(例如：厘米)表示的成像平面坐标系x-y，如图4.1所示。我们用(x,y)表示以物理单位度量的成像平面坐标系的坐标。在x-y坐标系中，原点定义在摄像机光轴和图像平面的交点处，称为图像的主点(principalpoint)，该点一般位于图像中心处，但由于摄像机制作的原因，可能会有些偏离，在坐标系下的坐标为(u0,v0)，每个象素在x轴和y轴方向上的物理尺寸为dx、dy，两个坐标系的关系如下：

其中s'表示因摄像机成像平面坐标轴相互不正交引出的倾斜因子

3）摄像机坐标系(Cameracoordinate system)

摄像机成像几何关系可由图4.2表示，其中O点称为摄像机光心，Xc轴和Yc轴分别与成像平面坐标系的x轴和y轴平行，Zc轴为摄像机的光轴，和图像平面垂直。光轴与图像平面的交点为图像主点O'，由点O与轴组成的直角坐标系称为摄像机坐标系。OO'为摄像机焦距。

在获取视频中某一帧的画面时，获得的是一张二维的平面图，因为在视频中丢失了摄像机坐标系中Zc方向的数据，所以得到的是一张没有深度的图。要进行反透视变换就是要补充深度数据，即对二维图像进行Zc轴方向的拉伸。

完成二维到三维（实际上仍然是二维图像）的转变需要有三个不同的角变量对应三条轴线的透视变化，三个变量需要三个点来确定值。解出之后即可确定变换矩阵T，如果需要进行反过程只需对该矩阵求逆即可得到反过程的变换矩阵。

计算方法参考:http://www.docin.com/p-725340375.html

3.实验构思

1^st. 对原视频进行反透视变换，将视角转变为鸟瞰图。

2^nd.对视频进行一些预处理，如腐蚀膨胀，平滑处理等，设置ROI，减少画面中车道线以外的干扰物的影响。

3^rd. 进行Canny变换，检测出画面的边缘并且对图像自动进行二值化处理。

4^th.所得图像进行Hough变换，通过阀值，线段最短长度，连接为线段的最长间隔的设定来检测出画面中存在的直线。

5^th.直线筛选，计算第四步所得线段的斜率，从中挑选符合要求的线段，并用cvLine函数标示到画面中。

6^th. 将所得画面再次进行透视变换，变回原视角。

4.源码及注解

[cpp]  view plain copy 
       
      
 "code" class="cpp">/* 
  *  Created on: 2015-1-24 
  *  Author: Lincoln, Deng 
  *  仅供参考，请勿抄袭 
  */  
   
   
 /*********************************使用方法**********************************/  
 //1.将视频1.avi和矩阵1.xml放入project文件夹，编译执行。  
 //2.播放视频时按下空格键可以暂停所有视频查看细节，再次按下空格键视频继续播放。  
 //3.想要查询特定某一帧的画面可以通过result窗口的滑动条滑动到指定的帧数。  
 //4.想要中断播放退出浏览按下ESC键即可。  
 /***************************************************************************/  
   
   
 #include  
 #include  
 #include     
 #include  
 #include   
 #include   
 //#include "stdafx.h"  
 using namespace std;  
 using namespace cv;  
   
   
 #define INF 99999999 //用于直线斜率的初始化，代表无穷大  
   
   
 //使用播放控制条需要的全局变量  
 int        g_slider_position = 0;  
 CvCapture* g_capture = NULL;  
 int        cur_frame = 0;         //用于指示g_capture的当前帧  
   
   
 void onTrackbarSlide(int pos);  //回调函数  
   
   
 int main(){  
 g_capture = cvCreateFileCapture("1.avi");//使用全局变量抓取视频画面  
 //CvCapture *capture = cvCreateFileCapture("1.avi");//注意读取不在工程目录下文件时的路径要加双斜杠  
 /*cvCreateFileCapture()通过参数设置确定要读入的avi文件，返回一个指向CvCapture结构的指针。 
 这个结构包括了所有关于要读入avi文件的信息，其中包含状态信息。调用这个函数之后，返回指针 
 所指向的CvCapture结构被初始化到对应的avi文件的开头。*/  
   
   
 IplImage *img = cvQueryFrame(g_capture);  
 //cvQueryFrame的参数为CvCapture结构的指针。用来将下一帧视频文件载入内存，返回一个对应当前帧的指针。  
   
   
 /************************************* 预处理 ***************************************/  
 //读取矩阵  
 CvMemStorage *memstorageTest=cvCreateMemStorage(0);  
 /*用来创建一个内存存储器，来统一管理各种动态对象的内存。函数返回一个新创建的内存存储器指针。 
 参数对应内存器中每个内存块的大小，为0时内存块默认大小为64k。*/  
   
   
 CvFileStorage *warp_read=cvOpenFileStorage("1.xml",memstorageTest,CV_STORAGE_READ);//矩阵所在的xml文件名  
 /*cvOpenFileStorage打开存在或创建新的文件，第一个参数为矩阵，第二个为存储器，第三 
 个为flag，有CV_STORAGE_READ（打开文件读数据）和CV_STORAGE_WRITE（打开文件写数据）*/  
   
 CvMat *map_matrix = cvCreateMat(3,3,CV_32FC1);  
 CvMat *inverse    = cvCreateMat(3,3,CV_32FC1);  
 /*函数 cvCreateMat 为新的矩阵分配头和下面的数据，并且返回一个指向新创建的矩阵的指针。 
 参数分别为矩阵行数，列数，矩阵类型。CV_32FC1表示32位浮点型单通道矩阵*/  
   
 map_matrix = (CvMat*)cvReadByName(warp_read,NULL,"WarpMatrix",NULL);//读取矩阵，注意双括号里面是矩阵的名字  
 cvInvert(map_matrix, inverse, CV_SVD);//求出逆矩阵用以重新投射会原视角  
   
 //设置原图像的ROI范围  
 int x = 0,y = 157;//这个y值就是要修改的，尽量裁掉天空，不然会给处理带来困难  
 int width = img->width , height = 256;  
 //视频左上角坐标为（0，0）  
   
   
   
 //创建显示窗口  
 cvNamedWindow("OriginalView",CV_WINDOW_AUTOSIZE);//原视频  
 cvNamedWindow("IPMview",CV_WINDOW_AUTOSIZE);//反透视变换后效果  
 cvNamedWindow("AfterCanny",CV_WINDOW_AUTOSIZE);//canny边缘检测后效果  
 cvNamedWindow("Erode&Dilate",CV_WINDOW_AUTOSIZE);//腐蚀膨胀后效果  
 //cvNamedWindow("AfterSmooth",CV_WINDOW_AUTOSIZE);//高斯模糊后效果  
 cvNamedWindow("Hough",CV_WINDOW_AUTOSIZE);//Hough直线变换后效果  
 cvNamedWindow("Result",CV_WINDOW_AUTOSIZE);//最终结果  
   
 CvMemStorage *storage = cvCreateMemStorage();//内存块，存储中间变量  
 CvSeq *lines = 0;//存储Hough变换所得结果  
   
 //初始化用于视频播放控制的滑动条  
 int frames = (int)cvGetCaptureProperty(  
 g_capture,  
 CV_CAP_PROP_FRAME_COUNT//以帧数来设置读入位置  
 );  
   
   
 if(frames != 0){  
 cvCreateTrackbar(  
 "Frames", //进度条名称  
 "Result", //让进度条显示在最终结果的窗口  
 &g_slider_position,  
 frames,  
 onTrackbarSlide//调用一次onTrackbarSlide  
 );  
 }  
 /************************************* 预处理结束 ***************************************/  
   
   
 while(1)  
 {  
 if(!img) break;//视频为空则退出  
 //当拉动进度条时，所有窗口的视频都会同步刷新到指定的帧数播放  
   
   
 cvSetImageROI(img,cvRect(x,y,width,height));//设置ROI  
 //如果ROI为NULL并且参数rect的值不等于整个图像，则ROI被分配。  
 //cvRect参数分别为矩形左上角x，y坐标，矩形宽，高。  
 IplImage *ImageCut = cvCreateImage(cvGetSize(img),8,3);  
 cvCopy(img,ImageCut);//将原图像的ROI赋给新图像ImageCut  
 /*ROI（region of interest），感兴趣区域。机器视觉、图像处理中， 
 从被处理的图像以方框、圆、椭圆、不规则多边形等方式勾勒出需要处 
 理的区域，称为感兴趣区域，ROI。在Halcon、OpenCV、Matlab等机器 
 视觉软件上常用到各种算子（Operator）和函数来求得感兴趣区域ROI， 
 并进行图像的下一步处理。在图像处理领域，感兴趣区域(ROI) 是从图 
 像中选择的一个图像区域，这个区域是你的图像分析所关注的重点。圈 
 定该区域以便进行进一步处理。使用ROI圈定你想读的目标，可以减少 
 处理时间，增加精度。完成后可以释放ROI回到原来的视频尺寸。*/   
   
   
 //创建用于反透视变换的图像  
 IplImage *ImageIPM = cvCreateImage(cvGetSize(ImageCut),8,3);  
   
 cvShowImage("OriginalView",ImageCut);  
 cvWarpPerspective(ImageCut,ImageIPM,map_matrix);  
 //对图像做反透视变换，第一个参数为原图，第二个为目标图，第三个为变换矩阵  
 cvShowImage("IPMview",ImageIPM);  
   
   
   
 //为了进行更精确的直线检测需要去除道路两旁的障碍，因此再次缩小ROI  
 cvSetImageROI(ImageIPM,cvRect(330,0,200,256));//设置新的ROI  
   
 //创建一个灰度图像  
 IplImage* ImageIPM2 = cvCreateImage(cvGetSize(ImageIPM), 8, 1);  
 cvCvtColor(ImageIPM,ImageIPM2,CV_BGR2GRAY);    
 cvErode(  ImageIPM2,ImageIPM2, NULL,2); //腐蚀    
 cvDilate( ImageIPM2,ImageIPM2, NULL,6); //膨胀   
 cvShowImage("Erode&Dilate",ImageIPM2);  
   
   
 IplImage *ImageCut2 = cvCreateImage(cvGetSize(ImageIPM2),8,1);  
 cvCopy(ImageIPM2,ImageCut2);//将透视变换后图像的ROI赋给新图像ImageCut2  
   
 //创建用于Canny变换的图像  
 IplImage *img_thres = cvCreateImage(cvGetSize(ImageCut2),8,1);  
 cvCanny(ImageCut2,img_thres,50,100);  
 cvShowImage("AfterCanny",img_thres);  
   
 cvSmooth(img_thres,img_thres,CV_GAUSSIAN,3,1,0);//高斯模糊平滑处理  
 //cvShowImage("AfterSmooth",img_thres);//有的视频使用模糊处理后对直线检测更好  
   
   
 /************************************* Hough ***************************************/  
 /*函数说明：CvSeq* cvHoughLines2(CvArr* image,void* line_storage,int mehtod, 
 double rho,double theta,int threshold,double param1 =0,double param2 =0); 
 image为要做hough变换的图像，line_storage为检测到的线段存储仓， 可以是内存存储仓  
 (此时，一个线段序列在存储仓中被创建，并且由函数返回），然后是hough变换的类型method 
 可以是CV_HOUGH_STANDARD（标准变换），CV_HOUGH_PROBABILISTIC（概率 Hough 变换）以及 
 CV_HOUGH_MULTI_SCALE（多尺度霍夫变换）。rho 与像素相关单位的距离精度 theta 弧度测量 
 的角度精度 threshold 阈值参数。如果相应的累计值大于 threshold， 则函数返回这条线段. 
 param1，2对标准变换无用，设为0。 1对概率 Hough 变换是最小线段长度.2对概率 Hough 变换， 
 表示在同一条直线上进行碎线段连接的最大间隔值(gap), 即当同一条直线上的两条碎线段之间的 
 间隔小于param2时，将其合二为一。*/  
 lines = cvHoughLines2(img_thres,storage,CV_HOUGH_PROBABILISTIC,1,CV_PI/180,50,90,50);  
 printf("Lines number: %d\n",lines->total);  
   
 //根据Hough变换后所得线段的斜率筛选出条件合适的  
 for (int i=0;itotal;i++)    
 {    
 double k = INF;//初始化斜率为无限大  
 CvPoint *line = (CvPoint *)cvGetSeqElem(lines,i);//line包含两个点line[0]和line[1]  
 if(line[0].x - line[1].x != 0) k = (double)(line[0].y - line[1].y)/(double)(line[0].x - line[1].x);  
   
   
 //printf("x1: %d,  y1: %d,  x2: %d,  y2: %d\n",line[0].x, line[0].y, line[1].x, line[1].y);  
 //printf("k: %lf\n\n",k);  
   
   
 if(k<-4.5 || k>4.5) cvLine(ImageIPM,line[0],line[1],CV_RGB(0,255,0),2,CV_AA);  
 //else if(k>-1 && k<1  && lines->total>25) cvLine(ImageIPM,line[0],line[1],CV_RGB(0,255,0),2,CV_AA);  
 //因为cvLine绘图只有图是3通道图时才能显示线的颜色，所以用ImageIPM作为绘线的地图  
 //第二三个参数为线的起点终点，第四个为四射，第五个为线的粗细  
 }    
 cvShowImage("Hough",ImageIPM);  
 /**********************************************************************************/  
   
   
 cvResetImageROI(ImageIPM);//释放ROI  
 cvWarpPerspective(ImageIPM,ImageIPM,inverse);//对效果图进行透视变换回到原视角  
   
   
 //调节系数放大图像方便更清晰地浏览细节   
 double fScale = 1.1;        //可调节的放大倍数，注：若fScale<0则缩小画面  
    CvSize czSize;              //目标图像尺寸    
 IplImage *result = NULL;     
         
 //计算目标图像大小    
 czSize.width = ImageIPM->width * fScale;    
 czSize.height = ImageIPM->height * fScale;    
         
 //创建图像并放大    
 result = cvCreateImage(czSize, ImageIPM->depth, ImageIPM->nChannels);    
 cvResize(ImageIPM, result, CV_INTER_AREA);    
   
   
 cvShowImage("Result", result);  
   
   
   
   
 char c = cvWaitKey(33); //每隔33ms播放下一帧  
 if(c == 27) break;  //按下ESC时可退出播放  
 if(c == 32){  //按下空格键可暂停视频播放  
 while(1){  
 char c = cvWaitKey(0);  
 if(c == 32) break;//再次按下则继续播放  
 }  
 }  
   
   
 //释放使用过的图像内存  
 cvReleaseImage(&ImageCut);  
 cvReleaseImage(&ImageCut2);  
 cvReleaseImage(&ImageIPM);  
 cvReleaseImage(&img_thres);  
 cvReleaseImage(&result);  
   
   
 //让进度条随着视频播放滚动  
 cur_frame = (int)cvGetCaptureProperty(g_capture,CV_CAP_PROP_POS_FRAMES);//提取当前帧           
         cvSetTrackbarPos("Frames","Result",cur_frame);//设置进度条位置  
   
 img = cvQueryFrame(g_capture);//抓取下一帧的画面  
 }  
   
   
 cvReleaseCapture(&g_capture);//释放capture，同时也会释放img  
 return 0;  
 }  
   
   
 void onTrackbarSlide(int pos){//回调函数  
 if (pos!=cur_frame){  
 //如果回调函数onTrackbarSlide(int pos)中当前的函数参数pos与全局变量相等，  
 //说明是滚动条自动移动造成的调用，不必重新设置g_capture的当前帧  
 cvSetCaptureProperty(  
 g_capture,  
 CV_CAP_PROP_POS_FRAMES,  
 pos  
 );  
 }  
 }  

5.实验结果

最终实现图

如图，左上为原视角，右上为俯视图。左下三个窗口分别为Canny边缘检测结果，腐蚀膨胀结果，Hough变换结果。右下为最终结果。

该project是基于反透视变换实现的（其他实现方法包括基于成像模型的做法等），通过反透视变换为鸟瞰图，可以更好地检测直线。在检测前先通过预处理，设置更小的ROI，使检测区域集中于车（摄像头）正前方略多于一个车道宽度的位置（可以根据摄像头安放位置设定，如安排在车中线左侧，则ROI要偏右，使车子中心线所对与ROI中心相吻合）。此后再对灰度图像进行腐蚀与膨胀，去除掉一些影响检测结果的杂质元素。然后进行Canny边缘检测，去除杂质后，检测基本上能够只检出车道线的矩形。然后进行概率Hough变换，借助参数设置可以将车道线的短线段拼合为长线段。最后对所得线段进行筛选，只留下符合斜率要求的线段，并把所得筛选结果映回到视频中。

6.存在问题

该project实现了检测车道线的功能，对于杂质元素有较为良好的排除作用。在直线路段能很好地实现智能车的自动行驶。

直线路段有良好的检测效果

但由于使用了反透视变换的关系，若使用变换矩阵的逆矩阵重新投影回原视频，视频边缘会呈锯齿状并出现逸出的状况。

能达到无视标识的效果（针对路段上时会出现标示，文字等妨碍检测的杂质的情况）

存在问题：

出现杂线

由于使用的Hough办法为概率霍夫变换，因此在变道时，若车道线偏斜较多，在线段拼合时会出现这种线段交杂，连接错误的情况

转弯缺陷

由于要通过斜率来筛选车道线，因此在转弯时会出现直线斜率过大的情况，此时直线无法通过直线筛选，会出现一段时间画面没有指示线的情况。是否存在一种方案可以使弯道时同样可以做出标识？但注意到转弯时车不在依照车道线方向行驶，因此认为此时不检测出车道线是正确的。

人行道障碍

还有一个存在的问题是人行道障碍。人行道是线段密集区域，由于进行了膨胀腐蚀算法，所以密集线的边缘会合并而变成块状。此时不会影响直线的检测。但是若边缘存在一些瑕疵，菱角，就会很容易像图中这样与画面中其他因素一起连接成线。这是不希望得到的结果，但这样产生的线很难通过斜率筛选来去除掉，由于太过紧密同样很难通过Hough变换参数的设置去除。

7.实验感想

opencv是非常强大的工具。这是我第一次接触到通过C语言来做实际应用的项目，之前做智能小车时，由于函数封装的原因，很多资料都难以在网上查找得到。但是opencv提供了一个相当广阔的平台。通过教材上的内容和网上的资料学会了很多opencv的知识。我暂且分为以下几点。

-1.对于一个视频，世界坐标系和图像坐标的不同，怎样从空间结构变为平面结构。用矩阵和图像结构存储的不同，颜色信息如何保存（double型数据），彩色图和二值图如何转换（opencv中一些函数是基于二值图完成的，如果要保留颜色信息，可以通过分通道操作来完成，如RGB图分解为三个单通道图来分别操作），摄像机视角和鸟瞰视角如何切换（反透视变换矩阵）。怎样建立模型存储图像和视频中的信息（对不同坐标系的理解和转换方法）。

-2.如何对视频进行预处理（模糊，腐蚀，膨胀等等），每种操作opencv都提高一个完善的函数来实现，可以通过调节函数参数来得到自己想要的效果。减少画面中的障碍和杂质，使得画面更利于接下来检测的工作（无论是车道线检测还是行人、车辆检测，进行恰当的预处理会大大有利于之后的特征提取算法的运用）。

-3.ROI的概念，当视频画面中我们只需要对某一区域进行扫描和判断时可以对它设置恰当的ROI，当我们需要回到完整画面处理时可以释放ROI。同时注意到如果在设置ROI前进行了矩阵变换，则进行逆变换时必须回到进行矩阵变换当时的那个ROI区域。否则画面的比例是不一致，做不出理想的效果的。

-4.同时，opencv还可以完成丰富的UI设计，包括滑动条，标题，颜色等都是可以自定义的，通过调节这些可以提高视觉效果，尽管这些并非是算法范围内的事情，但是一个好的界面和布局，能为程序员编程和debug带来更多乐趣，也能为完成项目后，使用作品的用户带来更友好的用户体验。用opencv来完成一个小型的Photoshop软件也是可能的（可以调整图像亮度，对比度，剪裁，模糊图像，腐蚀膨胀等效果可以改造为滤镜效果），这是非常棒的事情，因为我个人对图像处理比较热爱，所以对这方面也相当感兴趣，希望接下来能继续完善和做出一些更有趣的东西。

8.参考文献

-1.A Flexible New Technique -Zheng you Zhang，IEEE

-2.基于反透视变换和Hough变换的车道线检测 - 张云港

-3.3D坐标系变换 –ryfdizuo，CSDN论坛

引用网址：http://blog.csdn.net/ryfdizuo/article/details/6287637#t1

-4.OpenCv霍夫变换：霍夫线变换，霍夫圆变换合辑 - 枫落★流年

引用网址：http://www.tuicool.com/articles/Mn2EBn

-5.OpenCv学习笔记-滚动条随着视频播放而滚动- xiongyan10

引用网址：http://blog.sina.com.cn/s/blog_4b826e5b01015xoj.html

-6.世界坐标系

引用网址：http://baike.baidu.com/view/829500.htm

opencv学习——霍夫变换原理 zqnnn opencv
最近的项目用到了霍夫变换，感觉自己只是会调用函数，并不清楚原理，所以写这篇记录一下霍夫变换中心思想是通过坐标变换来检测直线，后来经过改进，就可以检测椭圆等将特定图形上的点变换到一组参数空间上，根据参数空间点累计的结果找到一个极大值对应的解，那么这个解就对应着要寻找的几何形状的参数（比如说直线，那么就会得到直线的斜率k与截距b，圆就会得到圆心与半径等等）。原始空间到参数空间的变换假设有一条直线L，原
Opencv基础大写-凌祁 opencv 人工智能计算机视觉
Opencv学习基本操作察看当前摄像头importcv2#导入OpenCV库cap=cv2.VideoCapture(0)#创建一个VideoCapture对象，参数0表示使用默认的摄像头whileTrue:#循环无限执行，直到用户按下'q'键success,img=cap.read()#调用VideoCapture对象的read()方法，读取一帧画面。success变量表示读取是否成功，img表
OpenCV从零基础到精通：超详细学习路线及求职指南小乌龟登顶记 opencv 学习人工智能
摘要：本文详细拆解OpenCV从零基础到精通的学习路径，涵盖各阶段核心知识点、实战项目设计及求职技能要求，助力开发者快速成长为OpenCV领域专家。一、OpenCV学习的重要性与行业需求2023年计算机视觉岗位招聘数据显示：超过75%的CV相关岗位要求掌握OpenCV开发能力。作为计算机视觉领域的瑞士军刀，OpenCV在工业检测、自动驾驶、医学影像、AR/VR等领域广泛应用。二、OpenCV学习阶
OpenCV 环境搭建与概述清醒的兰 OpenCV opencv 人工智能计算机视觉
////OpenCV-4.11.0+C+++VS2019//一、OpenCV学习路线1、入门:OpenCV图像读写、视频读写、基本像素处理、基本卷积处理、基本C++开发知识。2、初级:OpenCV自定义卷积操作、图像梯度、边缘提取、二值分析、视频分析、形态学处理、几何变换与透视变换。3、中级:角点查找、BLOB查找、特征提取与匹配、机器学习、深度神经网络、CUDA加速。4、高级:掌握自定义对象检测
opencv学习:光流估计及完整代码实现夜清寒风学习计算机视觉 opencv 人工智能
光流估计是什么？是空间运动物体在观测成像平面上的像素运动的“瞬时速度”，根据各个像素点的速度矢量特征，可以对图像进行动态分析，例如目标跟踪。基本原理（1）亮度恒定：同一点随着时间的变化，其亮度不会发生改变。（2）小运动：随着时间的变化不会引起位置的剧烈变化，只有小运动情况下才能用前后帧之间单位位置变化引起的灰度变化去近似灰度对位置的偏导数。（3）空间一致：一个场景上邻近的点投影到图像上也是邻近点，
OpenCV学习笔记：使用OpenCV的DNN模块调用Caffe进行人脸识别 EbCoder 机器学习-深度学习
在计算机视觉和图像处理领域，人脸识别是一个重要的任务。OpenCV是一个广泛使用的开源计算机视觉库，它提供了强大的功能来处理图像和视频。OpenCV的DNN（深度神经网络）模块允许我们使用已经训练好的深度学习模型进行图像识别任务。本文将介绍如何使用OpenCV的DNN模块调用Caffe框架训练的人脸识别模型。首先，我们需要安装OpenCV和Caffe。确保您已经正确安装了这两个库，并且已经配置好了
opencv学习：使用dlib进行人脸检测和特征点定位及完整代码实现夜清寒风 opencv 学习人工智能计算机视觉算法
dlib库是一个适用于C++和Python的第三方库。包含机器学习、计算机视觉和图像处理的工具包，被广泛的应用于机器人、嵌入式设备、移动电话和大型高性能计算环境。是开源许可用户免费使用。opencv优缺点：优点：可以在CPU上实时工作，简单的架构，可以检测不同比例的人脸。缺点：会出现大量的把非人脸预测为人脸的情况，不适用于非正面人脸图像，不抗遮挡。dlib优缺点：优点：适用于正面和略微非正面的人脸
OpenCV学习 day6 多线程 m0_71100223 opencv学习学习 opencv 计算机视觉
第八章线程与进程的区别：进程与单个程序类似，可以由操作系统直接执行；线程是进程的一个子集，也就是一个进程可包含多个线程；通常情况下，不同的进程彼此是无关的，而不同的线程共享内存和资源（进程可以通过操作系统提供的手段实现彼此交互）8.1Qt中的多线程Qt提供的命名空间、类和函数：QThread：所以线程的基类，可以从他的派生子类创建新的线程QThreadPool：可以用于管理线程，并且可以重用已有线
OpenCV学习_day1 哈基米_python小白 opencv 学习计算机视觉
OpenCVOpenCV基础操作读取图像显示图像保存图像绘制图形绘制直线绘制圆形绘制矩形在图像中添加文字修改图像中的像素点捕获摄像头的实时视频流资源释放OpenCV基础操作读取图像importcv2importnumpyasnp#像素是用数组存的img=cv2.imread(“图像名(例如：‘1.jpg’)”)显示图像cv2.imshow(“窗口名”,图像变量)defmy_img_show():i
opencv学习：FLANN匹配器算法实现指纹验证与指纹识别夜清寒风 opencv 学习人工智能计算机视觉
概念FLANN（FastLibraryforApproximateNearestNeighbors）是一个开源的C++库，用于在高维空间中进行近似最近邻搜索。它被广泛用于计算机视觉和机器学习领域，特别是在处理具有大量特征点的图像匹配问题时。FLANN旨在提供一个快速且灵活的近似最近邻搜索解决方案。最近邻搜索：给定一个查询点，最近邻搜索的目标是找到一个数据点，使得与查询点之间的距离最小。在特征匹配中
opencv学习：图像轮廓识别及代码实现夜清寒风 opencv 学习人工智能算法
图像轮廓1.获取图像轮廓cv2.findContours()函数是OpenCV库中用于检测图像中轮廓的函数。它可以检测到图像中所有连通区域的边界，并返回这些轮廓的列表。从OpenCV3.4版本开始，这个函数的返回值和参数有所变化，以下是详细的参数说明：方法：contours,hierarchy=cv2.findContours(img,mode,method)参数说明img：输入图像，必须是二值图
OpenCV学习(二十一) ：计算图像连通分量:connectedComponents(),connectedComponentsWithStats() Leon_Chen0 OpenCV
OpenCV学习(二十一)：计算图像连通分量:connectedComponents(),connectedComponentsWithStats()1、connectedComponents()函数ConnectedComponents即连通体算法用id标注图中每个连通体，将连通体中序号最小的顶点的id作为连通体的id。如果在图G中，任意2个顶点之间都存在路径，那么称G为连通图，否则称该图为非连
Python opencv学习-19 背景减除算法一头秀发的假程序猿 Python OpenCV 图像学习 opencv 计算机视觉
文章转载自https://blog.csdn.net/tengfei461807914/article/details/81588808目标：这一节要了解背景减除算法在opencv中的应用。基础：背景减除算法是很多以机器视觉为基础的应用中，非常重要的预处理算法。例如，使用固定的摄像头来统计一个房间的进出人数或者交通摄像头提取关于交通工具的信息等等。在所有这些例子当中，你首先要做的就是把人和交通工具
OpenMV和K210(fron ChatGPT) overwizard 个人图像处理计算机视觉学习自动化机器人
文章目录OpenMV特点：学习资源：K210(KendryteK210)特点：学习资源：选择建议1.OpenCV简介安装OpenCV2.树莓派(RaspberryPi)与OpenCV安装OpenCV学习资源3.香橙派(OrangePi)与OpenCV安装OpenCV学习资源综合学习资源OpenMV和K210是两个流行的嵌入式视觉平台，各自有其独特的特点和应用场景。以下是对这两个平台的介绍及其学习资
深度学习目标检测中的_单目测距原理与实现关键点及改进建议 QQ_767172261 单目测距深度学习目标检测人工智能
深度学习目标检测中的_单目测距原理与实现关键点及改进建议文章目录单目测距的进一步解释1.焦距的确定2.物体宽度\(W\)的获取3.图像处理技巧4.提高性能的建议5.实现代码中的注释添加一、前言单目视觉测距：网上有很多关于单目测距的文章，主要借鉴的是OpenCV学习笔记（二十一）——简单的单目视觉测距尝试和单目摄像机测距（python+opencv）两篇文章，在这里特别作出说明。工作环境：Ubunt
opencv学习：图像旋转的两种方法，旋转后的图片进行模板匹配代码实现夜清寒风学习 opencv 机器学习人工智能计算机视觉
图像旋转在图像处理中，rotate和rot90是两种常见的图像旋转方法，它们在功能和使用上有一些区别。下面我将分别介绍这两种方法，并解释它们的主要区别rot90方法rot90方法是NumPy提供的一种数组旋转函数，它主要用于对二维数组（如图像）进行90度的旋转。这个方法比较简单，只支持90度的倍数旋转，不支持任意角度旋转。使用NumPy进行旋转使用NumPy的rot90函数对模板图像进行旋转操作。
opencv 学习 1 木木ainiks opencv 计算机视觉 python
opencv学习的第一天#coding:utf-8importcv2ascv#首先读图片src=cv.imread(“img/1.jpg”)#设置图片的名字cv.namedWindow(“1”,cv.WINDOW_AUTOSIZE)#显示图片第一个参数设置图片名，第二个参数图片的地址cv.imshow(“1”,src)cv.waitKey(0)#将图片写入固定位置cv.imwrite(“img/2
opencv学习：形态学操作和边缘检测算子夜清寒风 opencv 学习人工智能算法计算机视觉
cv2.morphologyEx()是OpenCV库中的一个函数，用于执行更复杂的形态学操作。这个函数可以执行开运算、闭运算、梯度运算、膨胀、腐蚀以及顶帽和黑帽转换等。这些操作通常用于图像预处理，如去除噪声、平滑边界、突出特征等。dst=cv2.morphologyEx(src,op,kernel[,dst[,anchor[,iterations[,borderType[,borderValue]
零基础Opencv学习（二）随风逐流wrx opencv 学习人工智能
图像变换一、边缘检测1：边缘检测Cannycv::MatiamgeCan;cv::Canny(image,iamgeCan,3,9,3);cv::imshow("Canny",iamgeCan);///边缘检测高级用法Canny用法cv::Matdst,edge,gray;dst.create(image.size(),image.type());///图像转灰度图像cv::cvtColor(im
opencv学习笔记19-opencv焊点（原点）计数 The_xz opencv 学习笔记
一、原理：opencv学习笔记13-opencv连通组件标记实现硬币计数二、不同情况思路：当焊点为背景时，进行反色处理（二值化后若焊点为背景，转化为前景）。三、示例代码：#include#include#include#include#include#includeusingnamespacecv;usingnamespacestd;intmain(){utils::logging::setLog
opencv学习（十一）之绘图函数梧桐栖鸦 OpenCV基础 opencv2/3基础教程 opencv直线 circle ellipse fillpoly opencv绘图函数
opencv中提供了很多绘图函数，在进行图像处理，对感兴趣区域进行标定时，就需要利用这些绘图函数。现在集中做一个归纳介绍。1.PointPoint常用来指定一幅二维图像中的点。如Pointpt;pt.x=10;pt.y=8;或Pointpt=Point(10,8);其指向的是在图像中(10,8)位置的一个像素点。查找Point引用可以在”core.hpp”文件发现如下语句：typedefPoint
OpenCV学习路线图 superdont 计算机视觉 opencv 学习人工智能
下面是针对初学者设计的一个学习路线图：第1周：计算机视觉和OpenCV概述介绍计算机视觉及其应用领域讨论OpenCV的历史、特点和工作原理OpenCV的安装和配置（Windows/Linux/macOS）了解OpenCV的基本数据结构（cv::Mat等）第2周：OpenCV基础图像的基本操作（读取、显示、保存图片）图像的属性（色彩空间、像素访问与修改）图像的几何变换（缩放、旋转、剪切）第3周：图像
【Opencv学习】04-图像加法 R三哥哥啊 opencv opencv 学习人工智能
文章目录前言一、图像加法混合1.1代码1.2运行结果二、图像的按位运算-组合相加2.1代码2.2运行结果示例：PPT平滑切换运行结果总结前言简单说就是介绍了两张图如何组合在一起。1、混合，透明度和颜色会发生改变2、组合，叠加起来。可以改变大小。3、两张图片如何平滑切换4、学会如何裁剪图片5、明白掩码操作6、如何将图片置于左侧右侧一、图像加法混合OpenCV中的加法与Numpy的加法是有所不同的。O
OpenCV学习笔记：如何扫描图像、利用查找表和计时 weixin_33772645 人工智能 c/c++测试
目的我们将探索以下问题的答案：如何遍历图像中的每一个像素？OpenCV的矩阵值是如何存储的？如何测试我们所实现算法的性能？查找表是什么？为什么要用它？测试用例这里我们测试的，是一种简单的颜色缩减方法。如果矩阵元素存储的是单通道像素，使用C或C++的无符号字符类型，那么像素可有256个不同值。但若是三通道图像，这种存储格式的颜色数就太多了（确切地说，有一千六百多万种）。用如此之多的颜色可能会对我们的
OpenCV学习记录——形态学处理 KAIs32 树莓派——OpenCV opencv 学习人工智能计算机视觉嵌入式硬件
文章目录前言一、腐蚀和膨胀二、高级形态学运算三、具体应用代码前言形态学是图像处理中最常用的技术之一，它主要用于从图像中提取有意义的形状信息，例如边界和连通区域，以便后续的识别工作能够捕捉到目标对象最重要的形状特征。此外，细化、像素化和修剪毛刺等技术也常用于图像的预处理和后处理，以增强图像质量。形态学转换主要有腐蚀和膨胀、开运算和闭运算、顶帽和底帽一、腐蚀和膨胀腐蚀和膨胀是两种最基本、最重要的形态学
opencv学习记录——（15）模板匹配蜡笔小新qqq opencv 学习计算机视觉
一、单模板匹配#include"opencv2/opencv.hpp"#includeusingnamespacestd;usingnamespacecv;voidmain(){///单模板匹配Mattemp=imread("temp.png");//模板图像Matsrc=imread("src.png");//待搜索图像即原图imshow("temp",temp);imshow("src",sr
Opencv学习笔记——特征匹配纸箱里的猫咪 Opencv学习笔记 opencv 计算机视觉学习
文章目录Brute-Force蛮力匹配1对1的匹配k对最佳匹配随机抽样一致算法（Randomsampleconsensus，RANSAC）单应性矩阵Brute-Force蛮力匹配通过SIFT算法可以得到图像关键点，通过比较两张图像的关键点，也就是比较关键点向量之间的差异，Brute-Force蛮力匹配通过比较特征向量，离得最近的特征向量也就是最相似的。默认的是用归一化的欧氏距离。bf=cv2.
OpenCV学习记录——特征匹配 KAIs32 树莓派——OpenCV opencv 学习人工智能嵌入式硬件计算机视觉
文章目录前言一、暴力匹配步骤分析二、代码分析前言特征匹配是一种图像处理技术，用于在不同图像之间寻找相似的特征点，并将它们进行匹配。特征匹配在计算机视觉和图像处理领域中具有广泛的应用，包括目标识别、图像拼接、三维重建等。一、暴力匹配步骤分析暴力匹配是一种简单直接的匹配方法，它遍历所有特征点的描述符，并计算它们之间的距离。然后根据距离进行排序，选择距离最短的特征点作为匹配点。虽然暴力匹配方法简单，但在
OpenCV学习记录——轮廓检测 KAIs32 树莓派——OpenCV opencv 学习人工智能计算机视觉嵌入式硬件
文章目录前言一、寻找、绘制轮廓二、具体应用代码前言寻找目标图像的轮廓并绘制出该轮廓是我们进行图像识别时常用的手段，轮廓是图像中连续的边界线，可以用于物体检测、形状分析等应用。为了获取更高的准确性，会先进行二值化处理，在得到二进制图像后，寻找轮廓就是从黑色背景中找到白色物体，因此我们要找的对象应是白色，背景应该是黑色。一、寻找、绘制轮廓（一）寻找图像轮廓寻找图像轮廓函数如下：contours,hie
OpenCV学习笔记（Python）—— 批量提取图像轮廓并保存结果到保持原始结构的输出目录六个核桃Lu OpenCV学习 opencv 人工智能 python 图像处理计算机视觉
批量处理图像，对每个图像提取轮廓内的区域并将轮廓外的区域设置为白色背景，然后保存处理后的图像到指定的输出目录，同时保持与输入目录相同的文件和目录结构。importcv2importnumpyasnpimportosfromtqdmimporttqdmdefprocess_image(input_path,output_path):#读取图像img=cv2.imread(input_path)ifi
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

使用OpenCV完成车道线检测功能

你可能感兴趣的:(Opencv学习)