coastlineWang

Canny边缘检测，Opencv源码解析

Canny边缘检测原理

Canny 算法的步骤：
1、使用高斯滤波器进行卷积降噪。这一步opencv源码中无，可先对灰度图像进行高斯滤波，然后进行canny边缘检测。
2、使用Sobel算子计算梯度x,y幅值和方向(角度)
具体计算如下：
Gx = [f(x+1,y-1) + 2f(x+1,y) + f(x+1,y+1)] - [f(x-1,y-1) + 2f(x-1,y) + f(x-1,y+1)]
Gy = [f(x-1,y-1)+ 2f(x,y-1) + f(x+1,y-1)] - [f(x-1, y+1) + 2f(x,y+1) + f(x+1,y+1)]
其中f(a,b), 表示图像(a,b)点的灰度值；

3、图像的每个像素横向及纵向梯度值通过以下公式结合，计算出该点梯度为：
通常使用不开平方的近似值，可提高效率：

计算梯度方向：
4、非极大值抑制 + 滞后阈值
非极大值抑制是一种去除非极大值的算法，可以将sobel计算的边界变细。
注意：梯度方向是边的垂直方向，只保留梯度方向变化率最大的点，即使边界变细。
一、Canny算法应用双阀值，即一个高阀值和一个低阀值来区分边缘像素。
如果边缘像素点梯度值大于高阀值，则被认为是强边缘点。
如果边缘梯度值小于高阀值，大于低阀值，则标记为弱边缘点。
小于低阀值的点则被抑制掉。
二、对于弱边缘像素，将会有一些争论，因为这些像素可以从真实边缘提取也可以是因噪声或颜色变化引起的。为了获得准确的结果，应该抑制由后者引起的弱边缘。
若一定为边缘需要满足 ①当前值要大于低阈值。②当前值得soble梯度方向下，要大于两边soble梯度方向的点的值。③ 若当前值还大于最大阈值，且图像上前一个和上一个点没有入栈，则入栈。置为2，其他的置为0；（0可能为边缘，1 一定不是边缘，2 一定为边缘。）

5、边缘跟踪
在栈中的点一定为边缘，从栈不断中取出点，判断点的8个方向上，是否存在可能为边缘的点，若存在，就认定，这个可能为边缘的点置为一定为边缘，加入栈中。

注：在OpenCV的canny源码中，没有进行高斯滤波，需要使用者自行滤波；有些资料将非极大值抑制和滞后阈值视为两个步骤也是可行的，但是在源码中非极大值抑制 和滞后阈值是同时进行的。

Opencv源码解析

void cv::Canny( InputArray _src, OutputArray _dst,
                double low_thresh, double high_thresh,
                int aperture_size, bool L2gradient )
{
    Mat src = _src.getMat();           //输入图像，必须为单通道灰度图
    CV_Assert( src.depth() == CV_8U ); // 8位无符号
    _dst.create(src.size(), CV_8U);    //根据src的大小构造目标矩阵dst
    Mat dst = _dst.getMat();           //输出图像，为单通道黑白图
    
    
    // low_thresh 表示低阈值， high_thresh表示高阈值
    // aperture_size 表示算子大小，默认为3
    // L2gradient计算梯度幅值的标识，默认为false
    // 如果L2gradient为false 并且 apeture_size的值为-1（-1的二进制标识为：1111 1111）
    // L2gradient为false 则计算sobel导数时，用G = |Gx|+|Gy|
    // L2gradient为true  则计算sobel导数时，用G = Math.sqrt((Gx)^2 + (Gy)^2) 根号下 开平方
	
    if (!L2gradient && (aperture_size & CV_CANNY_L2_GRADIENT) == CV_CANNY_L2_GRADIENT)
    {
		// CV_CANNY_L2_GRADIENT 宏定义其值为： Value = (1<<31) 1左移31位  即2147483648
        //backward compatibility
        
		// ~标识按位取反
        aperture_size &= ~CV_CANNY_L2_GRADIENT;//相当于aperture_size取绝对值
		L2gradient = true;
    }

    // 判别条件1：aperture_size是奇数
    // 判别条件2: aperture_size的范围应当是[3,7], 默认值3 
    if ((aperture_size & 1) == 0 || (aperture_size != -1 && (aperture_size < 3 || aperture_size > 7)))
        CV_Error(CV_StsBadFlag, "");  // 报错
 
    if (low_thresh > high_thresh)           // 如果低阈值 > 高阈值
        std::swap(low_thresh, high_thresh); // 则交换低阈值和高阈值
 
#ifdef HAVE_TEGRA_OPTIMIZATION
    if (tegra::canny(src, dst, low_thresh, high_thresh, aperture_size, L2gradient))
        return;
#endif
 
#ifdef USE_IPP_CANNY
    if( aperture_size == 3 && !L2gradient &&
        ippCanny(src, dst, (float)low_thresh, (float)high_thresh) )
        return;
#endif
 
    const int cn = src.channels();           // cn为输入图像的通道数
    Mat dx(src.rows, src.cols, CV_16SC(cn)); // 存储 x方向 方向导数的矩阵，CV_16SC(cn)：16位有符号cn通道
    Mat dy(src.rows, src.cols, CV_16SC(cn)); // 存储 y方向 方向导数的矩阵，CV_16SC(cn)：16位有符号cn通道
 
    /*Sobel参数说明：(参考cvSobel)
      cvSobel(
            const  CvArr* src,                // 输入图像
            CvArr*        dst,                // 输入图像
            int           xorder，            // x方向求导的阶数
            int           yorder，	          // y方向求导的阶数
            int           aperture_size = 3   // 滤波器的宽和高 必须是奇数
      );
    */
 
    // BORDER_REPLICATE 表示当卷积点在图像的边界时，原始图像边缘的像素会被复制，并用复制的像素扩展原始图的尺寸
    // 计算x方向的sobel方向导数，计算结果存在dx中
    Sobel(src, dx, CV_16S, 1, 0, aperture_size, 1, 0, cv::BORDER_REPLICATE); 
    // 计算y方向的sobel方向导数，计算结果存在dy中
    Sobel(src, dy, CV_16S, 0, 1, aperture_size, 1, 0, cv::BORDER_REPLICATE); 
 
    //L2gradient为true时， 表示需要根号下开平方运算，阈值也需要平方
    if (L2gradient)
    {
        low_thresh = std::min(32767.0, low_thresh);   //有符号16位(2 个字节)的数值形式,其范围为 -32,768 到 32,767 之间
        high_thresh = std::min(32767.0, high_thresh);
 
        if (low_thresh > 0) low_thresh *= low_thresh;    //低阈值平方运算
        if (high_thresh > 0) high_thresh *= high_thresh; //高阈值平方运算
    }
 
    int low = cvFloor(low_thresh);   // cvFloor返回不大于参数的最大整数值, 相当于取整
    int high = cvFloor(high_thresh);
 
    // ptrdiff_t 是C/C++标准库中定义的一个数据类型，signed类型，通常用于存储两个指针的差（距离），可以是负数
	//减法运算的值为两个指针在内存中的距离（以数组元素的长度为单位，而非字节），因为可以减法运算的结果将除以数组元素类型的长度
    // mapstep 用于存放
    ptrdiff_t mapstep = src.cols + 2; // +2 表示左右各扩展一条边
    
    // AutoBuffer 会自动分配一定大小的内存，并且指定内存中的数据类型是uchar
    // 列数 +2 表示图像左右各自扩展一条边 （用于复制边缘像素，扩大原始图像）
    // 行数 +2 表示图像上下各自扩展一条边
    AutoBuffer<uchar> buffer((src.cols+2)*(src.rows+2) + cn * mapstep * 3 * sizeof(int));
 
    int* mag_buf[3];  //定义一个大小为3的int型指针数组，
    mag_buf[0] = (int*)(uchar*)buffer;
    mag_buf[1] = mag_buf[0] + mapstep*cn;
    mag_buf[2] = mag_buf[1] + mapstep*cn;
    memset(mag_buf[0], 0, /* cn* */mapstep*sizeof(int));
 
    uchar* map = (uchar*)(mag_buf[2] + mapstep*cn);
    memset(map, 1, mapstep);
    memset(map + mapstep*(src.rows + 1), 1, mapstep);
 
    int maxsize = std::max(1 << 10, src.cols * src.rows / 10); // 2的10次幂 1024
    std::vector<uchar*> stack(maxsize); // 定义指针类型向量，用于存地址
    uchar **stack_top = &stack[0];      // 栈顶指针（指向指针的指针），指向stack[0], stack[0]也是一个指针
    uchar **stack_bottom = &stack[0];   // 栈底指针 ，初始时 栈底指针 == 栈顶指针
 
 
    // 梯度的方向被近似到四个角度之一 (0, 45, 90, 135 四选一)
    /* sector numbers
       (Top-Left Origin)
 
        1   2   3
         *  *  *
          * * *
        0*******0
          * * *
         *  *  *
        3   2   1
    */
    
 
    // define 定义函数块
    // CANNY_PUSH(d) 是入栈函数， 参数d表示地址指针，让该指针指向的内容为2（int型强制转换成uchar型），并入栈，栈顶指针+1
    // 2表示 像素属于某条边缘 可以看下方的注释
    // CANNY_POP(d) 是出栈函数， 栈顶指针-1，然后将-1后的栈顶指针指向的值，赋给d
    #define CANNY_PUSH(d)    *(d) = uchar(2), *stack_top++ = (d)
    #define CANNY_POP(d)     (d) = *--stack_top
 
    // calculate magnitude and angle of gradient, perform non-maxima suppression.
    // fill the map with one of the following values:
    // 0 - the pixel might belong to an edge 可能属于边缘
    // 1 - the pixel can not belong to an edge 不属于边缘
    // 2 - the pixel does belong to an edge 一定属于边缘
    
    // for内进行非极大值抑制 + 滞后阈值处理
    for (int i = 0; i <= src.rows; i++) // i 表示第i行
    {
		// i == 0 时，_norm 指向 mag_buf[1]
		// i > 0 时， _norm 指向 mag_buf[2]
		// +1 表示跳过每行的第一个元素，因为是后扩展的边，不可能是边缘
		int* _norm = mag_buf[(i > 0) + 1] + 1; 
        
        if (i < src.rows)
        {
            short* _dx = dx.ptr<short>(i); // _dx指向dx矩阵的第i行
            short* _dy = dy.ptr<short>(i); // _dy指向dy矩阵的第i行
 
            if (!L2gradient) // 如果 L2gradient为false
            {
                for (int j = 0; j < src.cols*cn; j++) // 对第i行里的每一个值都进行计算
                    _norm[j] = std::abs(int(_dx[j])) + std::abs(int(_dy[j])); // 用||+||计算
            }
            else
            {
                for (int j = 0; j < src.cols*cn; j++)
		    //用平方计算,当 L2gradient为 true时，高低阈值都被平方了，所以此处_norm[j]无需开平方
                    _norm[j] = int(_dx[j])*_dx[j] + int(_dy[j])*_dy[j]; //
            }
            if (cn > 1) // 如果不是单通道
            {
                for(int j = 0, jn = 0; j < src.cols; ++j, jn += cn)
                {
                    int maxIdx = jn;
                    for(int k = 1; k < cn; ++k)
                        if(_norm[jn + k] > _norm[maxIdx]) maxIdx = jn + k;
                    _norm[j] = _norm[maxIdx];
                    _dx[j] = _dx[maxIdx];
                    _dy[j] = _dy[maxIdx];
                }
            }
            _norm[-1] = _norm[src.cols] = 0; // 最后一列和第一列的梯度幅值设置为0
			//-1代表_norm内存地址的前一块，_norm指向的位置为mag_buf[(i > 0) + 1]位置后 + 1，因此_norm[-1]即为mag_buf[(i > 0) + 1]位置第一列
        }
        // 当i == src.rows （最后一行）时，申请空间并且每个空间的值初始化为0, 存储在mag_buf[2]中
        else
            memset(_norm-1, 0, /* cn* */mapstep*sizeof(int)); 
 
        // at the very beginning we do not have a complete ring
        // buffer of 3 magnitude rows for non-maxima suppression
        if (i == 0)
            continue;
 
        uchar* _map = map + mapstep*i + 1; // _map 指向第 i+1 行，+1表示跳过该行第一个元素
        _map[-1] = _map[src.cols] = 1; // 第一列和最后一列不是边缘，所以设置为1
 
        int* _mag = mag_buf[1] + 1; // take the central row 中间那一行
        ptrdiff_t magstep1 = mag_buf[2] - mag_buf[1];
        ptrdiff_t magstep2 = mag_buf[0] - mag_buf[1];
 
        const short* _x = dx.ptr<short>(i-1);
        const short* _y = dy.ptr<short>(i-1);
 
	  // 如果栈的大小不够，则重新为栈分配内存（相当于扩大容量）
        if ((stack_top - stack_bottom) + src.cols > maxsize)
        {
            int sz = (int)(stack_top - stack_bottom);
            maxsize = maxsize * 3/2;
            stack.resize(maxsize);
            stack_bottom = &stack[0];
            stack_top = stack_bottom + sz;
        }
 
        int prev_flag = 0; //前一个像素点 0：非边缘点 ；1：边缘点
		//非极大值抑制(其实就是判断该坐标是否为最大值，当然要记得考虑方向)
		//在每一点上，领域中心 x 与沿着其对应的梯度方向(左右、上下、对角线)的两个像素相比，
		//若中心像素为最大值，则保留，否则中心置0，这样可以抑制非极大值，保留局部梯度最大的点，以得到细化的边缘。
        for (int j = 0; j < src.cols; j++) // 第 j 列
        {
            #define CANNY_SHIFT 15
            // tan22.5,,在后面的非极大值抑制中判断梯度方向  0.414...是（根号2 -1）=tan22.5的大小
            const int TG22 = (int)(0.4142135623730950488016887242097*(1<<CANNY_SHIFT) + 0.5);

			//如果梯度响应(即上面计算出来的norm)大于低阈值，则判断该坐标位置是否为最大梯度响应,否则直接标记为1，不是边缘.
            int m = _mag[j];
            if (m > low) // 如果大于低阈值
            {
                int xs = _x[j];    // dx中 第i-1行 第j列
                int ys = _y[j];    // dy中 第i-1行 第j列
                int x = std::abs(xs);
                int y = std::abs(ys) << CANNY_SHIFT;
                int tg22x = x * TG22;

				//四个方向极大值判断，如果是极大值则进入__ocv_canny_push，进一步判断该点是边缘(标记为2)或者可能是边缘(标记为0)
                if (y < tg22x) //角度小于22.5 用区间表示：[0, 22.5)
                {
		      // 与左右两点的梯度幅值比较，如果比左右都大（此时当前点是左右邻域内的极大值），则 goto __ocv_canny_push 执行入栈操作
                    if (m > _mag[j-1] && m >= _mag[j+1]) goto __ocv_canny_push;
                }
                else //角度大于22.5  
                {
                    int tg67x = tg22x + (x << (CANNY_SHIFT+1)); //tan67.5=(根号2+1)=tan22.5+2
                    if (y > tg67x) //(67.5, 90)
                    {
                    	//与上下两点的梯度幅值比较，如果比上下都大（此时当前点是左右邻域内的极大值），则 goto __ocv_canny_push 执行入栈操作
                        if (m > _mag[j+magstep2] && m >= _mag[j+magstep1]) goto __ocv_canny_push;
                    }
                    else //[22.5, 67.5]
                    {
                    	// ^ 按位异或 如果xs与ys异号 则取-1 否则取1
                        int s = (xs ^ ys) < 0 ? -1 : 1;
                        //比较对角线邻域
                        if (m > _mag[j+magstep2-s] && m > _mag[j+magstep1+s]) goto __ocv_canny_push;
                    }
                }
            }
            
	      //比当前的梯度幅值低阈值还低，直接被确定为非边缘
            prev_flag = 0;
            _map[j] = uchar(1); // 1 表示不属于边缘
            
            continue;

			//梯度响应大于大阈值，且左侧和上侧都不是已确定的边缘(标记为2)时，才确定为边缘否则标记为可能边缘-0
__ocv_canny_push:
	       // 前一个点不是边缘点 并且 当前点的幅值大于高阈值（大于高阈值被视为边缘像素） 并且 正上方的点不是边缘点
            if (!prev_flag && m > high && _map[j-mapstep] != 2)
            {
            	//将当前点的地址入栈，入栈前，会将该点地址指向的值设置为2（查看上面的宏定义函数块里）
                CANNY_PUSH(_map + j); 
                prev_flag = 1;
            }
            else
                _map[j] = 0;
        }
 
        // scroll the ring buffer
        // 交换指针指向的位置，向上覆盖，把mag_[1]的内容覆盖到mag_buf[0]上
        // 把mag_[2]的内容覆盖到mag_buf[1]上
	    // 最后 让mag_buf[2]指向_mag指向的那一行
        _mag = mag_buf[0];
        mag_buf[0] = mag_buf[1];
        mag_buf[1] = mag_buf[2];
        mag_buf[2] = _mag;
    }
 
	
    // now track the edges (hysteresis thresholding)
    // 通过上面的for循环，确定了各个邻域内的极大值点为边缘点（标记为2）
    // 现在，在这些边缘点的8邻域内（上下左右+4个对角）,将可能的边缘点（标记为0）确定为边缘
	//三.边缘跟踪
	//可简单理解为：在已确定为边缘点(标记为2)的8个邻域上，将可能是边缘的点(标记为0)，判断为边缘(0->2).
    while (stack_top > stack_bottom)
    {
        uchar* m;
        if ((stack_top - stack_bottom) + 8 > maxsize)
        {
            int sz = (int)(stack_top - stack_bottom);
            maxsize = maxsize * 3/2;
            stack.resize(maxsize);
            stack_bottom = &stack[0];
            stack_top = stack_bottom + sz;
        }
 
        CANNY_POP(m); // 出栈
 
		//如果该边缘点8个邻域上的点是可能边缘(标记为0)，则判断其为边缘，重新标记为2.
        if (!m[-1])         CANNY_PUSH(m - 1);
        if (!m[1])          CANNY_PUSH(m + 1);
        if (!m[-mapstep-1]) CANNY_PUSH(m - mapstep - 1);
        if (!m[-mapstep])   CANNY_PUSH(m - mapstep);
        if (!m[-mapstep+1]) CANNY_PUSH(m - mapstep + 1);
        if (!m[mapstep-1])  CANNY_PUSH(m + mapstep - 1);
        if (!m[mapstep])    CANNY_PUSH(m + mapstep);
        if (!m[mapstep+1])  CANNY_PUSH(m + mapstep + 1);
    }
 

	//四.根据标记值0,1,2生成边缘。生成边缘图
    const uchar* pmap = map + mapstep + 1;
    uchar* pdst = dst.ptr();
    for (int i = 0; i < src.rows; i++, pmap += mapstep, pdst += dst.step)
    {
		//标记0: (uchar)-(0>>1)等于0
		//标记1：(uchar)-(1>>1)也等于0
		//标记2：(uchar)-(2>>1)=uchar(-1)=255
		//边缘像素值全部是255，非边缘全部是
        for (int j = 0; j < src.cols; j++)
            pdst[j] = (uchar)-(pmap[j] >> 1);
    }
}

参考链接: http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/tutorials/imgproc/imgtrans/canny_detector/canny_detector.html
https://blog.csdn.net/piaoxuezhong/article/details/62217443

OpenCV03-高级-滤波与增强坐吃山猪 OpenCV opencv 计算机视觉人工智能
OpenCV03-高级-滤波与增强文章目录OpenCV03-高级-滤波与增强1-OpenCV平滑滤波1.均值滤波(`cv2.blur()`)2.高斯滤波(`cv2.GaussianBlur()`)3.中值滤波(`cv2.medianBlur()`)4.双边滤波(`cv2.bilateralFilter()`)总结2-OpenCV边缘检测1.Sobel算子(`cv2.Sobel()`)2.Canny
PCL 点云高程渲染：实现点云高程信息的颜色渲染技术征服冒险 PCL
PCL点云高程渲染：实现点云高程信息的颜色渲染点云渲染在计算机视觉和图形学中具有重要的应用价值。在处理点云数据时，一种常见的需求是通过将高程信息映射到颜色空间，以实现对点云的可视化。本文将介绍如何使用PCL（PointCloudLibrary）库实现点云的高程渲染，并提供相应的源代码。引言在开始之前，我们首先需要了解点云的基本概念。点云是由大量的三维点组成的数据集合，每个点都具有X、Y和Z坐标。点
全新 Hopper 架构的Transformer 引擎有什么特点？扫地的小何尚人工智能
Transformer引擎是全新Hopper架构的一部分，将显著提升AI性能和功能，并助力在几天或几小时内训练大型模型。Transformer模型是当今广泛使用的语言模型（例如asBERT和GPT-3）的支柱。Transformer模型最初针对自然语言处理用例而开发，但因其通用性，现在逐步应用于计算机视觉、药物研发等领域。与此同时，模型大小不断呈指数级增长，现在已达到数万亿个参数。由于计算量巨大，
Kotlin Bytedeco OpenCV 图像图像55 图像透视变换深色風信子 kotlin opencv 透视变换 bytedeco
KotlinBytedecoOpenCV图像图像53图像透视变换1添加依赖2测试代码3测试结果1添加依赖4.0.0com.xuKotlinOpenCV1.02.0.0UTF-8official1.8mavenCentralhttps://repo1.maven.org/maven2/cn.hutoolhutool-all5.8.29org.apache.commonscommons-compres
MATLAB语言的计算机基础疯狂小小小码农包罗万象 golang 开发语言后端
MATLAB语言的计算机基础引言在当今信息技术飞速发展的时代，编程能力已成为当代人士必备的一项基本技能。MATLAB（矩阵实验室）作为一种高级编程语言和环境，广泛应用于数据分析、算法开发、模型创建、数字图像处理和计算机视觉等多个领域。MATLAB以其强大的矩阵运算和可视化能力，成为了科研人员和工程师的重要工具，尤其在数学、物理、工程等学科中，它的应用不可或缺。本文将从MATLAB的基本概念、环境搭
OpenCV基础学习 yzx991013 OpenCV基础全集学习
5.1开运算完整代码：importcv2importnumpyasnpdefcir():try:image=cv2.imread("./image/xingtai/cirrec.jpg")kernel=cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(11,11))src=cv2.morphologyEx(image,cv2.MORPH_OPEN,kerne
OpenCV实例应用 yzx991013 OpenCV基础全集 opencv 人工智能计算机视觉
5.0图像的腐蚀应用完整代码：importcv2importnumpyasnpdeferode():img=cv2.imread('./image/dige.png')kernel=np.ones((3,3),np.uint8)erosion=cv2.erode(img,kernel,iterations=1)erosion1=cv2.erode(img,kernel,iterations=2)r
opencv图像基础学习 yzx991013 OpenCV基础全集 opencv 人工智能计算机视觉
2.3图像的加密解密源码如下：importcv2importnumpyasnpimportmatplotlib.pyplotaspltdefpassImg():img=cv2.imread('./image/cat.jpg',0)h,w=img.shape#生成一个密码，加密key_img=np.random.randint(0,256,size=(h,w),dtype=np.uint8)img_
【OpenCV入门学习--python】绘图函数喜欢星星的田螺姑娘 OpenCV opencv python 学习
源代码：（查看教材《OpenCV-Python中文教程》段力辉译）importnumpyasnpimportcv2#Createablackimageimg=np.zeros((512,512,3),np.uint8)#将所有像素点的各通道数值赋0#其中“3”是三个通道的意思#np.zeros函数用于创建一个数值全为0的矩阵，np.ones用于创建一个数值全为1的矩阵#Drawadiagonalb
opencv基础学习 yzx991013 OpenCV基础全集 opencv 学习人工智能
3.3OTSU阈值代码：importcv2importnumpyasnpfrommatplotlibimportpyplotaspltimg=cv2.imread('./image/otus.png',0)#简单阈值ret1,th1=cv2.threshold(img,127,255,cv2.THRESH_BINARY)#二值化阈值ret2,th2=cv2.threshold(img,0,255,
OpenCV阈值 yzx991013 OpenCV基础全集 opencv 人工智能计算机视觉
3.1阈值代码：importcv2frommatplotlibimportpyplotasplt#读取图像img1=cv2.imread("./image/card10.png")#检查图像是否成功加载ifimg1isNone:print("Error:Imagenotfoundorunabletoread.")exit()#转换为灰度图gray=cv2.cvtColor(img1,cv2.COL
昇腾NPU推理YOLOV10目标检测（C++） weixin_51923349 c++ffmpeg opencv
1.准备工作基础环境：需要安装NPU固件驱动，CANN的包在昇腾官网下载，安装最新版就可以了。C++环境搭建链接：cplusplus/environment/catenation_environmental_guidance_CN.md·Ascend/samples-Gitee.com按照上面的链接，需要安装：presentagent,opencv,ffmpeg+acllite其中ffmpeg和o
Qt制作一个ListView列表 Qt开发老杰 qt 开发语言
一、概述案例：使用Qt制作一个ListView。点击ListView的Item可以用于测试OpenCV的各种效果自定义一个：MainListView继承QListWidget、MainListViewItem继承QListWidgetItem二、代码示例1.自定义QListWidgetmainlistview.hclassMainListView:publicQListWidget{Q_OBJEC
YOLOv8重磅升级：引入DenseOne密集网络革新主干设计，重塑YOLO目标检测性能新高度程序员杨弋 YOLO 目标检测人工智能
随着深度学习技术的不断进步，目标检测作为计算机视觉领域的重要任务之一，其性能和应用范围也在不断扩大。作为目标检测领域的佼佼者，YOLO（YouOnlyLookOnce）系列算法以其出色的性能和实时性受到了广泛关注。而最近提出的YOLOv8更是在前代版本的基础上进行了多项优化，进一步提升了检测精度和速度。然而，尽管YOLOv8已经取得了显著的进步，但在处理复杂场景和遮挡问题时，仍然存在一定的挑战。为
如何利用OpenCV和yolo实现人脸检测音视频牛哥大牛直播SDK opencv 人工智能计算机视觉 yolo11 人脸检测 opencv人脸检测 yolo人脸检测
在之前的blog里面，我们有介绍OpenCV和yolo的区别，本文就人脸检测为例，分别介绍下OpenCV和yolo的实现方式。OpenCV实现人脸检测一、安装OpenCV首先确保你已经安装了OpenCV库。可以通过以下方式安装：使用包管理工具安装：在Python环境中，可以使用pip安装：pipinstallopencv-python。二、加载预训练的人脸检测模型OpenCV提供了基于Haar特征
基于深度学习的人脸表情识别系统：YOLOv5 + YOLOv8 + YOLOv10 + UI界面 + 数据集 2025年数学建模美赛深度学习 YOLO ui 分类人工智能
引言随着人工智能的飞速发展，深度学习技术已广泛应用于各个领域，尤其是在计算机视觉领域。人脸识别和表情识别是其中的一个重要应用，能够在多种场景下提供重要的信息，例如安全监控、情感分析、智能客服、健康监测等。在人脸表情识别任务中，准确识别人脸的情感状态（如高兴、愤怒、悲伤等）是一个极具挑战性的任务。随着YOLO系列算法的不断进步，YOLOv5、YOLOv8和YOLOv10的推出大大提高了目标检测的精度
基于YOLOv8深度学习的人脸年龄检测识别系统 2025年数学建模美赛 YOLO 深度学习人工智能 ui 数据挖掘分类
引言随着人工智能和计算机视觉的飞速发展，人脸分析技术在年龄检测领域取得了显著进展。人脸年龄检测系统在安全监控、广告推荐、健康监测等领域有广泛应用。本文将基于YOLOv8目标检测模型和UI界面，开发一个完整的人脸年龄检测识别系统。我们将详细介绍项目的技术实现、数据集构建、模型训练以及UI设计，并附上完整代码。目录引言系统架构设计数据准备公开人脸年龄数据集数据标注格式数据目录结构模型训练YOLOv8环
opencv-python安装失败的解决方法之一格格衫穿七天 opencv python 人工智能
问题描述：1.pip下载opencv-python无论使用哪个镜像网站都找不到3.4.1.15版本；2.xxx.whl文件下载后用pipinstall“路径”导入失败；3.pip下载以及直接下载xxx.whl都十分慢；解决方法：不要改安装的位置！此时我们需要安装opencv-contrib-python（version为3.4.1.15，和opencv-python保持一致）注意安装时所在的位置，
SpringBoot一键提取身份证与营业执照信息一名技术极客 #java相关工具类 spring boot 后端 java
SpringBoot一键提取身份证与营业执照信息使用的工具和库步骤和代码示例添加依赖图像预处理和文字识别信息提取使用OpenCV对图像进行预处理OpenCV图像预处理示例集成到OCR服务中在SpringBoot中实现图片中的身份证号、营业执照等信息的识别，可以分为以下几个步骤：图像预处理：为了提高识别的准确性，首先对图片进行预处理，如调整大小、对比度、亮度等。文字检测：使用图像处理算法或框架来定位
开源人工智能模型框架：探索与实践 CodeJourney. 人工智能能源
摘要本文深入探讨了开源人工智能模型框架，旨在为研究人员、开发者及相关从业者提供全面的理解与参考。通过对多个主流开源框架，如TensorFlow、PyTorch、Keras、Detectron2、OpenCV、HuggingFaceTransformers、AllenNLP、MindSpore和Fastai的详细分析，阐述其特点、应用场景、优势与不足，并结合具体示例说明其使用方法，同时配以相关架构图
AlexNet：开启深度学习图像识别新纪元池央深度学习人工智能
一、引言在深度学习的璀璨星空中，AlexNet无疑是一颗极为耀眼的明星。它于2012年横空出世，并在ImageNet竞赛中一举夺冠，这一历史性的突破彻底改变了计算机视觉领域的发展轨迹，让全世界深刻认识到深度卷积神经网络在图像识别任务中的巨大潜力，从而掀起了深度学习研究与应用的热潮。二、AlexNet网络架构详解（一）输入层AlexNet的输入图像通常为224x224x3的彩色图像。这一尺寸的确定是
Python基于YOLOv8和OpenCV实现车道线和车辆检测 old_power 计算机视觉 YOLO opencv 计算机视觉 python
使用YOLOv8（YouOnlyLookOnce）和OpenCV实现车道线和车辆检测，目标是创建一个可以检测道路上的车道并识别车辆的系统，并估计它们与摄像头的距离。该项目结合了计算机视觉技术和深度学习物体检测。1、系统主要功能车道检测：使用边缘检测和霍夫线变换检测道路车道。汽车检测：使用YOLOv8模型识别汽车并在汽车周围绘制边界框。距离估计：使用边界框大小计算检测到的汽车与摄像头的距离。2、环境
OpenCV相机标定与3D重建(59)用于立体相机标定的函数stereoCalibrate()的使用 jndingxin OpenCV 3d opencv
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述标定立体相机设置。此函数找到两个相机各自的内参以及两个相机之间的外参。cv::stereoCalibrate是OpenCV中用于立体相机标定的函数。它通过一组已知的3D点及其在两个相机中的对应2D投影，来估计两个相机之间的相对位置和方向（旋转矩阵R和平移向量T），
OpenCV相机标定与3D重建(54)解决透视 n 点问题（Perspective-n-Point, PnP）函数solvePnP()的使用 jndingxin OpenCV opencv 3d
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述根据3D-2D点对应关系找到物体的姿态。cv::solvePnP是OpenCV库中的一个函数，用于解决透视n点问题（Perspective-n-Point,PnP），即通过已知的3D点及其对应的2D图像点来估计物体的姿态（旋转和平移）。这个函数可以处理任意数量的点
卷积神经网络（CNN）：深度学习中的核心模型任义礼智信深度学习 cnn 人工智能
引言卷积神经网络（ConvolutionalNeuralNetworks,CNNs）是深度学习领域的一种重要模型，广泛应用于图像处理、计算机视觉、自然语言处理等多个领域。CNN凭借其卓越的特征提取能力和参数共享机制，已成为计算机视觉任务中最主流的算法之一。本文将深入探讨CNN的基本原理、结构组件、应用场景及其发展方向。CNN的基本原理CNN是一种特殊的前馈神经网络（FeedforwardNeura
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
tiff批量转png 诺有缸的高飞鸟 opencv 图像处理 python opencv 图像处理
目录写在前面代码完写在前面1、本文内容tiff批量转png2、平台/环境opencv,python3、转载请注明出处：https://blog.csdn.net/qq_41102371/article/details/132975023代码importnumpyasnpimportcv2importosdeffindAllFile(base):file_list=[]forroot,ds,fsin
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
windows下python opencv ffmpeg读取摄像头实现rtsp推流拉流图像处理大大大大大牛啊 opencv实战代码讲解视觉图像项目 windows python opencv
windows下pythonopencvffmpeg读取摄像头实现rtsp推流拉流整体流程1.下载所需文件1.1下载rtsp推流服务器1.2下载ffmpeg2.开启RTSP服务器3.opencv读取摄像头并调用ffmpeg进行推流4.opencv进行拉流5.opencv异步拉流整体流程1.下载所需文件1.1下载rtsp推流服务器下载RTSP服务器下载页面https://github.com/blu
c++ opencv4.3 sift匹配图像处理大大大大大牛啊图像处理 opencv实战代码讲解 opencv sift c++opencv4 特征点
c++opencv4.3sift匹配main.cppintmain(){vectorkeypoints1,keypoints2;Matimg1,img2,descriptors1,descriptors2;intnumF
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1

Canny边缘检测，Opencv源码解析

Canny边缘检测原理

Opencv源码解析

你可能感兴趣的:(OpenCV,opencv,计算机视觉)