changzig1995

转：openCV基础图像处理

参考资料：

《OpenCV 2 Computer Vision Application Programming Cookbook》
《The OpenCV Reference Manual》
《Learning OpenCV》

读写

读入

1	Mat img = imread(filename)

如果读入的是 jpg 格式的图片，默认会读入三个通道的数据。如果需要当做灰度图像读入，使用：

1	Mat img = imread(filename, 0);

也可以先读入再转换成灰度图：

     
       
       
       
       
        
        
        
        
      Mat img = imread(
      
        
        
        
        "image.jpg");
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      Mat grey;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cvtColor(img, grey, CV_BGR2GRAY);

写入

1	imwrite(filename, img);

展示

展示一幅 `8U` 图像

     
       
       
       
       
        
        
        
        
      Mat img = imread("image.jpg");
     
       
       
       
       
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      namedWindow("image", CV_WINDOW_AUTOSIZE);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      imshow("image", img);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      waitKey();

展示一幅 `32F` 的图像

需要先转成 8U 类型。例如：

     
       
       
       
       
        
        
        
        
      Mat img = imread(
      
        
        
        
        "image.jpg");
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      Mat grey;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cvtColor(img, grey, CV_BGR2GRAY);
     
       
       
       
       
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      Mat sobelx;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      Sobel(grey, sobelx, CV_32F, 
      
        
        
        
        1, 
      
        
        
        
        0);
     
       
       
       
       
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        double minVal, maxVal;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      minMaxLoc(sobelx, &minVal, &maxVal); 
      
        
        
        
        //find minimum and maximum intensities
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      Mat draw;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      sobelx.convertTo(draw, CV_8U, 
      
        
        
        
        255.0/(maxVal - minVal), -minVal * 
      
        
        
        
        255.0/(maxVal - minVal));
     
       
       
       
       
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      namedWindow(
      
        
        
        
        "image", CV_WINDOW_AUTOSIZE);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      imshow(
      
        
        
        
        "image", draw);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      waitKey();

访问像素

要获取 Mat 容器里的像素值，例如一幅图像里某个像素的亮度值，首先要求你得了解这幅图像的类型和通道数。

灰度图像访问单像素值

获取单通道灰度图（类型为8UC1）里像素点 (x,y) 的亮度值：

1	Scalar intensity = img.at(y,x);

也可以这么写：

1	Scalar intensity = img.at(Point(x, y));

得到的 intensity.val[0] 将包含一个从 0~255 之间的数值。

彩色图像访问单像素值

对于 3 通道的 BGR 彩色图像，可以这么写：

     
       
       
       
       
        
        
        
        
      Vec3b intensity = img.at(y,x);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      uchar blue = intensity.val[
      
        
        
        
        0];
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      uchar green = intensity.val[
      
        
        
        
        1];
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      uchar red = intensity.val[
      
        
        
        
        2];

浮点型的图像也以此类推，注意使用浮点型的变量保存即可。

遍历所有像素

如果要遍历所有像素，可以使用 C 语言的方式，先从数组第一行开始，遍历每一行。cv::Mat 类提供了一个访问图像一行的地址方法：ptr 函数，该函数为一个模板函数。

     
       
       
       
       
      
        
        
        
        /** 
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * colorReduce	-	reduce color number
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       *
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * @param image	-	the image for processing
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * @param div	-	reduce factor
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       */
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        void colorReduce(cv::Mat &image, 
      
        
        
        
        int div=
      
        
        
        
        64)
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      {
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        int nl = image.rows;		
      
        
        
        
        // number of lines
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        int nc = image.cols * image.channels();
     
       
       
       
       
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        for (
      
        
        
        
        int j=
      
        
        
        
        0; j
     
       
       
       
       
        
        
        
        
              uchar *data = image.ptr(j);
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        for (
      
        
        
        
        int i=
      
        
        
        
        0; i
     
       
       
       
                   
      
        
        
        
        // process each pixel
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  data[i] = data[i] / div * div + div / 
      
        
        
        
        2;
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        // end of pixel processing
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              }
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }

在系统底层，为了方便硬件解码，一幅二维图像可能会在每一行的末尾填补一个额外的像素，这个额外填补的像素不会被显示或储存，且它们所存储的值会被忽略，它们起到一个哨兵的作用。

但对于没有使用额外像素填补的图像，图像中的每个像素都是实际像素，因此可以把整幅图像直接当做一维数组来遍历每个元素，从而减轻了循环的开销。cv::Mat 类提供了 isContinuous 函数来检测是否属于这种情况。

     
       
       
       
       
      
        
        
        
        /** 
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * colorReduce	-	reduce color number
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       *
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * @param image	-	the image for processing
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * @param div	-	reduce factor
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       */
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        void colorReduce(cv::Mat &image, 
      
        
        
        
        int div=
      
        
        
        
        64)
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      {
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        int nl = image.rows;		
      
        
        
        
        // number of lines
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        int nc = image.cols * image.channels();
     
       
       
       
       
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        if (image.isContinuous()) {
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // then no padded pixels
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              nc = nc * nl;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              nl = 
      
        
        
        
        1;		
      
        
        
        
        // it is now a 1D array
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // this loop is executed only once
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        for (
      
        
        
        
        int j=
      
        
        
        
        0; j
     
       
       
       
       
        
        
        
        
              uchar *data = image.ptr(j);
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        for (
      
        
        
        
        int i=
      
        
        
        
        0; i
     
       
       
       
                   
      
        
        
        
        // process each pixel
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  data[i] = data[i] / div * div + div / 
      
        
        
        
        2;
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        // end of pixel processing
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              }
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }

另一种遍历像素的方法是使用 STL 风格的迭代器，如 cv::MatIterator_ 和 cv::MatConstIterator_：

1	cv::MatIterator_ it;

也可以使用 iterator 类型，在 Mat_ 模板类里定义：

1	cv::Mat_::iterator it;

示例：

     
       
       
       
       
      
        
        
        
        /** 
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * colorReduce	-	reduce color number
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       *
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * @param image	-	the image for processing
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * @param div	-	reduce factor
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       */
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        void colorReduce(cv::Mat &image, 
      
        
        
        
        int div=
      
        
        
        
        64)
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      {
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::MatIterator_ it = image.begin();
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::MatIterator_ itend = image.end();
     
       
       
       
       
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // loop over all pixels
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        for ( ; it!= itend; ++it) {
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              (*it)[
      
        
        
        
        0] = (*it)[
      
        
        
        
        0] / div * div + div / 
      
        
        
        
        2;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              (*it)[
      
        
        
        
        1] = (*it)[
      
        
        
        
        1] / div * div + div / 
      
        
        
        
        2;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              (*it)[
      
        
        
        
        2] = (*it)[
      
        
        
        
        2] / div * div + div / 
      
        
        
        
        2;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }

Mat 的迭代器是一个随机访问迭代器，因此支持完整的迭代器算术运算，如 std::sort() 等。

遍历并访问相邻像素

有时候需要在遍历图像的同时访问相邻的像素。例如，用于进行边缘增强的拉普拉斯算子的表达式为：

1	增强后的像素值 = 5*当前 - 左 - 右 - 上 - 下

可使用三个指针来进行图像遍历，一个用于当前行，一个用于上面一行，一个用于下面一行：

     
       
       
       
       
      
        
        
        
        /** 
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * sharpen	-	lapracian sharpen function
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       *
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * @param image		-	the source grey scale image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * @param result	-	the output grey scale image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       */
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        void sharpen(
      
        
        
        
        const cv::Mat &image, cv::Mat &result)
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      {
     
       
       
       
       
     
       
       
       
         
      
        
        
        
        // allocate if neccessary
     
       
       
       
       
     
       
       
       
       
        
        
        
        
        result.create(image.size(), image.type());
     
       
       
       
       
     
       
       
       
           
     
       
       
       
       
     
       
       
       
         
      
        
        
        
        for (
      
        
        
        
        int j=
      
        
        
        
        1; j1; ++j) {  
      
        
        
        
        // for all rows
     
       
       
       
       
     
       
       
       
                             
      
        
        
        
        // (except first and last)
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        const uchar *previous =
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      image.ptr<
      
        
        
        
        const uchar>(j-
      
        
        
        
        1);  
      
        
        
        
        // previous row
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        const uchar *current =
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      image.ptr<
      
        
        
        
        const uchar>(j);    
      
        
        
        
        // current row
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        const uchar *next  =
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      image.ptr<
      
        
        
        
        const uchar>(j+
      
        
        
        
        1);  
      
        
        
        
        // next row
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              uchar *output = result.ptr(j);  
      
        
        
        
        // output row
     
       
       
       
       
     
       
       
       
               
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        for (
      
        
        
        
        int i=
      
        
        
        
        1; i1; ++i) {
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  *output++ = cv::saturate_cast(
      
        
        
        
        5*current[i]-current[i-
      
        
        
        
        1]
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                                  -current[i+
      
        
        
        
        1]-previous[i]-next[i]);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              }
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // Set the unprocess pixelss to 0
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          result.row(
      
        
        
        
        0).setTo(cv::Scalar(
      
        
        
        
        0));
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          result.row(result.rows-
      
        
        
        
        1).setTo(cv::Scalar(
      
        
        
        
        0));
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          result.col(
      
        
        
        
        0).setTo(cv::Scalar(
      
        
        
        
        0));
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          result.col(result.cols-
      
        
        
        
        1).setTo(cv::Scalar(
      
        
        
        
        0));
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }

图像通道

可以使用 cv::split 操作来将彩色图像分离成三个单通道图像，使用 cv::merge 操作可以重新将几个单通道图像合并成一个多通道图像。下面的程序演示了将一幅图像 image2 与另一幅图像 image1 的蓝色通道混合：

     
       
       
       
       
      
        
        
        
        // create vector of 3 images
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        vector planes;
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // split 1 3-channel image into 3 1-channel images
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::split(image1, planes);
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // add to blue channel
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      planes[
      
        
        
        
        0] += image2;
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // merge the 3 1-channel images into 1 3-channel image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::merge(planes, result);

简单图像运算

图像叠加

简单叠加

     
       
       
       
       
      
        
        
        
        // c[i]= a[i]+b[i];
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::add(imageA, imageB, resultC);
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // c[i]= a[i]+k;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::add(imageA, cv::Scalar(k), resultC);

带权叠加

1 2	// c[i]= k1a[1]+k2b[i]+k3; cv::addWeighted(imageA, k1, imageB, k2, k3, resultC);

标量叠加

1 2	// c[i]= k*a[1]+b[i]; cv::scaleAdd(imageA, k, imageB, resultC);

带掩码叠加

1 2	// if (mask[i]) c[i]= a[i]+b[i]; cv::add(imageA, imageB, resultC, mask);

当使用 mask 时，该操作只作用在对应的掩码位置不为 0 的像素上（mask 必须为单通道）。

其他操作

其他常用的操作，包括：

cv::substract：两个图像相减，支持 mask；
cv::absdiff：两个图像的差的绝对值，支持 mask；
cv::multiply：两个图像逐元素相乘，支持 mask；
cv::divide：两个图像逐元素相除，支持 mask；
按位操作 cv::bitwise_and、cv::bitwise_or、cv::bitwise_xor、cv::bitwise_not；
cv::max 和 cv::min ：求每个元素的最小值或最大值返回这个矩阵，并返回结果矩阵。
cv::saturate_cast：确保值不会超出像素的取值范围（防止上溢和下溢）。

这些图像操作都要求参与运算的两幅图像大小相同。如果不符合这种情况，可以使用 ROI 。另外，因为这些运算都是逐元素进行的，因此可以在调用时直接把其中一张图像的变量直接作为输出变量。

更多的操作可以参考矩阵操作速查表。

感兴趣区域（ROI）

下面的程序演示了将一幅图像叠加到另一幅图像的一个感兴趣区域中。

     
       
       
       
       
      
        
        
        
        // define image ROI
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Mat imageROI;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      imageROI= image(cv::Rect(
      
        
        
        
        385,
      
        
        
        
        270,logo.cols,logo.rows));
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // add logo to image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::addWeighted(imageROI,
      
        
        
        
        1.0,logo,
      
        
        
        
        0.3,
      
        
        
        
        0.,imageROI);

叠加结果图

图像变换

图像缩放

OpenCV 提供了一个cv::resize() 函数，允许你指定新的图像大小，例如：

     
       
       
       
       
        
        
        
        
      cv::Mat resizedImage;	
      
        
        
        
        // to contain resized image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::resize(image, resizedImage,
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::Size(image.cols/
      
        
        
        
        3, image.rows/
      
        
        
        
        3));	
      
        
        
        
        // 1/3 resizing

查找表

查找表是一种映射，可以将图像原来的像素的灰度值根据查找表指定的规则映射到另一个值。OpenCV 提供了 cv::LUT 来支持这种变换。

下面示例一个将图像反色的查找表变换：

     
       
       
       
       
        
        
        
        
      cv::Mat inverseColor(
      
        
        
        
        const cv::Mat &image)	
      
        
        
        
        // 1x256 uchar matrix
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      {
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // the output image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Mat result;
     
       
       
       
       
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // Create a image inversion table
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        int dim(
      
        
        
        
        256);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Mat lut(
      
        
        
        
        1,		
      
        
        
        
        // 1 dimension
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      &dim,	
      
        
        
        
        // 256 entries
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      CV_8U); 
      
        
        
        
        // uchar
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        for (
      
        
        
        
        int i=
      
        
        
        
        0; i<
      
        
        
        
        256; ++i)
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              lut.at(i) = 
      
        
        
        
        255-i;
     
       
       
       
       
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // apply lookup table
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::LUT(image, lut, result);
     
       
       
       
       
     
       
       
       
           
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        return result;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }

反色结果图

阈值处理

阈值处理可以用来从图像中剔除低于或高于一定值的像素，其基本的思想是，给定一个数组和一个阈值，然后根据数组中的每个元素的值是低于还是高于阈值而进行一些处理。OpenCV 提供了 cv::threshold() 操作来进行阈值处理：

     
       
       
       
       
      
        
        
        
        double threshold(InputArray src,	
      
        
        
        
        // input
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      OutputArray dst,	
      
        
        
        
        // output
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        double thresh,	
      
        
        
        
        // threshold value
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        double maxval,	
      
        
        
        
        // maximum value to use
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        int type)			
      
        
        
        
        // thresholding type

其中，阈值类型选项 type 可以是以下几种类型：

阈值类型	说明	对应的操作
`cv::THRESH_BINARY`	二值阈值化	dsti=(srci>T)?M:0
`cv::THRESH_BINARY_INV`	反向二值阈值化	dsti=(srci>T)?0:M
`cv::THRESH_TRUNC`	截断阈值化	dsti=(srci>T)?M:srci
`cv::THRESH_TOZERO`	超过阈值被置于0	dsti=(srci>T)?srci:0
`cv::THRESH_TOZERO_INV`	低于阈值被置于0	dsti=(srci>T)?0:srci

各种阈值类型的操作结果可以参考下图：

将被阈值化的值和阈值
二值阈值化
反向二值阈值化
截断阈值化
超过阈值被置于0
低于阈值被置于0

示例：

1 2	cv::Mat thresholded; cv::threshold(image,thresholded, 60, 255,cv::THRESH_BINARY);

形态学变换

膨胀

1 2	cv::Mat element( 7, 7,CV_8U,cv::Scalar( 1)); cv::erode( image, result, element );

上面的 element 是结构元素，在这里用到了矩形结构元素。OpenCV 提供了几种形状的结构元素，可以通过 cv::getStructuringElement() 来定义：

1	Mat getStructuringElement( int shape, Size ksize, Point anchor=Point(- 1,- 1))

其中，shape 包含几种形状：

MORPH_Rect - 矩形结构元素；
MORPH_Ellipse - 椭圆形结构元素；
MORPH_CROSS - 十字形结构元素。

也可以自己定义一个形状，例如定义一个 “X” 形结构元素：

     
       
       
       
       
        
        
        
        
      cv::Mat x(
      
        
        
        
        5,
      
        
        
        
        5,CV_8U,cv::Scalar(
      
        
        
        
        0));
     
       
       
       
       
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // Creating the x-shaped structuring element
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        for (
      
        
        
        
        int i=
      
        
        
        
        0; i<
      
        
        
        
        5; i++) {
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          x.at(i,i)= 
      
        
        
        
        1;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          x.at(
      
        
        
        
        4-i,i)= 
      
        
        
        
        1;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }

腐蚀

1 2	cv::Mat element( 7, 7,CV_8U,cv::Scalar( 1)); cv::dilate( image, result, element );

高级形态学变换

基于膨胀和腐蚀两种基本的形态学变换，可以组合成诸如开操作、闭操作、形态学梯度、顶帽变换、黑（底）帽变换等高级的形态学变换。OpenCV 提供 cv::morphologyEx() 操作，以进行更高级的形态学变换：

     
       
       
       
       
      
        
        
        
        void morphologyEx(InputArray src, OutputArray dst, 
      
        
        
        
        int op, InputArray kernel, Point anchor=Point(-
      
        
        
        
        1,-
      
        
        
        
        1),
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        int iterations=
      
        
        
        
        1, 
      
        
        
        
        int borderType=BORDER_CONSTANT, 
      
        
        
        
        const Scalar&
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      borderValue=morphologyDefaultBorderValue() )

其中 op 可以是以下几种操作类型：

MORPH_OPEN - 开操作
MORPH_CLOSE - 闭操作
MORPH_GRADIENT - 形态学梯度
MORPH_TOPHAT - “顶帽”
MORPH_BLACKHAT - “黑帽”

开操作示例：

     
       
       
       
       
        
        
        
        
      cv::Mat element5(
      
        
        
        
        5,
      
        
        
        
        5,CV_8U,cv::Scalar(
      
        
        
        
        1));
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Mat opened;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::morphologyEx(image,opened,cv::MORPH_OPEN,element5);

直方图

计算直方图

使用 cv::calHist 来计算直方图，得到的直方图将存放到一个 cv::MatND 类型的容器中。

     
       
       
       
       
      
        
        
        
        void calcHist(
      
        
        
        
        const Mat* images,	
      
        
        
        
        // source arrays
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        int nimages,			
      
        
        
        
        // number of source images
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        const 
      
        
        
        
        int* channels,	
      
        
        
        
        // list of the dims channels
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  InputArray mask,		
      
        
        
        
        // optional mask
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  OutputArray hist,		
      
        
        
        
        // output mask
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        int dims,				
      
        
        
        
        // histogram dimensionality
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        const 
      
        
        
        
        int* histSize,	
      
        
        
        
        // array of histogram sizes 
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        const 
      
        
        
        
        float** ranges,	
      
        
        
        
        // array of the dims arrays
     
       
       
       
       
     
       
       
       
                                           
      
        
        
        
        // of the histogram bin boundaries
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        bool uniform=
      
        
        
        
        true,	
      
        
        
        
        // is uniform or not 
     
       
       
       
       
     
       
       
       
                    
      
        
        
        
        bool accumulate=
      
        
        
        
        false )
      
        
        
        
        // accumulation flag.

用于灰度图像

     
       
       
       
       
      
        
        
        
        // For gray-level images
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        class Histogram1D {
     
       
       
       
       
     
       
       
       
         
      
        
        
        
        public:
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          Histogram1D() {
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // Prepare arguments for 1D histogram
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              histSize[
      
        
        
        
        0] = 
      
        
        
        
        256;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              hranges[
      
        
        
        
        0] = 
      
        
        
        
        0.0;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              hranges[
      
        
        
        
        1] = 
      
        
        
        
        255.0;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              ranges[
      
        
        
        
        0] = hranges;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              channels[
      
        
        
        
        0] = 
      
        
        
        
        0;	
      
        
        
        
        // by default, we look at channel 0
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
           
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // Computes the 1D histogram.
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::MatND getHistogram(
      
        
        
        
        const cv::Mat &image) {
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::MatND hist;
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // Compute histogram
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::calcHist(&image,
     
       
       
       
       
     
       
       
       
                            
      
        
        
        
        1,			
      
        
        
        
        // histogram from 1 image only
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           channels,	
      
        
        
        
        // the channel used
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           cv::Mat(),	
      
        
        
        
        // no mask is used
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           hist,		
      
        
        
        
        // the resulting histogram
     
       
       
       
       
     
       
       
       
                            
      
        
        
        
        1,			
      
        
        
        
        // it is a 1D histogram
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           histSize,	
      
        
        
        
        // number of bins
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           ranges		
      
        
        
        
        // pixel value range
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           );
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        return hist;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // Computes the 1D histogram and returns an image of it.
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Mat getHistogramImage(
      
        
        
        
        const cv::Mat &image) {
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // Compute histogram first
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::MatND hist = getHistogram(image);
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // Get min and max bin values
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        double maxVal = 
      
        
        
        
        0;
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        double minVal = 
      
        
        
        
        0;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::minMaxLoc(hist, &minVal, &maxVal, 
      
        
        
        
        0, 
      
        
        
        
        0);
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // Image on which to display histogram
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::Mat histImg(histSize[
      
        
        
        
        0], histSize[
      
        
        
        
        0],
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                              CV_8U, cv::Scalar(
      
        
        
        
        255));
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // set highest point at 90% of nbins
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        int hpt = 
      
        
        
        
        static_cast<
      
        
        
        
        int>(
      
        
        
        
        0.9*histSize[
      
        
        
        
        0]);
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // Draw a vertical line for each bin
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        for (
      
        
        
        
        int h = 
      
        
        
        
        0; h < histSize[
      
        
        
        
        0]; ++h) {
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        float binVal = hist.at<
      
        
        
        
        float>(h);
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        int intensity = 
      
        
        
        
        static_cast<
      
        
        
        
        int>(binVal * hpt / maxVal);
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        // This function draws a line between 2 points
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  cv::line(histImg, cv::Point(h, histSize[
      
        
        
        
        0]),
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           cv::Point(h, histSize[
      
        
        
        
        0]-intensity),
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           cv::Scalar::all(
      
        
        
        
        0));
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              }
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        return histImg;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
         
      
        
        
        
        private:
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        int histSize[
      
        
        
        
        1];	
      
        
        
        
        // number of bins
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        float hranges[
      
        
        
        
        2];	
      
        
        
        
        // min and max pixel value
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        const 
      
        
        
        
        float* ranges[
      
        
        
        
        1];
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        int channels[
      
        
        
        
        1];	
      
        
        
        
        // only 1 channel used here
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      };

用于彩色图像

     
       
       
       
       
      
        
        
        
        // For color BGR images
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        class ColorHistogram {
     
       
       
       
       
     
       
       
       
         
      
        
        
        
        public:
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          ColorHistogram() {
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // Prepare arguments for color histogram
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              histSize[
      
        
        
        
        0] = histSize[
      
        
        
        
        1] = histSize[
      
        
        
        
        2] = 
      
        
        
        
        256;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              hranges[
      
        
        
        
        0] = 
      
        
        
        
        0.0;	
      
        
        
        
        // BGR rang
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              hranges[
      
        
        
        
        1] = 
      
        
        
        
        255.0;
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // all channels have the same range
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              ranges[
      
        
        
        
        0] = hranges;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              ranges[
      
        
        
        
        1] = hranges;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              ranges[
      
        
        
        
        2] = hranges;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              channels[
      
        
        
        
        0] = 
      
        
        
        
        0;	
      
        
        
        
        // by default, we look at channel 0
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
           
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // Computes the 3D histogram.
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::MatND getHistogram(
      
        
        
        
        const cv::Mat &image) {
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::MatND hist;
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // Compute histogram
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::calcHist(&image,
     
       
       
       
       
     
       
       
       
                            
      
        
        
        
        1,			
      
        
        
        
        // histogram from 1 image only
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           channels,	
      
        
        
        
        // the channel used
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           cv::Mat(),	
      
        
        
        
        // no mask is used
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           hist,		
      
        
        
        
        // the resulting histogram
     
       
       
       
       
     
       
       
       
                            
      
        
        
        
        3,			
      
        
        
        
        // it is a color histogram
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           histSize,	
      
        
        
        
        // number of bins
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           ranges		
      
        
        
        
        // pixel value range           
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           );
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        return hist;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // Compute the sparse color histogram.
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::SparseMat getSparseHistogram(
      
        
        
        
        const cv::Mat &image) {
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::SparseMat hist(
      
        
        
        
        3, histSize, CV_32F);
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // Compute histogram
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::calcHist(&image,	
     
       
       
       
       
     
       
       
       
                            
      
        
        
        
        1,			
      
        
        
        
        // histogram from 1 image only 
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           channels,  
      
        
        
        
        // the channel used            
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           cv::Mat(), 
      
        
        
        
        // no mask is used             
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           hist,      
      
        
        
        
        // the resulting histogram     
     
       
       
       
       
     
       
       
       
                            
      
        
        
        
        3,         
      
        
        
        
        // it is a color histogram        
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           histSize,  
      
        
        
        
        // number of bins              
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           ranges     
      
        
        
        
        // pixel value range
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                           );
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        return hist;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
           
     
       
       
       
       
     
       
       
       
         
      
        
        
        
        private:
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        int histSize[
      
        
        
        
        3];	
      
        
        
        
        // number of bins
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        float hranges[
      
        
        
        
        2];	
      
        
        
        
        // min and max pixel value
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        const 
      
        
        
        
        float* ranges[
      
        
        
        
        3];
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        int channels[
      
        
        
        
        3];	
      
        
        
        
        // 3 channel used here
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      };

原图

计算得到的直方图

直方图均衡化

在 OpenCV 中可以很方便的调用 cv::equalizeHist 来进行直方图均衡：

     
       
       
       
       
        
        
        
        
      cv::Mat equalize(
      
        
        
        
        const cv::Mat &image)
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      {
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Mat result;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::equalizeHist(image, result);
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        return result;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }

在其内部是使用了如下的查找表变换：

1	lookup.at(i)= static_cast( 255.0*p[i]);

其中 p[i] 是灰度值小于或等于 i 的像素数量。p[i] 常被称为 累积直方图（Cumulative Histogram）。

均衡化结果

均衡化后的直方图

反投影直方图

可以利用直方图来检测一幅图像中是否含有目标图像类似的内容，所使用的算法称为反投影（back projection）。在 OpenCV 中，相应的操作是 cv::calcBackProject 操作：

     
       
       
       
       
      
        
        
        
        void calcBackProject(
      
        
        
        
        const Mat* images,	
      
        
        
        
        // source arrays
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        int nimages,			
      
        
        
        
        // number of source images
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        const 
      
        
        
        
        int* channels,	
      
        
        
        
        // the list of channels 
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  InputArray hist,		
      
        
        
        
        // input histogram
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  OutputArray backProject,
      
        
        
        
        // destination back projection array 
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        const 
      
        
        
        
        float** ranges,	
      
        
        
        
        // array of arrays of the histogram
     
       
       
       
       
     
       
       
       
                                           
      
        
        
        
        // bin boundaries 
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        double scale=
      
        
        
        
        1,		
      
        
        
        
        // scale
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        bool uniform=
      
        
        
        
        true )	
      
        
        
        
        // is uniform or not

例如，检测上图中类似云朵的部分，可以先使用 ROI 截取该图像中有云朵的部分作为目标图像：

1 2	cv::Mat imageROI; imageROI= image(cv::Rect( 360, 55, 40, 50)); // Cloud region

之后提取 ROI 的直方图，用到了上面编写的 Histogram1D 类：

1 2	Histogram1D h; cv::MatND hist= h.getHistogram(imageROI);

对其做归一化处理，得到一个概率分布：

1	cv::normalize(histogram,histogram, 1.0);

然后可以对整幅图像做反投影变换，将图像中每个像素点的灰度值用归一化后的直方图的相应概率值来代替。

     
       
       
       
       
        
        
        
        
      cv::calcBackProject(&image,
     
       
       
       
       
     
       
       
       
                           
      
        
        
        
        1,	
      
        
        
        
        // one image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                          channels,	
      
        
        
        
        // the channels used
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                          histogram,	
      
        
        
        
        // the histogram we are backprojecting
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                          result,	
      
        
        
        
        // the resulting back projection image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                          ranges,	
      
        
        
        
        // the range of values, for each dimension
     
       
       
       
       
     
       
       
       
                           
      
        
        
        
        255.0		
      
        
        
        
        // a scaling factor
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      );

得到如下的概率图，其中颜色越黑的部分表示概率越大：

可以进一步使用阈值操作，将可能为云朵的像素突出出来：

1 2	cv::threshold(result, result, 255*threshold, 255, cv::THRESH_BINARY);

可以将这个算法封装成一个类 ObjectFinder 。

空间滤波

低通滤波

均值模糊

OpenCV 提供 cv::blur() 函数来对图像进行低通滤波，从而达到平滑图像的作用。

     
       
       
       
       
      
        
        
        
        void blur(InputArray src,	
      
        
        
        
        // input
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              OutputArray dst,	
      
        
        
        
        // output
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              Size ksize,		
      
        
        
        
        // size of the square kernel
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              Point anchor=Point(-
      
        
        
        
        1,-
      
        
        
        
        1),	
      
        
        
        
        // anchor point
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        int borderType=BORDER_DEFAULT )

示例：

1	cv::blur(image, result, cv:: Size( 5, 5));

均值模糊的卷积核形式如下：

     
       
       
       
       
        
        
        
        
      |-------------|
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      | 1/9 1/9 1/9 |
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      | 1/9 1/9 1/9 |
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      | 1/9 1/9 1/9 |
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      |-------------|

原图：

结果：

高斯模糊

一种加权平均的模糊算法。OpenCV 提供 cv::blur() 函数来对图像进行高斯模糊。

     
       
       
       
       
      
        
        
        
        void GaussianBlur(InputArray src,	
      
        
        
        
        // input
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      OutputArray dst,	
      
        
        
        
        // output
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      Size ksize,		
      
        
        
        
        // size of the square kernel
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        double sigmaX, 
      
        
        
        
        double sigmaY=
      
        
        
        
        0,	
      
        
        
        
        // sigma value
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        int borderType=BORDER_DEFAULT )

示例：

1	cv::GaussianBlur(image, result, cv::Size( 5, 5), 1.5);

高斯模糊的卷积核根据所选的 σ 值 sigmaX 和 sigmaY 的不同而不同。值越大，则模糊效果越明显。可以通过 cv::getGaussianKernel() 函数获取与 sigma 值对应的卷积核。

结果：

下采样

下采样的步骤是：

将 Gi 与高斯内核卷积：

1 16 ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ 1464141624164624362464162416414641 ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥

将所有偶数行和列去除。显而易见，结果图像只有原图的四分之一。

OpenCV 提供了 cv::pyrDown() 函数来完成这两步操作：

     
       
       
       
       
      
        
        
        
        void pyrDown(InputArray src,	
      
        
        
        
        // input
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  OutputArray dst,	
      
        
        
        
        // output 
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        const Size& dstsize=Size(),	
      
        
        
        
        // output size
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        int borderType=BORDER_DEFAULT )

示例：

1 2	cv::Mat reducedImage; // to contain reduced image cv::pyrDown(image,reducedImage); // reduce image size by half

下采样常被应用于缩小图像：如果要将一幅图像缩小一倍，直接隔一行或一列去掉图像的行和列是不够的——直接去掉后，解析度会降低，如果不修改图像的空间频率，就会造成空间混淆。因此，正确的做法是先进行低通滤波，去除高频分量后再进行下采样。下文将介绍的高斯金字塔就是迭代地使用下采样技术将图像逐步缩小成一个金字塔。

上采样

上采样不是下采样的逆操作，因为在下采样过程中原图的部分信息将会丢失。

类似的，还有一种上采样操作（不是下采样的逆操作！）。步骤为：

首先，将图像在每个方向扩大为原来的两倍，新增的行和列以 0 填充 (0) 。
使用指定的滤波器进行卷积，获得 “新增像素” 的近似值。

OpenCV 提供了 cv::pyrUp() 函数进行下采样操作。

     
       
       
       
       
      
        
        
        
        void pyrUp(InputArray src,	
      
        
        
        
        // input
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  OutputArray dst,	
      
        
        
        
        // output
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        const Size& dstsize=Size(),	
      
        
        
        
        // output size
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        int borderType=BORDER_DEFAULT )

上采样常和下采样一起用来创建图像金字塔。

中值滤波

OpenCV 提供 cv::medianBlur() 函数进行中值滤波：

     
       
       
       
       
      
        
        
        
        void medianBlur(InputArray src,	
      
        
        
        
        // input
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      OutputArray dst,	
      
        
        
        
        // output
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        int ksize)		
      
        
        
        
        // size of the square kernel

示例：

1	cv::medianBlue(image, result, 5);

中值滤波并不是一个线性滤波，因此它并不能用一个核矩阵来表示。然而，它也是通过相邻像素来决定每一个像素的值的：一个像素的值，等于其相邻像素的值的中值。中值滤波的一个典型应用是滤除椒盐噪声：

原图：

结果：

中值滤波还有用一个优点：可以保留图像边缘的锐利程度。然而，它会影响图像的材质等细节特征。

高通滤波

高通滤波常用来提取图像中变化比较明显的地方，例如图像边缘。

Sobel 滤波

Sobel 滤波是一种方向滤波器，它只影响竖直方向或水平方向的图像频率。该方向取决于卷积核的形状。OpenCV 提供了 cv::Sobel()函数来进行 Sobel 滤波：

     
       
       
       
       
      
        
        
        
        void Sobel(InputArray src,	
      
        
        
        
        // input
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  OutputArray dst,	
      
        
        
        
        // output
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        int ddepth,		
      
        
        
        
        // image type
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        int dx, 
      
        
        
        
        int dy,	
      
        
        
        
        // kernell specification
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        int ksize=
      
        
        
        
        3,		
      
        
        
        
        // size of the square kernel
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        double scale=
      
        
        
        
        1,	
      
        
        
        
        // scale
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        double delta=
      
        
        
        
        0,	
      
        
        
        
        // offset
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        int borderType=BORDER_DEFAULT )

构造一个竖直方向的 Sobel 滤波器示例：

1	cv::Sobel(image,sobelY,CV_8U, 0, 1, 3, 0.4, 128);

构造一个水平方向的 Sobel 滤波器示例：

1	cv::Sobel(image,sobelX,CV_8U, 1, 0, 3, 0.4, 128);

注意上面两个用例都是使用 CV_8U 这种图像类型。在这种情况下，0 值对应的像素灰度值将为 128 ，负值对应的像素将用暗一些的颜色，而正值对应的像素将用亮一些的颜色。最终的效果就如一些照片处理软件的“浮雕”特效一样：

竖直 Sobel 滤波器的结果：

水平 Sobel 滤波器的结果：

两种形式的卷积如下：

由于 Sobel 滤波器的核包含正值和负值，因此更常用的图像类型是使用16位符号整型(CV_16S)。下面将用这种类型来提取图像边缘。

边缘提取

计算 Sobel 算子的 L1 范数：

     
       
       
       
       
      
        
        
        
        // Compute norm of Sobel
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::sobel(image, sobelX, CV_16S, 
      
        
        
        
        1, 
      
        
        
        
        0);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::sobel(image, sobelY, CV_16s, 
      
        
        
        
        0, 
      
        
        
        
        1);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Mat sobel;
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // Compute the L1 norm
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      sobel = 
      
        
        
        
        abs(sobelX) + 
      
        
        
        
        abs(sobelY);

使用 convertTo() 方法将得到的 L1 范数转换成一幅图像，0 值对应的像素点为白色，而更高的值对应的像素点将用更暗的颜色表示：

     
       
       
       
       
      
        
        
        
        // Find sobel max value
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        double sobmin, sobmax;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::minMaxLoc(sobel, &sobmin, &sobmax);
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // Conversion to 8-bit image
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // sobelImage = -alpha*sobel + 255
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Mat sobelImage;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      sobel.convertTo(sobelImage, CV_8U, -
      
        
        
        
        255./sobmax, 
      
        
        
        
        255);

得到如下的结果：

对其再进一步做阈值处理，得到一幅线条清晰的二值图像：

1 2	cv::threshold(sobelImage, sobelThresholded, threshold, 255, cv::THRESH_BINARY);

原理

从数学上讲，sobel 滤波器计算的是图像的梯度信息，即：

\nabla f \equiv grad (f) \equiv [g x g y] = ⎡ ⎣ \partial f \partial x \partial f \partial y ⎤ ⎦

由于梯度是一个二维向量，因此它有范数和方向。梯度的范数可以用来表示变化的幅度，通常使用欧几里得范数（称为 L2 范数 ）来求解：

| grad (f) | = (\partial f \partial x) 2 + (\partial f \partial y) 2 - - - - - - - - - - - - - - - \sqrt

然而，在图像处理中，我们通常只需要计算两个方向的一阶导数的绝对值的和，即 L1 范数 ，这个值与 L2 范数非常接近，但运算量要小很多：

| grad (f) | \approx ∣ ∣ ∣ \partial f \partial x ∣ ∣ ∣ + ∣ ∣ ∣ \partial f \partial y ∣ ∣ ∣

梯度向量总是指向图像中最陡峭的变化方向，这意味着在图像中，梯度方向将与图像中的边缘垂直，并且从暗的部分指向亮的部分。梯度方向可以通过下面的公式得到：

∠ grad (f) = α t a n (- \partial f \partial y / \partial f \partial x)

OpenCV 提供了 cv::cartToPolar() 函数来获取梯度方向：

     
       
       
       
       
      
        
        
        
        // Sobel must be computed in floating points
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Sobel(image,sobelX,CV_32F,
      
        
        
        
        1,
      
        
        
        
        0);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Sobel(image,sobelY,CV_32F,
      
        
        
        
        0,
      
        
        
        
        1);
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // Compute the L2 norm and direction of the gradient
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Mat norm, dir;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::cartToPolar(sobelX,sobelY,norm,dir);

默认情况下，得到的方向是用辐度角来表示的，通过再添加一个参数 true 可以得到几何角。

拉普拉斯变换

拉普拉斯滤波器是另一个高通线性滤波器。OpenCV 提供了 cv::Laplacian() 函数来计算图像的拉普拉斯变换。

     
       
       
       
       
      
        
        
        
        void Laplacian(InputArray src,	
      
        
        
        
        // input
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  OutputArray dst,		
      
        
        
        
        // output
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        int ddepth,			
      
        
        
        
        // image type
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        int ksize=
      
        
        
        
        1,			
      
        
        
        
        // size of the square kernel
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        double scale=
      
        
        
        
        1,		
      
        
        
        
        // scale
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        double delta=
      
        
        
        
        0,		
      
        
        
        
        // offset
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        int borderType=BORDER_DEFAULT )

一个封装好的拉普拉斯变换类 LaplacianZC 如下：

     
       
       
       
       
      
        
        
        
        class LaplacianZC {
     
       
       
       
       
     
       
       
       
         
      
        
        
        
        private:
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // orignal image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Mat img;
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // 32-bit float image containing the Laplacian
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Mat laplace;
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // Aperture size of the laplacian kernel
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        int aperture;
     
       
       
       
       
     
       
       
       
         
      
        
        
        
        public:
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          LaplacianZC() : aperture(
      
        
        
        
        3) {}
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // Set the aperture size of the kernel
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        void setAperture(
      
        
        
        
        int a) {
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              aperture = a;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // Compute the floating point Laplacian
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Mat computeLaplacian(
      
        
        
        
        const cv::Mat &image) {
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // Compute Laplacian
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::Laplacian(image, laplace, CV_32F, aperture);
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // Keep local copy of the image
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // (used for zero-crossings)
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              img = image.clone();
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        return laplace;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // Get the Laplacian result in 8-bit image
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // zero corresponds to gray level 128
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // if no scale is provided, then the max value will be
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // scaled to intensity 255
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // You must call computeLaplacian before calling this
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Mat getLaplacianImage(
      
        
        
        
        double scale=-
      
        
        
        
        1.0) {
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        if (scale<
      
        
        
        
        0){
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        double lapmin, lapmax;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  cv::minMaxLoc(laplace, &lapmin, &lapmax);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  scale = 
      
        
        
        
        127 / std::max(-lapmin, lapmax);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              }
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::Mat laplaceImage;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              laplace.convertTo(laplaceImage, CV_8U, scale, 
      
        
        
        
        128);
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        return laplaceImage;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      };

使用示例：

     
       
       
       
       
      
        
        
        
        // Compute Laplacian using LaplacianZC class
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      LaplacianZC laplacian;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      laplacian.setAperture(
      
        
        
        
        7);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Mat flap = laplacian.computeLaplacian(image);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      laplace = laplacian.getLaplacianImage();

结果：

拉普拉斯变换同样可以用来提取边缘：

边缘提取

图像的经过拉普拉斯变换后，可以利用结果的 zero-crossings 提取边缘：

遍历 Laplacian 结果图像，比对当前像素点和其左邻的像素点；
如果两个像素点灰度值差值大于一个阈值，且正负号不同，则当前像素点为一个 zero-crossing 点；
否则，对下一个像素重复同样的测试。

     
       
       
       
       
      
        
        
        
        // Get a binary image of the zero-crossings
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // if the product of the two adjascent pixels is
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // less than threshold then this zero-crossing
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // will be ignored
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Mat getZeroCrossings(
      
        
        
        
        float threshold=
      
        
        
        
        1.0) {
     
       
       
       
       
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // Create the iterators
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Mat_<
      
        
        
        
        float>::const_iterator it=
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              laplace.begin<
      
        
        
        
        float>()+laplace.step1();
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Mat_<
      
        
        
        
        float>::const_iterator itend=
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              laplace.end<
      
        
        
        
        float>();
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Mat_<
      
        
        
        
        float>::const_iterator itup=
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              laplace.begin<
      
        
        
        
        float>();
     
       
       
       
       
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // Binary image initialize to white
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Mat binary(laplace.size(),CV_8U,cv::Scalar(
      
        
        
        
        255));
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Mat_::iterator itout=
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              binary.begin()+binary.step1();
     
       
       
       
       
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // negate the input threshold value
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          threshold *= -
      
        
        
        
        1.0;
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        for ( ; it!= itend; ++it, ++itup, ++itout) {
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // if the product of two adjascent pixel is
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // negative then there is a sign change
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        if (*it * *(it-
      
        
        
        
        1) < threshold)
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  *itout= 
      
        
        
        
        0; 
      
        
        
        
        // horizontal zero-crossing
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        else 
      
        
        
        
        if (*it * *itup < threshold)
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  *itout= 
      
        
        
        
        0; 
      
        
        
        
        // vertical zero-crossing
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        return binary;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }

拉普拉斯变换可以提取出丰富的边缘信息，但不足在于也对噪声很敏感。

原理

拉普拉斯变换定义为 x 、 y 两个方向的二阶导数的和：

l a p l a c e (I) = \partial 2 I \partial x 2 + \partial 2 I \partial y 2

它最简单的形式是用如下的 3x3 卷积核逼近的矩阵：

图像卷积

OpenCV 提供了 cv::filter2D 函数来进行图像卷积。使用它前只需先构造一个卷积核。

     
       
       
       
       
      
        
        
        
        void filter2D(InputArray src,	
      
        
        
        
        // input
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  OutputArray dst,	
      
        
        
        
        // output
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        int ddepth,		
      
        
        
        
        // image type
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  InputArray kernel,  
      
        
        
        
        // input kernel
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  Point anchor=Point(-
      
        
        
        
        1,-
      
        
        
        
        1),	
      
        
        
        
        // anchor point
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        double delta=
      
        
        
        
        0,	
      
        
        
        
        // offset
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        int borderType=BORDER_DEFAULT )

例如，用源图像减去拉普拉斯滤波结果可以增强图像细节，相应的卷积核形式为：

实现如下：

     
       
       
       
       
      
        
        
        
        void sharpen2D(
      
        
        
        
        const cv::Mat &image, cv::Mat &result) {
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // Construct kernel (all entries initialized to 0)
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Mat kernel(
      
        
        
        
        3, 
      
        
        
        
        3, CV_32F, cv::Scalar(
      
        
        
        
        0));
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // assigns kernel values
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          kernel.at<
      
        
        
        
        float>(
      
        
        
        
        1,
      
        
        
        
        1) = 
      
        
        
        
        5.0;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          kernel.at<
      
        
        
        
        float>(
      
        
        
        
        0,
      
        
        
        
        1) = -
      
        
        
        
        1.0;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          kernel.at<
      
        
        
        
        float>(
      
        
        
        
        2,
      
        
        
        
        1) = -
      
        
        
        
        1.0;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          kernel.at<
      
        
        
        
        float>(
      
        
        
        
        1,
      
        
        
        
        0) = -
      
        
        
        
        1.0;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          kernel.at<
      
        
        
        
        float>(
      
        
        
        
        1,
      
        
        
        
        2) = -
      
        
        
        
        1.0;
     
       
       
       
       
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        //filter the image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::filter2D(image, result, image.depth(), kernel);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }

图像金字塔

一个图像金字塔是一系列图像的集合：

所有图像来源于同一张原始图像；
通过梯次向下采样获得，直到达到某个终止条件才停止采样。

有两种类型的图像金字塔常常出现在文献和应用中：

高斯金字塔(Gaussian pyramid): 基于下采样；
拉普拉斯金字塔(Laplacian pyramid): 用来从金字塔低层图像重建上层未采样图像。

高斯金字塔

高斯金字塔为一层一层的图像，层级越高，图像越小。如下图所示，每一层都按从下到上的次序编号，层级 (i+1) (表示为 Gi+1 尺寸小于层级 i(Gi) )。

前面已经了解到，缩小图像可以使用下采样技术。而高斯金字塔就是基于下采样实现的：通过对输入图像 G0 (原始图像) 下采样多次就会得到整个金字塔。

OpenCV 提供了一个函数 cv::buildPyramid() 用来从一幅图像创建高斯金字塔：

     
       
       
       
       
      
        
        
        
        void buildPyramid(InputArray src,			
      
        
        
        
        // source image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      OutputArrayOfArrays dst,	
      
        
        
        
        // destination vector of maxlevel+1 images 
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        int maxlevel,				
      
        
        
        
        // max level
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        int borderType=BORDER_DEFAULT )

示例：

     
       
       
       
       
      
        
        
        
        // Read input image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Mat img = cv::imread(
      
        
        
        
        "./lena.png");
     
       
       
       
       
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        if (!img.data) {
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          perror(
      
        
        
        
        "Open file failed!");
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        return 
      
        
        
        
        1;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }
     
       
       
       
       
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // build gaussian pyramid
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        vector gPyramid;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::buildPyramid(img, gPyramid, 
      
        
        
        
        4);
     
       
       
       
       
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // Show the result
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        vector::iterator it = gPyramid.begin();
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        vector::iterator itend = gPyramid.end();
     
       
       
       
       
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        int i = 
      
        
        
        
        0;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        stringstream title;
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        for(; it < itend; ++it){
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          title << 
      
        
        
        
        "Gaussian Pyramid " << i;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::namedWindow(title.str());
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::imshow(title.str(), *it);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          ++i;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }

结果：

拉普拉斯金字塔

下采样是一个丢失信息的函数。为了恢复原来（更高分辨率）的图像，我们需要获得下采样操作中丢失的信息，这些信息可以通过上采样来预测。这些数据形成了拉普拉斯金字塔（又叫做预测残差金字塔）。下面是拉普拉斯金字塔的第 i 层的数学定义：

L i = G i - U P (G i + 1) ⨂ ς n \times n

这里的 Gi 和 Gi+1 分别代表第 i 层和第 i+1 层的高斯金字塔图像； UP() 操作将原始图像中位置为 (x, y) 的像素映射到目标图像的 (2x+1, 2y+1) 位置；符号 ⨂ 代表卷积操作， ς 是 n×n 的高斯核。OpenCV 提供的函数 cv::pyrUp() 实现的功能就如 UP(Gi+1)⨂ςn×n 所定义。因此，我们可以使用 OpenCV 直接进行拉普拉斯运算：

L i = G i - P y r U p (G i + 1)

OpenCV 没有提供直接生成拉普拉斯金字塔的函数，但自己实现一个也很容易：

     
       
       
       
       
      
        
        
        
        /** 
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * buildLaplacianPyramid	-	build a laplacian pyramid from an image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       *
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * @param src	-	source image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * @param dst 	-	destination vector of maxlevel+1 image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * @param maxlevel	-	max level
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       */
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        void buildLaplacianPyramid(
      
        
        
        
        const cv::Mat &src, std::
      
        
        
        
        vector &dst, 
      
        
        
        
        const 
      
        
        
        
        int maxlevel)
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      {
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        if (maxlevel < 
      
        
        
        
        2)
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        return;
     
       
       
       
       
     
       
       
       
           
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // build gaussian pyramid
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          std::
      
        
        
        
        vector gPyramid;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::buildPyramid(src, gPyramid, maxlevel);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          std::
      
        
        
        
        vector::const_iterator it = gPyramid.begin();
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          std::
      
        
        
        
        vector::const_iterator itend = gPyramid.end();
     
       
       
       
       
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // build laplacian pyramid
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Mat upsample, current;
     
       
       
       
       
     
       
       
       
           
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        while (it < itend - 
      
        
        
        
        1) {
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              current = (*it++).clone();	
      
        
        
        
        // current level
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::pyrUp(*it, upsample);	
      
        
        
        
        // upsampling upper level
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              dst.push_back(current - upsample);	
      
        
        
        
        // subtract the two
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // top level
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          dst.push_back(*it);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }
     
       
       
       
       
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        /** 
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * buildLaplacianPyramid	-	build a laplacian pyramid from a vector of images
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       *
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * @param src	-	vector of source images
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * @param dst 	-	destination vector of vectors of maxlevel+1 image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       * @param maxlevel	-	max level
     
       
       
       
       
     
       
       
       
       
        
        
        
        
       */
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        void buildLaplacianPyramid(
      
        
        
        
        const std::
      
        
        
        
        vector &src, std::
      
        
        
        
        vector<std::vector > &dst, 
      
        
        
        
        const 
      
        
        
        
        int maxlevel)
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      {
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          std::
      
        
        
        
        vector::const_iterator it = src.begin();
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          std::
      
        
        
        
        vector::const_iterator itend = src.end();
     
       
       
       
       
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          std::
      
        
        
        
        vector lPyramid;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          buildLaplacianPyramid(*it, lPyramid, maxlevel);
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        for (; it < itend; ++it) {
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              dst.push_back(lPyramid);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }

以上两个重载函数分别根据一张图片或一系列图片生成拉普拉斯金字塔。金字塔的最顶层是一张低分辨率近似。

示例：

     
       
       
       
       
      
        
        
        
        // Read input image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Mat img = cv::imread(
      
        
        
        
        "./lena.png");
     
       
       
       
       
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        if (!img.data) {
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          perror(
      
        
        
        
        "Open file failed!");
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        return 
      
        
        
        
        1;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }
     
       
       
       
       
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // build laplacian pyramid
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        vector lPyramid;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      buildLaplacianPyramid(img, lPyramid, 
      
        
        
        
        4);
     
       
       
       
       
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // Show the result
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        vector::iterator it = lPyramid.begin();
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        vector::iterator itend = lPyramid.end();
     
       
       
       
       
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        int i = 
      
        
        
        
        0;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        stringstream title;
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        for(; it < itend; ++it){
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          title << 
      
        
        
        
        "Laplacian Pyramid " << i;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::namedWindow(title.str());
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::imshow(title.str(), *it);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          ++i;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }

结果：

图像分割

分水岭

OpenCV 提供了 cv::watershed() 函数来实现分水岭操作。

1	void watershed(InputArray image, InputOutputArray markers)

一个封装好的 WatershedSegmenter 类如下：

     
       
       
       
       
      
        
        
        
        class WatershedSegmenter {
     
       
       
       
       
     
       
       
       
         
      
        
        
        
        private:
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Mat markers;
     
       
       
       
       
     
       
       
       
         
      
        
        
        
        public:
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        void setMarkers(
      
        
        
        
        const cv::Mat& markerImage) {
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // Convert to image of ints
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              markerImage.convertTo(markers,CV_32S);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Mat process(
      
        
        
        
        const cv::Mat &image) {
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // Apply watershed
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::watershed(image,markers);
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        return markers;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }

应用该类的步骤是：

构造一个 marker 图像（可以通过对源图像进行标记和处理）；
调用 WatershedSegmenter::setMarkters() 函数设置 marker；
调用 WatershedSegmenter::process() 函数进行分水岭处理。

GrabCut

OpenCV 提供了 cv::grabCut() 函数来实现 GrabCut 操作。

1 2	void grabCut(InputArray img, InputOutputArray mask, Rect rect, InputOutputArray bgdModel, In- putOutputArray fgdModel, int iterCount, int mode=GC_EVAL )

使用 cv::grabCut() 函数非常简单，你只需要输入一张图像，标记一些像素点属于前景图或背景图。然后该算法就会根据这些标记点分割出整幅图像前景和背景。

一种标记的方法就是直接将一部分前景的区域用矩形框起来：

     
       
       
       
       
      
        
        
        
        // Open image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      image= cv::imread(
      
        
        
        
        "../group.jpg");
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // define bounding rectangle
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // the pixels outside this rectangle
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // will be labeled as background
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Rect rectangle(
      
        
        
        
        10,
      
        
        
        
        100,
      
        
        
        
        380,
      
        
        
        
        180);

之后可以调用 cv::grabCut() 函数：

     
       
       
       
       
        
        
        
        
      cv::Mat result;	
      
        
        
        
        // segemtation (4 possible values)
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Mat bgModel, fgModel;	
      
        
        
        
        // the models (internally used)
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // GrabCut segmentation
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::grabCut(image,	
      
        
        
        
        // input image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  result,	
      
        
        
        
        // segmentation result
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  rectangle,  
      
        
        
        
        // rectangle contain foreground
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  bgModel, fgModel,  
      
        
        
        
        // models
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        5,		
      
        
        
        
        // number of iterations
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  cv::GC_INIT_WITH_RECT	
      
        
        
        
        // use rectangle
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  );

得到的结果 result 将包含下面四种常量值：

cv::GC_BGD - 所有确定属于背景的像素（实际值为 0）；
cv::GC_FGD - 所有确定属于前景的像素（实际值为 1）；
cv::GC_PR_BGD - 所有可能属于背景的像素（实际值为 2）；
cv::GC_PR_FGD - 所有可能属于前景的像素（实际值为 3）。

我们可以将所有可能是前景的像素提取出来：

     
       
       
       
       
      
        
        
        
        // Get the pixels marked as likely foreground
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::compare(result, cv::GC_PR_FGD, result, cv::CMP_EQ);
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // Generate output image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Mat foreground(image.size(), CV_8UC3,
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      cv::Scalar(
      
        
        
        
        255, 
      
        
        
        
        255, 
      
        
        
        
        255));
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      image.copyTo(foreground,	
      
        
        
        
        // bg pixels are not copied
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  result);

上面得到的 foreground 图像即是应用 GrabCut 算法分割出的前景图像。

由于 cv::GC_FGD 和 cv::PR_FGD 的实际值为 1 和 3，上面的 cv::compare() 操作也可以简单的写成：

1	result = result & 1;

形状检测

轮廓

Canny 算法是一个有效的轮廓提取方法。OpenCV 提供了 cv::Canny() 函数：

     
       
       
       
       
      
        
        
        
        void Canny(InputArray image,	
      
        
        
        
        // input
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              OutputArray edges,	
      
        
        
        
        // output
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        double threshold1,	
      
        
        
        
        // low threshold
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        double threshold2,	
      
        
        
        
        // high threshold
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        int apertureSize=
      
        
        
        
        3,	
      
        
        
        
        // aperture size for Sobel operator
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        bool L2gradient=
      
        
        
        
        false ) 
      
        
        
        
        // whether to use L2 norm

例如：

     
       
       
       
       
      
        
        
        
        // Apply Canny algorithm
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Mat contours;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Canny(image,	
      
        
        
        
        // gray-level image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              contours,	
      
        
        
        
        // output contours
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        125,		
      
        
        
        
        // low threshold
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        350);		
      
        
        
        
        // high threshold

原图：

结果：

直线

Hough 变换是经典的提取直线的方法。OpenCV 提供了两个版本的 Hough 变换：

HoughLines

基本的版本是 cv::HoughLines() 函数：

     
       
       
       
       
      
        
        
        
        void HoughLines(InputArray image,	
      
        
        
        
        // 8-bit, single-channel binary source image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      OutputArray lines,  
      
        
        
        
        // output vector of lines
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        double rho,		
      
        
        
        
        // distance resolution of the accumulator in pixels
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        double theta,		
      
        
        
        
        // angle resolution of the accumulator in radians
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        int threshold,	
      
        
        
        
        // accumulator threshold parameter                    
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        double srn=
      
        
        
        
        0,		
      
        
        
        
        // a divisor for rho
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        double stn=
      
        
        
        
        0 )	
      
        
        
        
        // a divisor for theta

参数 rho 和 theta 决定了直线查找的步长。

示例：

     
       
       
       
       
      
        
        
        
        // Apply Canny algorithm
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Mat contours;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Canny(image, contours, 
      
        
        
        
        125, 
      
        
        
        
        350);
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // Hough transform for line detection
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        vector lines;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::HoughLines(test, lines,
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        1, PI/
      
        
        
        
        180,	
      
        
        
        
        // step size
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        80);			
      
        
        
        
        // minimum number of votes
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // Draw the detected lines
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        vector::const_iterator it= lines.begin();
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        while (it!=lines.end()) {
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        float rho= (*it)[
      
        
        
        
        0];
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // first element is distance rho
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        float theta= (*it)[
      
        
        
        
        1]; 
      
        
        
        
        // second element is angle theta
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        if (theta < PI/
      
        
        
        
        4. || theta > 
      
        
        
        
        3.*PI/
      
        
        
        
        4.) { 
      
        
        
        
        // ~vertical line
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // point of intersection of the line with first row
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::Point pt1(rho/
      
        
        
        
        cos(theta),
      
        
        
        
        0);
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // point of intersection of the line with last row
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::Point pt2((rho-result.rows*
      
        
        
        
        sin(theta))/
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        cos(theta),result.rows);
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // draw a white line
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::line( image, pt1, pt2, cv::Scalar(
      
        
        
        
        255), 
      
        
        
        
        1);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          } 
      
        
        
        
        else { 
      
        
        
        
        // ~horizontal line
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // point of intersection of the
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // line with first column
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::Point pt1(
      
        
        
        
        0,rho/
      
        
        
        
        sin(theta));
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // point of intersection of the line with last column
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::Point pt2(result.cols,
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  (rho-result.cols*
      
        
        
        
        cos(theta))/
      
        
        
        
        sin(theta));
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        // draw a white line
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::line(image, pt1, pt2, cv::Scalar(
      
        
        
        
        255), 
      
        
        
        
        1);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          }
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          ++it;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }

结果：

HoughLinesP

另一个是 cv::HoughLinesP() 函数，提供了 Probabilistic Hough 变换操作，与前者的不同是对直线的可能性进行了估计，以防止对一些因巧合出现的像素对齐的情况的误判：

     
       
       
       
       
      
        
        
        
        void HoughLinesP(InputArray image,	
      
        
        
        
        // 8-bit, single-channel binary source image	  
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      OutputArray lines,	
      
        
        
        
        // output vector of lines						  
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        double rho,			
      
        
        
        
        // distance resolution of the accumulator in pixel
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        double theta,			
      
        
        
        
        // angle resolution of the accumulator in radians
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        int threshold,		
      
        
        
        
        // accumulator threshold parameter
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        double minLineLength=
      
        
        
        
        0, 
      
        
        
        
        // minimum line length
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        double maxLineGap=
      
        
        
        
        0 )	
      
        
        
        
        // maximum allowed gap

可以将它封装成一个类 LineFinder 。

示例：

     
       
       
       
       
      
        
        
        
        // Create LineFinder instance
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      LineFinder finder;
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // Set probabilistic Hough parameters
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      finder.setLineLengthAndGap(
      
        
        
        
        100,
      
        
        
        
        20);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      finder.setMinVote(
      
        
        
        
        80);
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // Detect lines and draw them
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        vector lines= finder.findLines(contours);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      finder.drawDetectedLines(image);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::namedWindow(
      
        
        
        
        "Detected Lines with HoughP");
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::imshow(
      
        
        
        
        "Detected Lines with HoughP",image);

圆

Hough 变换也可以用来检测圆。OpenCV 提供了 cv::HoughCircles() 实现这一操作：

     
       
       
       
       
      
        
        
        
        void HoughCircles(InputArray image,	
      
        
        
        
        // 8-bit, single-channel, grayscale input image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      OutputArray circles,	
      
        
        
        
        // output vector of found circles
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        int method,			
      
        
        
        
        // detection method to use.
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        double dp,			
      
        
        
        
        // accumulator resolution (size of the image / 2)
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        double minDist,		
      
        
        
        
        // minimum distance between two circles
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        double param1=
      
        
        
        
        100,	
      
        
        
        
        // Canny high threshold
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        double param2=
      
        
        
        
        100,	
      
        
        
        
        // second method-specific parameter
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        int minRadius=
      
        
        
        
        0,		
      
        
        
        
        // minimum circle radius
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        int maxRadius=
      
        
        
        
        0 )		
      
        
        
        
        // minimum number of votes

其中，method 参数目前只有一个可选值 CV_HOUGH_GRADIENT。

在进行该变换前，总是建议先进行一次高斯模糊，以降低图像噪声，提高识别率。示例：

     
       
       
       
       
      
        
        
        
        // Smooth the image to reduce noise
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::GaussianBlur(image,image,cv::Size(
      
        
        
        
        5,
      
        
        
        
        5),
      
        
        
        
        1.5);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        vector circles;
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // Detect circles
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::HoughCircles(image, circles, CV_HOUGH_GRADIENT,
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        2,	
      
        
        
        
        // accumulator resolution (size of the image / 2)
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        50, 
      
        
        
        
        // minimum distance between two circles
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        200, 
      
        
        
        
        // Canny high threshold
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        100, 
      
        
        
        
        // minimum number of votes
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        25, 
      
        
        
        
        100); 
      
        
        
        
        // min and max radius
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // Draw the circles
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        vector::const_iterator itc= circles.begin();
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        while (itc!=circles.end()) {
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::circle(image,
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::Point((*itc)[
      
        
        
        
        0],
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              (*itc)[
      
        
        
        
        1]),	
      
        
        
        
        // circle centre
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              (*itc)[
      
        
        
        
        2],	
      
        
        
        
        // circle radius
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              cv::Scalar(
      
        
        
        
        255),
      
        
        
        
        // color
     
       
       
       
       
     
       
       
       
               
      
        
        
        
        2);			
      
        
        
        
        // thickness
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          ++itc;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }

结果：

形状拟合

直线

OpenCV 提供了 cv::fitLine() 函数以根据一些点的集合拟合直线：

     
       
       
       
       
      
        
        
        
        void fitLine(InputArray points,	
      
        
        
        
        // input vector of 2D or 3D points
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  OutputArray line,		
      
        
        
        
        // output vector of lines
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        int distType,			
      
        
        
        
        // distance type
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        double param,			
      
        
        
        
        // numerical parameter some types of distances
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        double reps,			
      
        
        
        
        // sufficient accuracy for the radius
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        double aeps)			
      
        
        
        
        // sufficient accuracy for the angle

示例：

     
       
       
       
       
        
        
        
        
      cv::Vec4f line;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::fitLine(cv::Mat(points),line,
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  CV_DIST_L2, 
      
        
        
        
        // distance type
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        0,
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        // not used with L2 distance
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        0.01,
      
        
        
        
        0.01); 
      
        
        
        
        // accuracy

椭圆

OpenCV 提供了 cv::fitEllipse() 函数以根据一些点的集合拟合椭圆：

1	RotatedRect fitEllipse(InputArray points)

该操作返回一个经旋转的矩形，以表示一个椭圆的大小、形状和旋转角度。示例：

1 2	cv::RotatedRect rrect= cv::fitEllipse(cv::Mat(points)); cv::ellipse(image,rrect,cv::Scalar( 0));

形状特征

轮廓

OpenCV 提供了 cv::findContours() 函数以提取一幅图像中的闭合轮廓：

     
       
       
       
       
      
        
        
        
        void findContours(InputOutputArray image,	
      
        
        
        
        // source, an 8-bit single-channel image.
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      OutputArrayOfArrays contours, 
      
        
        
        
        // detected contours
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      OutputArray hierarchy,	
      
        
        
        
        // optional output vector
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        int mode,					
      
        
        
        
        // contour retrieval mode
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        int method,				
      
        
        
        
        // contour approximation method 
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      Point offset=Point())		
      
        
        
        
        // point offset

示例（只提取外部轮廓，不考虑内部轮廓）：

     
       
       
       
       
      
        
        
        
        // Find contours
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        vector<std::vector> contours;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::findContours(image,
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      contours, 
      
        
        
        
        // a vector of contours
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      CV_RETR_EXTERNAL, 
      
        
        
        
        // retrieve the external contours
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      CV_CHAIN_APPROX_NONE); 
      
        
        
        
        // all pixels of each contours
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // Draw black contours on a white image
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Mat result(image.size(),CV_8U,cv::Scalar(
      
        
        
        
        255));
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::drawContours(result,contours,
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      -
      
        
        
        
        1, 
      
        
        
        
        // draw all contours
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      cv::Scalar(
      
        
        
        
        0), 
      
        
        
        
        // in black
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        2); 
      
        
        
        
        // with a thickness of 2

如果要同时查找内部轮廓，可以把 cv::findContours() 的第 3 个参数改为 CV_RETR_LIST 。如果要在查找内外所有的轮廓的同时保存轮廓的层次，可以改为 CV_RETR_TREE 。CV_RETRC_COMP 也可以得到层次，但只分成外轮廓和内轮廓两层。

边界框（bounding box）

获取一个形状的 bounding box：

     
       
       
       
       
      
        
        
        
        // testing the bounding box
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Rect r0= cv::boundingRect(cv::Mat(contours[
      
        
        
        
        0]));
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::rectangle(result,r0,cv::Scalar(
      
        
        
        
        0),
      
        
        
        
        2);

最小外接圆

     
       
       
       
       
      
        
        
        
        // testing the enclosing circle
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        float radius;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::Point2f center;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::minEnclosingCircle(cv::Mat(contours[
      
        
        
        
        1]),center,radius);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::circle(result,cv::Point(center),
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        static_cast<
      
        
        
        
        int>(radius),cv::Scalar(
      
        
        
        
        0),
      
        
        
        
        2);

最小外接多边形

     
       
       
       
       
      
        
        
        
        // testing the approximate polygon
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        vector poly;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::approxPolyDP(cv::Mat(contours[
      
        
        
        
        2]),
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                      poly,
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        5,	
      
        
        
        
        // accuracy of the approximation
     
       
       
       
       
     
       
       
       
                       
      
        
        
        
        true); 
      
        
        
        
        // yes it is a closed shape
     
       
       
       
       
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // Iterate over each segment and draw it
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        vector::const_iterator itp= poly.begin();
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        while (itp!=(poly.end()-
      
        
        
        
        1)) {
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::line(result,*itp,*(itp+
      
        
        
        
        1),cv::Scalar(
      
        
        
        
        0),
      
        
        
        
        2);
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          ++itp;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // last point linked to first point
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::line(result,
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              *(poly.begin()),
     
       
       
       
       
     
       
       
       
       
        
        
        
        
              *(poly.end()-
      
        
        
        
        1),cv::Scalar(
      
        
        
        
        20),
      
        
        
        
        2);

凸包

     
       
       
       
       
      
        
        
        
        // testing the convex hull
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      std::
      
        
        
        
        vector hull;
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      cv::convexHull(cv::Mat(contours[
      
        
        
        
        3]),hull);

矩（moments）

     
       
       
       
       
      
        
        
        
        // testing the moments
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        // iterate over all contours
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      itc= contours.begin();
     
       
       
       
       
     
       
       
       
       
      
        
        
        
        while (itc!=contours.end()) {
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // compute all moments
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::Moments mom= cv::moments(cv::Mat(*itc++));
     
       
       
       
       
     
       
       
       
           
      
        
        
        
        // draw mass center
     
       
       
       
       
     
       
       
       
       
        
        
        
        
          cv::circle(result,	
      
        
        
        
        // position of mass center converted to integer
     
       
       
       
       
     
       
       
       
       
        
        
        
        
                  cv::Point(mom.m10/mom.m00,mom.m01/mom.m00),
     
       
       
       
       
     
       
       
       
                   
      
        
        
        
        2,cv::Scalar(
      
        
        
        
        0),
      
        
        
        
        2); 
      
        
        
        
        // draw black dot
     
       
       
       
       
     
       
       
       
       
        
        
        
        
      }

上面几步的结果：

你可能感兴趣的:(杂文,计算机视觉,图片,图像处理,processing)

Tomcat 8 安装包下载 m0_74824517 面试学习路线阿里巴巴 tomcat java
Tomcat8安装包下载【下载地址】Tomcat8安装包下载本仓库提供了一个包含Windows和Linux版本的Tomcat8安装包，方便用户快速下载并部署Tomcat8服务器[这里是图片001]项目地址:https://gitcode.com/open-source-toolkit/fda7c简介本仓库提供了一个包含Windows和Linux版本的Tomcat8安装包，方便用户快速下载并部署To
vue中使用ueditor上传到服务器_vue+Ueditor集成 [前后端分离项目][图片、文件上传][富文本编辑]... 小西超人
写在最前面的话：鉴于近期很多的博友讨论，说我按照文章的一步一步来，弄好之后，怎么会提示后端配置项http错误，文件上传会提示上传错误。这里提别申明一点，ueditor在前端配置好后，需要与后端部分配合进行，后端部分的项目代码git地址：https://github.com/coderliguoqing/UeditorSpringboot，然后将配置ueditor.config.js里的server
国产编辑器EverEdit - 独门暗器：自动监视剪贴板内容编辑器爱好者妙用编辑器编辑器 EverEdit EmEditor Notepad
1监视剪贴板1.1应用场景如果需要对剪贴板的所有历史进行记录，并进行分析和回顾，则可以使用监视剪贴板功能，不仅在EverEdit中的复制会记录，在其他应用的复制也会记录。1.2使用方法新建一个空文档(重要：防止扰乱正常文件)，单击主菜单文档->监视剪贴板即可。该功能打开后，当前系统所有的复制内容，都会追加到用户指定的文档中。说明：监视剪贴板只会监控文本内容，图片、文档等非文本信息，不会追加
Vision Transformer（ViT）：用 Transformer 颠覆图像识别金外飞176 论文精读 transformer 深度学习人工智能
VisionTransformer（ViT）：用Transformer颠覆图像识别在计算机视觉领域，卷积神经网络（CNN）长期以来一直是图像识别任务的主流架构。然而，近年来，自然语言处理（NLP）领域中大放异彩的Transformer架构也开始在图像识别中崭露头角。今天，我们将深入探讨一种创新的架构——VisionTransformer（ViT），它将Transformer的强大能力直接应用于图像
图片粘贴上传实现 SarinaDu javascript html5
图片上传htmldemo直接粘贴本地运行查看效果即可，有看不懂的直接喂给deepseek会解释的很清晰粘贴图片上传示例-使用场景，粘贴桌面图片上传、粘贴word文档中图片上传、直接截图上传等body{font-family:Arial,sans-serif;padding:20px;}.upload-area{width:100%;height:200px;border:2pxdashed#ccc
lombok 不生效 howeres Maven maven
Lombok不生效0现象在build/rebuild时，提示Lombok不生效：java:Youaren’tusingacompilersupportedbylombok,solombokwillnotworkandhasbeendisabled.或java:JPSincrementalannotationprocessingisdisabled.Compilationresultsonparti
使用vue3框架vue-next-admin导出表格excel（带图片）乐多_L vue.js 前端 javascript
想要使用vue3导出表格内容并且图片显示在表格中（如图）：步骤如下：下载安装插件：安装命令：npminstalljs-table2excel引入插件：importtable2excelfrom'js-table2excel'使用插件直接上代码：onBatchExport方法中数据的key值要与data中保持一致，否则数据无法获取到，打印出的结果就回为undefined。我写了两种导出：一种是全部导
YOLOv8到YOLOv11：深度解析目标检测架构的演进金外飞176 技术前沿目标跟踪人工智能计算机视觉目标检测 YOLO 神经网络深度学习
YOLOv8到YOLOv11：深度解析目标检测架构的演进在计算机视觉领域，YOLO（YouOnlyLookOnce）系列模型一直是实时目标检测领域的佼佼者。从2015年的YOLOv1到2024年的YOLOv11，这一系列模型经历了快速的迭代和发展，不断刷新着目标检测的性能和效率。然而，由于部分YOLO版本缺乏详细的学术论文和架构图，研究人员和开发者在理解这些模型的工作原理时往往面临挑战。最近，一篇
【架构】分层架构 (Layered Architecture) _君莫笑软件架构架构 c++
一、分层模型基础理论![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/0365cf0bfa754229bdedca6b472bffc7.png1.核心定义分层架构（LayeredArchitecture）模型是一种常见的软件设计架构，它将软件系统按照功能划分为不同的层次，每个层次都有特定的职责和功能，层与层之间存在清晰的依赖关系。这种架构有助于提高软件的可
基于立创·天空星开发板-GD32F407VET6-青春版，开发一款手持热成像仪。该设备将采集热红外传感器的数据，经过处理后在LCD屏幕上显示热图像，并提供用户交互界面。嵌入式程序员小刘物联网单片机嵌入式硬件开源
本项目基于立创·天空星开发板-GD32F407VET6-青春版，开发一款手持热成像仪。该设备将采集热红外传感器的数据，经过处理后在LCD屏幕上显示热图像，并提供用户交互界面。关注微信公众号，提前获取相关推文一、需求分析核心功能:热图像采集:读取热红外传感器数据。图像处理:将原始传感器数据转换为可显示的彩色或灰度热图像。图像显示:在LCD屏幕上实时显示热图像。温度测量:计算并显示图像中特定点的温度值
Python从0到100（三十九）：数据提取之正则（文末免费送书）是Dream呀 python mysql 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
深度学习工厂的蓝图：拆解CUDA驱动、PyTorch与OpenCV的依赖关系时光旅人01号深度学习 pytorch opencv
想象一下，你正在建造一座深度学习工厂，这座工厂专门用于高效处理深度学习任务（如训练神经网络）和计算机视觉任务（如图像处理）。为了让工厂顺利运转，你需要搭建基础设施、安装设备、设置生产线，并配备控制台来管理整个生产过程。以下是这座工厂的详细构建过程：1.工厂的基础设施：Ubuntu比喻：Ubuntu是工厂所在的土地和建筑，提供了基础设施和运行环境。作用：提供操作系统环境，支持安装和运行各种工具和框架
在瑞芯微RK3588平台上使用RKNN部署YOLOv8Pose模型的C++实战指南机＿长 YOLO系列模型有效涨点改进深度学习落地实战 YOLO c++开发语言
在人工智能和计算机视觉领域，人体姿态估计是一项极具挑战性的任务，它对于理解人类行为、增强人机交互等方面具有重要意义。YOLOv8Pose作为YOLO系列中的新成员，以其高效和准确性在人体姿态估计任务中脱颖而出。本文将详细介绍如何在瑞芯微RK3588平台上，使用RKNN（RockchipNeuralNetworkToolkit）框架部署YOLOv8Pose模型，并进行C++代码的编译和运行。注本文全
前端导出word文件—包含canvas(echarts图表) Liuer_Qin js canvas echarts echarts 前端 javascript
一、使用的插件html-docx-js二、整体思路因为canvas是运行在内存中的，所以不能简单的通过dom获取canvas图片，需要手动的先将canvas转为image。三、实现先克隆要下载的DOM的副本。因为canvas是运行在内存中的，所以也不能通过cloneNode方法克隆下来（克隆下来是空的）。我们这里将原DOM中的canvas转成图片，然后插入到副本的对应位置，这样操作不会影响原DOM
使用Python和OpenCV实现图像像素压缩与解压东方佑量子变法 python opencv 开发语言
在本文中，我们将探讨如何使用Python和OpenCV库来实现一种简单的图像像素压缩算法。我们将详细讨论代码的工作原理，并提供一个具体的示例来演示该过程。1.引言随着数字媒体的普及，图像处理成为了一个重要的领域。无论是为了减少存储空间还是加快网络传输速度，图像压缩技术都扮演着至关重要的角色。这里，我们提出了一种基于像素重复模式的简单压缩算法，它适用于具有大量连续相同像素值的图像。2.技术栈介绍2.
壁纸样机神器：快速生成个性化壁纸，提升你的设备颜值 2401_89910411 人工智能
在数字化时代，壁纸不仅是设备的装饰，更是个人风格的展示。想要快速制作出精美的壁纸吗？壁纸样机神器来帮你！这款工具集多种功能于一身，让你轻松成为壁纸设计师。一、功能亮点1.一键生成高清壁纸壁纸样机神器支持多种图片格式的上传，无论是你从网上下载的图片，还是自己拍摄的照片，都可以轻松导入。上传后，系统会自动适配高清分辨率，确保壁纸在任何设备上都能完美展示。2.智能模板库平台提供了丰富的模板选择，涵盖从极
代理IP助力AI图像处理，开启行业新篇章傻啦嘿哟关于代理IP那些事儿人工智能 tcp/ip 图像处理
目录一、代理IP技术简介二、代理IP在AI图像处理中的应用1.提升数据访问速度2.增强数据处理能力3.突破网络限制三、代理IP在AI图像处理中的实际案例案例一：AI图像生成软件案例二：AI动画创作四、代理IP技术的未来展望五、结语在科技日新月异的今天，AI图像处理技术以其广泛的应用前景和强大的处理能力，正深刻改变着我们的世界。从人脸识别、自动驾驶到医学影像分析，AI图像处理技术无处不在，发挥着不可
网页中加载 SVG 的七大方式前端熊猫 Svg javascript html svg vue
一、直接使用标签加载外部SVG文件优点：简单易用：与加载其他图片格式（如PNG、JPEG）相同。浏览器支持良好：现代浏览器普遍支持。可缓存：SVG文件可以被浏览器缓存，减少重复请求。缺点：无法直接操作SVG内部元素：如果需要对SVG内部的元素进行交互或样式修改，这种方法不适用。适用场景：静态图像展示：仅需要展示SVG图像，不需要与之交互。二、将SVG作为CSS背景图片.icon{width:100
部署前端项目2 augenstern416 前端
前端项目的部署是将开发完成的前端代码发布到服务器或云平台，使其能够通过互联网访问。以下是前端项目部署的常见步骤和工具：1.准备工作在部署之前，确保项目已经完成以下步骤：代码优化：压缩JavaScript、CSS和图片文件，减少文件体积。环境配置：区分开发环境和生产环境（如API地址、环境变量等）。测试：确保项目在本地测试通过，没有明显Bug。2.部署流程1.构建项目大多数前端项目（如React、V
微信小程序之自定义轮播图实例 —— 微信小程序实战系列（3） 2401_84910072 程序员微信小程序小程序
由于微信小程序，整个项目编译后的大小不能超过1M查看做轮播图功能的一张图片大小都已经有100+k了那么我们可以把图片放在服务器上，发送请求来获取。index.wxml：这里使用小程序提供的组件autoplay：自动播放interval：自动切换时间duration：滑动动画的时长current：当前所在的页面bindchange：current改变时会触发change事件由于组件提供的指示点样式比
使用BLIP模型生成图像描述的可查询索引 dgay_hua python 计算机视觉开发语言
在本篇文章中，我们将介绍如何使用预训练的SalesforceBLIP图像描述模型，生成一个可查询的图像描述索引。我们将使用ImageCaptionLoader来加载图像，并通过一系列步骤生成查询索引。使用示例代码进行演示，帮助读者理解和实践。技术背景介绍随着计算机视觉技术的发展，图像描述生成成为了重要的研究领域。通过对图像内容自动生成文字描述，可以大大提高对图像信息的检索和管理效率。Salesfo
8-项目实战-信用卡数字识别 #北极星star Opencv图像处理框架实战 opencv 计算机视觉人工智能
目录(1)总体流程与方法(2)代码实现(3)识别结果(1)总体流程与方法①读取模板图像：加载包含数字模板的图像，并提取每个数字的轮廓，将它们作为模板存储。②读取输入图像：加载待识别的信用卡图像，并进行预处理。③提取数字区域：通过一系列图像处理操作（如礼帽操作、梯度计算、闭操作等）提取可能包含数字的区域。④轮廓排序与筛选：找到提取区域的轮廓，并根据轮廓的宽高比和尺寸筛选出符合条件的数字区域。⑤数字识
高并发系统架构设计全链路指南 power-辰南 java技术架构师成长专栏系统架构分布式高并发 springcloud
第一章：架构优化核心目标：提升系统高并发&高可用能力，优化架构，提高吞吐量。1.1微服务高可用优化解决问题：微服务可能存在单点故障、扩展性差、调用效率低等问题。1.1.1服务无状态化目的：让服务实例可以随时扩缩容、快速恢复，避免单点故障。可能的问题现象影响本地存储Session，导致用户粘连某个实例实例挂掉后，用户重新登录订单等业务逻辑依赖本地缓存容器扩缩时数据丢失静态文件（Excel/图片）存本
前端面试题（HTML篇）每天一点点~ html css javascript
1.网络中使用最多的图片格式有哪些？JPEG，GIF，PNG最流行的是JPEG格式，可以把文件压缩到最小在PS以JPEG格式存储时，提供11级压缩等级2.Doctype作用?严格模式与混杂模式如何区分？它们有何意义?声明文档类型声明位于位于HTML文档中的第一行，处于标签之前DOCTYPE不存在或格式不正确会导致文档以兼容模式呈现。标准模式(严格模式)浏览器按照W3C的标准解析执行代码标准模式(严
深入浅出：CUDA是什么，如何利用它进行高效并行计算码上飞扬 CUDA
在当今这个数据驱动的时代，计算能力的需求日益增加，特别是在深度学习、科学计算和图像处理等领域。为了满足这些需求，NVIDIA推出了CUDA（ComputeUnifiedDeviceArchitecture），这是一种并行计算平台和编程模型。本文将带你全面了解CUDA的基本概念、工作原理及其应用场景。一、什么是CUDA？CUDA（ComputeUnifiedDeviceArchitecture）是由
零基础学Python图片处理：用Pillow库轻松玩转修图小彭爱学习 python python pillow python处理图片
零基础学Python图片处理：用Pillow库轻松玩转修图一、初识Pillow：你的第一张数码暗房安装准备（只需要1分钟）打开电脑的命令行（Windows按Win+R输入cmd，Mac打开终端），输入：pipinstallpillow看到「SuccessfullyinstalledPillow-x.x.x」就安装成功啦！图片处理四步走打开图片：像打开文件柜一样找到图片修改图片：裁剪、调色、加特效查
深度学习模型中的知识蒸馏是如何工作的? c++服务器开发深度学习人工智能
深度学习模型在多个领域，特别是计算机视觉和自然语言处理中，已经取得了革命性的进展。然而，随着模型复杂性和资源需求的不断攀升，如何将这些庞大模型的知识浓缩为更紧凑、更高效的形式，成为了当前研究的热点。知识蒸馏，作为一种将知识从复杂模型转移到更简单模型的策略，已经成为实现这一目标的有效工具。在本文中，我们将深入探究深度学习模型中知识蒸馏的概念、原理及其在各领域的应用，以期为读者提供一个全面而严谨的视角
Python从0到100（四）：Python中的运算符介绍(补充) 是Dream呀 python java 数据库
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Python从0到100（三十五）：beautifulsoup的学习是Dream呀 Dream的茶话会 python beautifulsoup 学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
《深入浅出AI》前言知识：深度学习基础总结 GoAI 深入浅出AI 人工智能深度学习机器学习 cnn rnn 生成对抗网络神经网络
个人主页:GoAI|公众号:GoAI的学习小屋|交流群:704932595|个人简介：掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等，专注大数据与人工智能知识分享。AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象

转：openCV基础图像处理

读写

读入

写入

展示

展示一幅 8U 图像

展示一幅 32F 的图像

访问像素

灰度图像访问单像素值

彩色图像访问单像素值

遍历所有像素

遍历并访问相邻像素

图像通道

简单图像运算

图像叠加

其他操作

感兴趣区域（ROI）

图像变换

图像缩放

查找表

阈值处理

形态学变换

膨胀

腐蚀

高级形态学变换

直方图

计算直方图

用于灰度图像

用于彩色图像

直方图均衡化

反投影直方图

空间滤波

低通滤波

均值模糊

高斯模糊

下采样

上采样

中值滤波

高通滤波

Sobel 滤波

边缘提取

原理

拉普拉斯变换

边缘提取

原理

图像卷积

图像金字塔

高斯金字塔

拉普拉斯金字塔

图像分割

分水岭

GrabCut

形状检测

轮廓

直线

HoughLines

HoughLinesP

圆

形状拟合

直线

椭圆

形状特征

轮廓

边界框（bounding box）

最小外接圆

最小外接多边形

凸包

矩（moments）

你可能感兴趣的:(杂文,计算机视觉,图片,图像处理,processing)

展示一幅 `8U` 图像

展示一幅 `32F` 的图像