luckyone906

遍历opencv中的mat像素的几种方法和概念

今天在看矩形滤波的时候忽然脑子短路，把一些概念全弄混了，现总结一下，以便下次再混的时候可以参考确认下，自己的理解，有错的地方还请指正。

首先，在Opencv2中基本上都是用的Mat来表示图像了，C++的函数调用中基本上也都是Mat图，从根本上说，一张图像是一个由数值组成的矩阵，矩阵的每一个元素代表一个像素。对于灰度图像而言，像素有8位无符号数表示，其中0代表黑色，255代表白色。那么矩阵和图像间到底是一个什么样的关系呢。

第一：Mat图有行和列，即cv::Mat中有公有成员变量cols和rows，注意，这里的cols就是图像的宽度width，rows就是图像的高度height。这个width和height我们可以在其它Opencv的成员中得到，比如矩形Rect，而矩形Rect就是一个经常会用到的结构了，我自己接触到的就包括鼠标选择矩形区域、框住目标的矩形区域、滤波器矩形模版、目标的矩形特征、矩形内的运算等等。可以说Rect是一个非常常用的结构，也是Opencv里非常有用的一个结构，本质上矩形区域就是图像的一个子部分，或者说图像矩阵的一个子矩阵。

这里我引用《OpenCV学习笔记（四十一）——再看基础数据结构core》中关于Rect的介绍，Rect_类有些意思，成员变量x、y、width、height，分别为左上角点的坐标和矩形的宽和高。常用的成员函数有Size()返回值为一个Size，area()返回矩形的面积，contains(Point)用来判断点是否在矩形内，inside(Rect)函数判断矩形是否在该矩形内，tl()返回左上角点坐标，br()返回右下角点坐标。

第二：Mat图中的图像像素位置表示和矩阵中元素的表示。这里引用《访问Mat图像中每个像素的值》中几张图来表示Mat矩阵中存数据的关系。单通道灰度图数据存放格式：

多通道的图像中，每列并列存放通道数量的子列，如RGB三通道彩色图：

这时，大家得注意了，二维矩阵的行和列用来表示一个元素，并且一般是从0标号开始，所以实际上是有m+1列，也就是说宽度width是m+1的，行类似。还有就是Mat.at（int y， int x）来访问一个像素，这时候的y表示的行号，x表示的列号，相对应的就是x表示水平的宽，y表示的竖直的高，只不过x和y都是从0开始的标号。容易搞混的地方就在于一些矩阵的相减了，相减完后怎么表示像素位置，这个时候一般比较难把握，但是只要明白矩阵里x，y，width，height的关系，搞清楚就容易多了。

Mat dst；

int height = dst.rows;
int width = dst.cols;

for (int i = 0; i < height; i++) {

for (int j = 0; j < width; j++) {

//假如以十字形遍历索引，则十字中心（i * width + j），上下分别是（(i -1)* width + j）（(i +1)* width + j）

//左右分别是（i * width + j-1）（i * width + j+1）

//这里的i是代表行数，j代表列数，即所在的行的第几列
               int index = i * width + j;
               //像素值
               int data = (int)dst.data[index];

}

}

//=====================================指针法==================================================//

#include

using namespace std;

using namespace cv;

int main()

{

Mat img=imread("f:/1.jpg");

int height=img.rows;

int width=img.cols;

for(int i=0;i

 
      {  
          unsigned char *data=img.data+i*width*img.channels(); 
          for(int j=0;j
 
          {  
              int r=*(data+j*img.channels()); 
              int g=*(data+j*img.channels()+1); 
              int b=*(data+j*img.channels()+2); 
              cout<" "<" "<
 
          } 
      }         
      img.release(); 
      system("pause"); 
      return 1; 
  } 
  //============================================================================================// 
  推荐使用C++格式，比较方便使用 
  #include "WangSetup.h" 
    
  #include  
  #include  
  #include  
    
  using namespace std; 
    
  int main() 
  {  
      //C++ Format 
      cv::Mat img = cv::imread("lena.jpg"); 
      //取img中(30, 20)这个像素点的bgr信息 
      cv::Vec3b bgr = img.at(30, 20); 
      cout << "B: " << (unsigned int)bgr.val[0] << ", "; 
      cout << "G: " << (unsigned int)bgr.val[1] << ", "; 
      cout << "R: " << (unsigned int)bgr.val[2] << endl; 
    
    
      //C Format 
      IplImage *img2 = cvLoadImage("lena.jpg");        //8UC3, (0,0)B, (0,0)G, (0,0)R, (0,1)B, ... 
      char *ptr = img2->imageData       //图像首地址 
          + img2->widthStep * 30        //每行大小 * 行数 
          + 3 * 20;                    //BGR占3个大小空间 * 列数 
      printf("B: %d, G: %d, R: %d\n", (uchar)ptr[0], (uchar)ptr[1], (uchar)ptr[2]); 
      cvReleaseImage(&img2); 
        
      return 0; 
  } 
    
    
    
  1.用动态地址操作像素： 
      Mat srcImage(100, 100, CV_8UC3, Scalar(200,20,100));
  
     imshow("显示图像", srcImage);
  
  
     int rowNumber = srcImage.rows;
     int colNumber = srcImage.cols;
  
  
     for (int i = 0; i < rowNumber; i++)
     { 
         for (int j = 0; j < colNumber; j++)
         { 
             if (srcImage.at(i, j)[0] > 180) 
             { 
                 srcImage.at(i, j)[0] = 0;            
             }
             
             if (srcImage.at(i, j)[1] < 50) 
             { 
                 srcImage.at(i, j)[1] = 255;
             }
  
             if (srcImage.at(i, j)[2] < 120) 
             { 
                 srcImage.at(i, j)[2] = 0;
             }
  
         }
     }
  
  
     imshow("处理后的图像", srcImage);
 cv::mat的成员函数： .at(int y， int x)可以用来存取图像中对应坐标为（x，y）的元素坐标。（Mat类中的cols和rows给出了图像的宽和高。而成员函数at（int x, int y）可以用来存取图像的元素。）由于at方法本身不会对任何数据类型进行转化，故一定要确保指定的数据类型和矩阵中的数据类型相符合。
 假设提前已知一幅图像img的数据类型为 unsigned char型灰度图（单通道），对像素的赋值操作为image.at(i,j) = value。而对于彩色图像，每个像素由三个部分构成：蓝色通道、绿色通道和红色通道（BGR），对于一个包含彩色图像的Mat，会返回一个由三个8位数组组成的量。OpenCV将此类型定义为Vec3b，即由三个unsigned char组成的向量。这也解释了为什么存取彩色图像像素的代码可以写成：image.at（i,j）[channel] = value; 
  以下是统计canndy后的0像素点与255像素点之间的数量的比值： 
  #define _CRT_SECURE_NO_WARNINGS
  
 #include 
 #include 
  
 using namespace std;
 using namespace cv;
  
 int main() 
 { 
     Mat graySrc = imread("../../11.bmp", 0);
  
     Mat canImage;
     Canny(graySrc, canImage, 60, 120);
  
     int PicZero = 0;
     int PicFull = 0;
  
     for (int i = 0; i < graySrc.rows; ++i) 
     { 
         for (int j = 0; j < graySrc.cols; ++j) 
         { 
             if (canImage.at(i, j) == 0) 
             { 
                 PicZero++;
             }
             else
             { 
                 PicFull++;
             }    
         }
     
     }
  
     cout << "0像素点比255像素点的比值为" << (double)PicZero / PicFull << endl;
     system("pause");
 } 
  
2.用指针的方法： 
  有时候我们需要遍历Mat中的每一个像素点，并且对像素点进行处理，这里以图像所有像素点都减去div（div属于int类型） 
  void colorReduce(Mat& inputImage, Mat& outputImage, int div)
 { 
     // 参数准备
     outputImage = inputImage.clone();
  
     int rowNumber = outputImage.rows;
     int colNumber = outputImage.cols*outputImage.channels();
  
     for (int i = 0; i < rowNumber; i++)
     { 
         // 获取第i行的首地址
         uchar* data = outputImage.ptr(i);
  
         for (int j = 0; j < colNumber; j++)  // 列循环
         { 
             // 开始处理每一个像素值，每一个像素值都减去div
             data[j] = data[j] - div;
         }
     }
 }
 也可以写成如下形式： 
  Mat inverseColor1(Mat srcImage) 
 { 
     Mat tempImage = srcImage.clone();
     int row = tempImage.rows;
     int col = tempImage.cols * tempImage.channels();
  
     for (int i = 0; i < row; ++i) 
     { 
         const unsigned char* sourcedata = srcImage.ptr(i);
         unsigned char* data = tempImage.ptr(i);
         for (int j = 0; j < col; j++)
         { 
             data[j] = sourcedata[j] - div;
         }
     }
     return tempImage;
 }
 此时是定义了两个指针类型： const unsigned char*和 unsigned char*，其中const unsigned char* 中的内容只能够被读取，不能被修改。 
  特别需要注意的是：Mat中每一行元素的个数=列数*通道数 
  
如需要打印M， 
      Mat M(3, 2, CV_8UC3, Scalar(0, 0, 255));
     cout << M << endl;
 打印结果为：验证了每一行元素的个数为： 列数*通道数 
  另外需要注意的是：Mat 除了拥有成员变量cols，rows，成员函数channels()之外，还提供了ptr函数可以返回得到图像任意行的首地址。 
  3.用迭代器Matlterator_： 
          Matlterator_是Mat数据操作的迭代器，：begin()表示指向Mat数据的起始迭代器，：end()表示指向Mat数据的终止迭代器。迭代器方法是一种更安全的用来遍历图像的方式，首先获取到数据图像的矩阵起始，再通过递增迭代实现移动数据指针。 
  Mat inverseColor4(Mat srcImage) 
 { 
     Mat tempImage = srcImage.clone();
  
     // 初始化原图像迭代器
     MatConstIterator_ srcIterStart = srcImage.begin();
     MatConstIterator_ srcIterEnd = srcImage.end();
  
     // 初始化输出图像迭代器
     MatIterator_ resIterStart = tempImage.begin();
     MatIterator_ resIterEnd = tempImage.end();
  
     while (srcIterStart != srcIterEnd) 
     { 
         (*resIterStart)[0] = 255 - (*srcIterStart)[0];
         (*resIterStart)[1] = 255 - (*srcIterStart)[1];
         (*resIterStart)[2] = 255 - (*srcIterStart)[2];
  
         srcIterStart++;
         resIterStart++;
     }
  
     return tempImage;
  
 }
   
    
    
  Color Reduce
 还是使用经典的Reduce Color的例子，即对图像中的像素表达进行量化。如常见的RGB24图像有256×256×256中颜色，通过Reduce Color将每个通道的像素减少8倍至256/8=32种，则图像只有32×32×32种颜色。假设量化减少的倍数是N，则代码实现时就是简单的value/N*N，通常我们会再加上N/2以得到相邻的N的倍数的中间值，最后图像被量化为(256/N)×(256/N)×(256/N)种颜色。 
  方法零：.ptr和[]操作符
 Mat最直接的访问方法是通过.ptr<>函数得到一行的指针，并用[]操作符访问某一列的像素值。 
  // using .ptr and []
 void colorReduce0(cv::Mat &image, int div=64) { 
       int nr= image.rows; // number of rows
       int nc= image.cols * image.channels(); // total number of elements per line
       for (int j=0; j           uchar* data= image.ptr(j);
           for (int i=0; i                   data[i]= data[i]/div*div + div/2;
             }                  
       }
 } 
  方法一：.ptr和指针操作
 除了[]操作符，我们可以移动指针*++的组合方法访问某一行中所有像素的值。 
  // using .ptr and * ++ 
 void colorReduce1(cv::Mat &image, int div=64) { 
       int nr= image.rows; // number of rows
       int nc= image.cols * image.channels(); // total number of elements per line
       for (int j=0; j           uchar* data= image.ptr(j);
           for (int i=0; i                  *data++= *data/div*div + div/2;
             } // end of row                 
       }
 } 
  方法二：.ptr、指针操作和取模运算
 方法二和方法一的访问方式相同，不同的是color reduce用模运算代替整数除法 
  // using .ptr and * ++ and modulo
 void colorReduce2(cv::Mat &image, int div=64) { 
       int nr= image.rows; // number of rows
       int nc= image.cols * image.channels(); // total number of elements per line
       for (int j=0; j           uchar* data= image.ptr(j);
           for (int i=0; i                   int v= *data;
                   *data++= v - v%div + div/2;
             } // end of row                 
       }
 } 
  方法三：.ptr、指针运算和位运算
 由于进行量化的单元div通常是2的整次方，因此所有的乘法和除法都可以用位运算表示。 
  // using .ptr and * ++ and bitwise
 void colorReduce3(cv::Mat &image, int div=64) { 
       int nr= image.rows; // number of rows
       int nc= image.cols * image.channels(); // total number of elements per line
       int n= static_cast(log(static_cast(div))/log(2.0));
       // mask used to round the pixel value
       uchar mask= 0xFF<       for (int j=0; j           uchar* data= image.ptr(j);
           for (int i=0; i             *data++= *data&mask + div/2;
             } // end of row                 
       }
 } 
  方法四：指针运算
 方法四和方法三量化处理的方法相同，不同的是用指针运算代替*++操作。 
  // direct pointer arithmetic
 void colorReduce4(cv::Mat &image, int div=64) { 
       int nr= image.rows; // number of rows
       int nc= image.cols * image.channels(); // total number of elements per line
       int n= static_cast(log(static_cast(div))/log(2.0));
       int step= image.step; // effective width
       // mask used to round the pixel value
       uchar mask= 0xFF<       // get the pointer to the image buffer
       uchar *data= image.data;
       for (int j=0; j           for (int i=0; i             *(data+i)= *data&mask + div/2;
             } // end of row                 
             data+= step;  // next line
       }
 } 
  方法五：.ptr、*++、位运算以及image.cols * image.channels()
 这种方法就是没有计算nc，基本是个充数的方法。 
  // using .ptr and * ++ and bitwise with image.cols * image.channels()
 void colorReduce5(cv::Mat &image, int div=64) { 
       int nr= image.rows; // number of rows
       int n= static_cast(log(static_cast(div))/log(2.0));
       // mask used to round the pixel value
       uchar mask= 0xFF<       for (int j=0; j           uchar* data= image.ptr(j);
           for (int i=0; i             *data++= *data&mask + div/2;
             } // end of row                 
       }
 }
   
  方法六：连续图像
 Mat提供了isContinuous()函数用来查看Mat在内存中是不是连续存储，如果是则图片被存储在一行中。 
  // using .ptr and * ++ and bitwise (continuous)
 void colorReduce6(cv::Mat &image, int div=64) { 
       int nr= image.rows; // number of rows
       int nc= image.cols * image.channels(); // total number of elements per line
       if (image.isContinuous())  { 
           // then no padded pixels
           nc= nc*nr; 
           nr= 1;  // it is now a 1D array
        }
       int n= static_cast(log(static_cast(div))/log(2.0));
       // mask used to round the pixel value
       uchar mask= 0xFF<       for (int j=0; j           uchar* data= image.ptr(j);
           for (int i=0; i             *data++= *data&mask + div/2;
             } // end of row                 
       }
 } 
  方法七：continuous+channels
 与方法六基本相同，也是充数的。 
  // using .ptr and * ++ and bitwise (continuous+channels)
 void colorReduce7(cv::Mat &image, int div=64) { 
       int nr= image.rows; // number of rows
       int nc= image.cols ; // number of columns
       if (image.isContinuous())  { 
           // then no padded pixels
           nc= nc*nr; 
           nr= 1;  // it is now a 1D array
        }
       int n= static_cast(log(static_cast(div))/log(2.0));
       // mask used to round the pixel value
       uchar mask= 0xFF<       for (int j=0; j           uchar* data= image.ptr(j);
           for (int i=0; i             *data++= *data&mask + div/2;
             *data++= *data&mask + div/2;
             *data++= *data&mask + div/2;
             } // end of row                 
       }
 } 
  方法八：Mat _iterator
 真正有区别的方法来啦，用Mat提供的迭代器代替前面的[]操作符或指针，血统纯正的官方方法~ 
  // using Mat_ iterator 
 void colorReduce8(cv::Mat &image, int div=64) { 
       // get iterators
       cv::Mat_::iterator it= image.begin();
       cv::Mat_::iterator itend= image.end();
       for ( ; it!= itend; ++it) { 
         (*it)[0]= (*it)[0]/div*div + div/2;
         (*it)[1]= (*it)[1]/div*div + div/2;
         (*it)[2]= (*it)[2]/div*div + div/2;
       }
 }
   
  方法九：Mat_ iterator 和位运算
 把方法八中的乘除法换成位运算。 
  // using Mat_ iterator and bitwise
 void colorReduce9(cv::Mat &image, int div=64) { 
       // div must be a power of 2
       int n= static_cast(log(static_cast(div))/log(2.0));
       // mask used to round the pixel value
       uchar mask= 0xFF<       // get iterators
       cv::Mat_::iterator it= image.begin();
       cv::Mat_::iterator itend= image.end();
       for ( ; it!= itend; ++it) { 
         (*it)[0]= (*it)[0]&mask + div/2;
         (*it)[1]= (*it)[1]&mask + div/2;
         (*it)[2]= (*it)[2]&mask + div/2;
       }
 } 
  方法十：MatIterator_
 和方法八基本相同。 
  // using MatIterator_ 
 void colorReduce10(cv::Mat &image, int div=64) { 
       cv::Mat_ cimage= image;
       cv::Mat_::iterator it=cimage.begin();
       cv::Mat_::iterator itend=cimage.end();
       for ( ; it!= itend; it++) { 
         (*it)[0]= (*it)[0]/div*div + div/2;
         (*it)[1]= (*it)[1]/div*div + div/2;
         (*it)[2]= (*it)[2]/div*div + div/2;
       }
 }
   
  方法十一：图像坐标
 // using (j,i)
 void colorReduce11(cv::Mat &image, int div=64) { 
       int nr= image.rows; // number of rows
       int nc= image.cols; // number of columns
       for (int j=0; j           for (int i=0; i                   image.at(j,i)[0]=     image.at(j,i)[0]/div*div + div/2;
                   image.at(j,i)[1]=     image.at(j,i)[1]/div*div + div/2;
                   image.at(j,i)[2]=     image.at(j,i)[2]/div*div + div/2;
             } // end of row                 
       }
 } 
  方法十二：创建输出图像
 之前的方法都是直接修改原图，方法十二新建了输出图像，主要用于后面的时间对比。 
  // with input/ouput images
 void colorReduce12(const cv::Mat &image, // input image 
                  cv::Mat &result,      // output image
                  int div=64) { 
       int nr= image.rows; // number of rows
       int nc= image.cols ; // number of columns
       // allocate output image if necessary
       result.create(image.rows,image.cols,image.type());
       // created images have no padded pixels
       nc= nc*nr; 
       nr= 1;  // it is now a 1D array
       int n= static_cast(log(static_cast(div))/log(2.0));
       // mask used to round the pixel value
       uchar mask= 0xFF<       for (int j=0; j           uchar* data= result.ptr(j);
           const uchar* idata= image.ptr(j);
           for (int i=0; i             *data++= (*idata++)&mask + div/2;
             *data++= (*idata++)&mask + div/2;
             *data++= (*idata++)&mask + div/2;
           } // end of row                 
       }
 } 
  方法十三：重载操作符
 Mat重载了+&等操作符，可以直接将两个Scalar(B,G,R)数据进行位运算和数学运算。 
  // using overloaded operators
 void colorReduce13(cv::Mat &image, int div=64) { 
       int n= static_cast(log(static_cast(div))/log(2.0));
       // mask used to round the pixel value
       uchar mask= 0xFF<       // perform color reduction
       image=(image&cv::Scalar(mask,mask,mask))+cv::Scalar(div/2,div/2,div/2);
 } 
  时间对比
 通过迭代二十次取平均时间，得到每种方法是运算时间如下。 
  可以看到，指针*++访问和位运算是最快的方法；而不断的计算image.cols*image.channles()花费了大量重复的时间；另外迭代器访问虽然安全，但性能远低于指针运算；通过图像坐标(j,i)访问时最慢的，使用重载操作符直接运算效率最高。

YOLOv12模型详解及代码复现清风AI 深度学习算法详解及代码复现计算机视觉 YOLO 人工智能机器学习神经网络 python 算法
算法背景在计算机视觉领域不断发展壮大的背景下，YOLOv12算法应运而生。这一突破性成果源自JosephRedmon和AliFarhadi等研究人员在华盛顿大学的开创性工作。他们的目标是解决实时物体检测这一关键问题，在速度和精度之间寻求最佳平衡。YOLOv12延续了前作YOLOv1的成功理念，将其定位为一种回归问题，而非传统的区域提议+分类方法。这种创新方法不仅简化了整个检测过程，还显著提高了处理
工程化与框架系列（32）--前端测试实践指南一进制ᅟᅠ ‌‍‎‏ 前端工程化与框架前端
前端测试实践指南引言前端测试是保证应用质量的重要环节。本文将深入探讨前端测试的各个方面，包括单元测试、集成测试、端到端测试等，并提供实用的测试工具和最佳实践。测试概述前端测试主要包括以下类型：单元测试：测试独立组件和函数集成测试：测试多个组件的交互端到端测试：模拟用户行为的完整测试性能测试：测试应用性能指标快照测试：UI组件的视觉回归测试测试工具实现测试运行器//测试运行器类classTestRu
python实现KNN算法的手写数字识别：深入解析与完整项目流程快撑死的鱼 Python算法精解算法
随着人工智能和机器学习的快速发展，图像识别技术在多个领域得到广泛应用。而手写数字识别作为图像识别的典型场景之一，已经成为研究者和开发者学习、应用机器学习算法的经典项目。本文将深入解析如何使用Python编程语言，结合KNN（K-最近邻）算法实现手写数字识别系统。文章不仅介绍了算法的核心原理，还从用户交互、图像处理、数据预处理等多个角度对整个项目进行了全方位的讲解。读者通过本文，可以全面掌握手写数字
智享三代实景无人直播：实景呈现+智能互动，以科技之力稳抓流量与商机 x13257272926 科技人工智能
传统直播中，虚拟背景虽能带来简洁美观的视觉效果，但往往缺乏真实感和可信度。智享三代实景无人直播则反其道而行之，着重强调实景呈现。无论是实体店铺的内部环境，还是工厂的生产车间，亦或是户外产品的实际使用场景，都能通过高清摄像头真实、全面地展示在观众面前。例如，一家经营户外运动装备的商家，利用智享三代实景无人直播，将直播间搭建在风景秀丽的郊外露营地。观众不仅能清晰看到帐篷的搭建过程、帐篷内部的空间布局和
WPF的五种绑定模式 WangPride wpf
WPF的五种绑定模式WPF的绑定模式(mode)是枚举的，枚举值共有5个：1、OneWay(源变就更新目标属性)2、TwoWay(源变就更新目标并且目标变就更新源)3、OneTime(只根据源来设置目标，以后都不会变)4、OneWayToSource(与OneWay相反)5、Default(可以单向或双向，是靠被值定的源或目标是否有get过set来指定的)WPF的逻辑树与视觉树基本概念：与ASP.
阿里云国际站代理商：怎样量化虚拟世界的QoE体验指标？ linglideman 阿里云
1.沉浸体验质量（QImE）沉浸体验质量主要衡量虚拟世界中视觉和听觉的沉浸感，包括以下几个关键指标：视频质量（QP）：考虑视频的平均码率（Brv）、帧率（FR）、分辨率（Rh、Rv）、视场角（FoVh）以及编码标准（Codecv）等因素。音频质量（QA）：涉及音频的平均码率（Bra）、声道数（NAC）、采样率（Sra）和编码标准（Codeca）。音视频同步时延（Tasyn）：衡量音视频的同步性，影
再添殊荣！移远通信工业智能品牌宝维塔™斩获AI创新应用奖移远通信算力人工智能工业智能
12月24日，2024中国物联网产业大会暨第21届慧聪品牌盛会在深圳圆满落幕。会上，移远通信凭借其工业智能品牌宝维塔™在推动AI技术落地与应用创新方面的卓越贡献，获颁“AI创新应用奖”。作为科技发展的前沿力量，AI技术正深刻改变着各行各业的生产模式和效率，尤其在工业领域，展现出了巨大潜力。宝维塔™是移远通信精心打造的工业智能品牌，专注于将人工智能、边缘计算、机器视觉、深度学习、软件算法平台等前沿技
4款老照片AI自动修复工具分享，让老照片重焕光彩 Ai工具分享人工智能
老照片承载着我们的成长历程、家庭的变迁以及社会的发展印记。然而，岁月无情，它们逐渐失去了原本的光彩，让我们在回忆时总觉得少了些什么。但随着自动修复软件的出现，让老照片的修复变得不再遥不可及。这些软件利用先进的图像处理技术，能够自动识别并修复照片上的瑕疵，让老照片重焕光彩。下面小编就来给大家分享几款AI自动修复工具，帮助你找回那些遗失的美好时光。一、牛学长图片修复工具牛学长图片修复工具是一款功能强大
图像工具插件：Editor.js 的图像处理解决方案贡沫苏Truman
图像工具插件：Editor.js的图像处理解决方案imageImageBlockforEditor.js项目地址:https://gitcode.com/gh_mirrors/image8/imageEditor.js的图像工具插件是一个强大的开源项目，致力于为Editor.js富文本编辑器提供图像处理功能。该项目主要使用JavaScript编程语言，并且是基于Editor.js的插件架构进行开发
AI大模型推理加速：技术与实践详解 AI大模型学习者人工智能
近年来，AI大模型在自然语言处理、计算机视觉等领域取得了突破性进展。然而，大模型的推理速度却成为其落地应用的瓶颈。本文将详细探讨AI大模型推理加速的技术手段和实践经验，并结合具体案例进行分析。一、挑战与机遇1.1挑战庞大的参数量:大模型通常拥有数十亿甚至数千亿个参数，例如GPT-3拥有1750亿个参数。如此庞大的参数量导致模型文件体积巨大，加载和推理都需要消耗大量的内存和计算资源。复杂的计算图:大
验证码识别：使用OCR技术识别图形验证码详解数据知道 2025年爬虫和逆向教程 ocr python 爬虫 OCR识别验证码识别图片验证码
文章目录一、基本原理二、所需工具2.1Python环境2.2图像处理库2.3OCR引擎2.4Python接口三、实现步骤3.1获取验证码图像3.2图像预处理3.3使用OCR进行字符识别3.4基本OCR识别样例四、提高识别准确率的方法4.1字符分割4.2使用深度学习模型4.3数据增强4.4集成多个OCR引擎五、实际应用中的注意事项六、总结验证码（CAPTCHA）是一种用于区分人类用户和自动化程序的安
OpenCV图像基础天行者@ opencv 人工智能计算机视觉
OpenCV其实就是一堆C和C++语言的源代码文件,这些源代码文件中实现了许多常用的计算机视觉算法。OpenCV的全称是OpenSourceComputerVisionLibrary,是一个开放源代码的计算机视觉库OpenCV最初由英特尔公司发起并开发,以BSD许可证授权发行,可以在商业和研究领域中免费使用,现在美国WillowGarage为OpenCV提供主要的支持OpenCV可用于开发实时的图
CSS中相对定位使用详情 ~废弃回忆 �༄ HTML css 前端 CSS中相对定位使用详情
1.如何设置相对定位?给元素设置postition:relative即可实现相对定位.可以使用left,right,top,bottom四个属性调整位置.2.相对定位的参考点在哪里?相对于自己原来的位置3.相对定位的特点:1.不会脱离文档流,元素位置的变化,只是视觉效果上的变化,不会对其他元素产生任何影响.2.定位元素的显示层级比普通元素高,无论什么定位,显示层级都是一样的.默认规则是:定位的元素
HTML 样式之 CSS 全面解析烂蜻蜓 HTML html css 前端
在网页开发的世界里，HTML负责搭建页面的结构，而CSS（CascadingStyleSheets，层叠样式表）则承担着渲染HTML元素标签样式的重任，赋予网页丰富的视觉效果。一、CSS的魅力展现CSS能够实现诸如改变文字的样式与颜色（Look!Stylesandcolors）、灵活操控文本（ManipulateText）、设置元素的颜色和盒子模型（Colors,Boxes）等诸多功能，极大地提升
账本 1.01 版本：样式优化升级分享烂蜻蜓 html 前端 css
在开发账本应用的过程中，持续的样式优化对于提升用户体验起着至关重要的作用。本次账本1.02版本着重对样式进行了全面优化，让应用在视觉上更加美观、操作上更加便捷。下面就为大家分享一些关键代码及优化思路。话不多说，先上效果图。一、整体布局优化在index.vue和add.vue中，整体布局都采用了flex布局方式。以index.vue为例：.container{display:flex;flex-di
大模型（DeepSeek等）是否会动摇AI工程师的工作？点我头像干啥 Ai 深度学习人工智能 AI编程计算机视觉
引言近年来，人工智能（AI）领域取得了突飞猛进的发展，尤其是大模型（如GPT-3、BERT、DeepSeek等）的出现，极大地推动了自然语言处理（NLP）、计算机视觉（CV）等领域的进步。大模型凭借其强大的泛化能力和广泛的应用场景，逐渐成为AI领域的核心技术之一。然而，随着大模型的普及，一个备受关注的问题浮出水面：大模型是否会动摇AI工程师的工作？本文将从多个角度探讨这一问题，分析大模型对AI工程
ComfyUI 中存在类似于 “蒙版” 的方法 AI-AIGC-7744423 图像处理人工智能
在ComfyUI中存在类似于“蒙版”的方法，它在图像生成和编辑过程中发挥着重要作用，以下为你详细介绍：什么是蒙版及其作用在图像处理领域，蒙版是一种用于控制图像特定区域处理效果的工具。通过蒙版，可以指定哪些区域需要应用某种效果（如滤镜、色彩调整等），哪些区域保持不变。在ComfyUI里，蒙版主要用于控制图像生成或修改的范围。ComfyUI中实现类似蒙版功能的方法1.使用ControlNet的蒙版功能
Vim忍者速成秘卷：让你的键盘冒出残影の奥义 ivwdcwso 操作系统与云原生 vim 编辑器程序员忍道终端美学效率革命 linux
核心原理通过超低延迟配置+肌肉记忆优化+视觉欺骗技术，达成行云流水的操作体验。就像《火影忍者》结印般流畅！⚡残影生成术（基础篇）"️贴地飞行模式（.vimrc极速配置）settimeoutlen=300"快捷键响应时间压缩至300ms（武士刀级响应）setttyfast"激活终端极速传输模式setlazyredraw"执行宏时暂停界面刷新（性能提升50%）"手里剑光标追踪术autocmdCurso
Java线程协作式中断机制超人汪小建(seaboat) 线程协作式中断机制 jvm
跟着作者的65节课彻底搞懂Java并发原理专栏，一步步彻底搞懂Java并发原理。作者简介：笔名seaboat，擅长工程算法、人工智能算法、自然语言处理、计算机视觉、架构、分布式、高并发、大数据和搜索引擎等方面的技术，大多数编程语言都会使用，但更擅长Java、Python和C++。平时喜欢看书写作、运动、画画。崇尚技术自由，崇尚思想自由。出版书籍：《Tomcat内核设计剖析》、《图解数据结构与算法》
XTDrone仿真——无人机能够在gazebo中出现，可以连接，但无法起飞 Perishell XTDrone仿真 PX4 Mavros 无人机 XTDrone PX4
参考文章：解决XTDrone中无人机无法起飞的问题_xtdrone视觉里程计飞机会乱飞-CSDN博客
Python与人工智能：为何它们是天作之合？纪至训至 python 人工智能开发语言
引言在人工智能（AI）飞速发展的今天，Python已成为这一领域的“明星语言”。从机器学习到深度学习，从自然语言处理到计算机视觉，Python的身影无处不在。那么，Python究竟为何能成为AI开发的首选工具？本文将探讨Python与AI之间的深度关联，并解析其背后的原因。1.Python的简洁性与可读性AI开发的核心在于快速迭代和实验，而Python以其简洁的语法和直观的代码结构著称。开发者无需
基于YOLOv5的车牌识别系统：从数据集到UI界面的实现深度学习&目标检测实战项目 YOLOv5实战项目 YOLO ui 分类数据挖掘目标跟踪
1.引言随着智能交通系统的发展，车牌识别技术已成为交通管理、停车场自动化、路面监控等应用中的关键技术之一。车牌识别系统（LicensePlateRecognition,LPR）主要用于识别车辆的车牌号码，并将其转化为可以进一步处理的数据。车牌识别系统通常由图像处理、字符识别、目标检测等多种技术组成。近年来，随着深度学习技术的飞速发展，基于卷积神经网络（CNN）的目标检测算法，如YOLO（YouOn
Python深度学习033：Python、PyTorch、CUDA和显卡驱动之间的关系若北辰 Python深度学习 python 深度学习 pytorch
Python、PyTorch、CUDA和显卡驱动之间的关系相当紧密，它们共同构成了一个能够执行深度学习模型的高效计算环境。下面是它们之间关系的简要概述：PythonPython是一种编程语言，广泛用于科学计算、数据分析和机器学习。它是开发和运行PyTorch代码的基础环境。PyTorchPyTorch是一个开源的机器学习库，用于应用如自然语言处理和计算机视觉的深度学习模型。它提供了丰富的API，使
playWright学习总结 one day321 python 开发语言
注意，这里并没有学过selenium自动化。playwright对比selenium来说，不需要不断下载驱动。且playWright最大的优点是可以录制操作，并自动生成自动化脚本。视频：快速上手-3-示例_哔哩哔哩_bilibili资料：Xpath/Role/视觉定位方法-白月黑羽安装：直接使用命令安装：pipinstallplaywright安装需要的浏览器：playwrightinstall安
android 基于OpenCV4.8微笑检测自动拍照 mmsx android 作业源码分享 android opencv
一，前言1、基于OpenCV4.8微笑检测自动拍照存储2、左侧有一个预览小框，有人脸时候会有红色框框。3、当真人入境时候，微笑。相机预览捕捉到了人的微笑，自动拍照保存。opencv库的编译就不说了。这篇有介绍：androidopencv导入进行编译_编译androidopencv-CSDN博客二、加载人脸特征和微笑特征文件faceCascade=loadCascade(R.raw.haarcasc
传统笔触与算法洪流：AI时代的艺术创作挑战人工智能aigc
一、传统与AI的抉择当油画刀与代码编辑器在工作室共存，关于创作方式的争论早已超越工具选择的表层。纽约视觉艺术学院的研究表明，78%的职业艺术家同时使用传统媒介与数字工具，这种混合工作流的创作效率比单一模式高出53%。真正的命题并非"二选一"，而在于如何让两种创作维度形成共生关系。传统创作的本质是物质性实践——画笔与画布的摩擦、水墨在宣纸上的晕染轨迹，这些物理交互产生的不可控性，构成了艺术的呼吸感。
AI基于深度学习的代码搜索案例（一）人工智能MOS 人工智能深度学习机器学习
1.背景近年来，人工智能逐渐进入各个领域并展现出了强大的能力。在计算机视觉领域，以ImageNet为例，计算机的图像分类水平已经超过了人类。在自然语言处理(NLP)领域，BERT、XLNet以及MASS也一遍遍的刷新着任务榜单。当人工智能进入游戏领域，也取得了惊人的成绩，在Atari系列游戏中，计算机很容易超过了大部分人类，在围棋比赛中，AlphaGo和AlphaZero也已经超越了人类顶尖棋手。
02_LVGL学习笔记：深理解样式（Style）机制与应用方法电科周杰伦嵌入式开发 LVGL LVGL 嵌入式开发 UI设计
样式在LVGL中，样式（Style）是用来控制对象（控件）外观的核心机制,涵盖了颜色、边框、背景、文字、阴影、渐变、圆角等视觉特性。通过样式，你可以轻松地为不同状态（如正常、按下、禁用等）指定不同的外观效果。1.样式的基本概念1.1样式对象（lv_style_t）样式对象中包含若干可配置的视觉属性，例如背景色、边框宽度、文字颜色、阴影、圆角等。每个属性都可以通过相关的API（如lv_style_s
uniapp，自绘仪表盘组件（基础篇）智驾 uniapp项目实战 uni-app 仪表
文章目录一、为什么需要自绘仪表盘？二、准备知识三、实现基础仪表盘1.组件模板结构2.核心绘制逻辑3.样式优化四、使用示例五、核心实现原理六、扩展方向七、常见问题一、为什么需要自绘仪表盘？在物联网、数据监控等场景中，仪表盘是常见的数据可视化组件。uniapp的组件市场虽然有许多现成方案，但自绘组件具有以下优势：完全掌控视觉效果无依赖零冗余高性能Canvas渲染轻松适配多端二、准备知识基础Canvas
67-OpenCVSharp 创建实现Halcon的tile_images_offset算子（用于图像拼接，对每张图像设置偏移量）搬码驿站 #opencv 计算机视觉人工智能算法图像处理
以下是基于OpenCvSharp实现的Halcontile_images_offset算子的高性能函数。该函数不仅支持图像拼接，还允许对每张图像设置偏移量（offset），以灵活布局图像。代码中包含了详细注释和性能优化策略。为了优化运行时间和性能，我们可以从以下几个方面对代码进行改进：并行处理：利用多核CPU的能力，通过Parallel.For或其他并行技术加速图像复制操作。减少边界检查开销：在确
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc

遍历opencv中的mat像素的几种方法和概念

你可能感兴趣的:(图像处理,OpenCv,视觉)