KFPA

OpenCV+OCR文字识别

需配置好OpenCV和OCR环境下运行

1、opencv简介

OpenCV的全称是Open Source Computer Vision Library，是一个跨平台的计算机视觉库。

OpenCV用C++语言编写，它的主要接口也是C++语言，但是依然保留了大量的C语言接口。该库也有大量的Python, Java and MATLAB/OCTAVE (版本2.5)的接口。这些语言的API接口函数可以通过在线文档获得。现在也提供对于C#, Ruby的支持。

它有以下特点：

1) 开放的C/C++源码

2) 基于Intel处理器指令集开发的优化代码

3) 统一的结构和功能定义

4) 强大的图像和矩阵运算能力

5) 方便灵活的用户接口

6）同时支持MS-WINDOWS、Linux平台

作为一个基本的计算机视觉、图像处理和模式识别的开源项目，OPENCV可以直接应用于很多领域，作为第二次开发的理想工具。

2、OCR简介

OCR （Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率，是OCR最重要的课题，ICR（Intelligent Character Recognition）的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有：拒识率、误识率、识别速度、用户界面的友好性，产品的稳定性，易用性及可行性等。

3、OpenCV.jar包对图像实现灰度化原理

我们知道，在一个24位彩色图像中，每个像素由三个字节表示，通常表示为RGB。通常，许多24位彩色图像存储为32位图像，每个像素多余的字节存储为一个alpha值，表现有特殊影响的信息。在RGB模型中，如果R=G=B时，则彩色表示一种灰度颜色，其中R=G=B的值叫灰度值，因此，灰度图像每个像素只需一个字节存放灰度值（又称强度值、亮度值），灰度范围为0-255。这样就得到一幅图片的灰度图。

几种灰度化的方法

①、分量法

将彩色图像中的三分量的亮度作为三个灰度图像的灰度值，可根据应用需要选取一种灰度图像。

F1(i,j) = R(i,j)
F2(i,j) = G(i,j)
F3(i,j) = B(i,j)

代码示例：

import cv2.cv as cv

image = cv.LoadImage('mao.jpg')

b = cv.CreateImage(cv.GetSize(image), image.depth, 1)

g = cv.CloneImage(b)

r = cv.CloneImage(b)

cv.Split(image, b, g, r, None)

cv.ShowImage('a_window', r)

cv.WaitKey(0)

②、最大值法

将彩色图像中的三分量亮度的最大值作为灰度图的灰度值。

F(i,j) = max(R(i,j), G(i,j), B(i,j))

代码示例：

image = cv.LoadImage('mao.jpg')

new = cv.CreateImage(cv.GetSize(image), image.depth, 1)for i in range(image.height):

for j in range(image.width):

new[i,j] = max(image[i,j][0], image[i,j][1], image[i,j][2])

cv.ShowImage('a_window', new)

cv.WaitKey(0)

③、平均值法

将彩色图像中的三分量亮度求平均得到一个灰度值。

F(i,j) = (R(i,j) + G(i,j) + B(i,j)) / 3

代码示例：

image = cv.LoadImage('mao.jpg')

new = cv.CreateImage(cv.GetSize(image), image.depth, 1)for i in range(image.height):

for j in range(image.width):

new[i,j] = (image[i,j][0] + image[i,j][1] + image[i,j][2])/3

cv.ShowImage('a_window', new)

cv.WaitKey(0)

④、加权平均法

根据重要性及其它指标，将三个分量以不同的权值进行加权平均。由于人眼对绿色的敏感最高，对蓝色敏感最低，因此，按下式对RGB三分量进行加权平均能得到较合理的灰度图像。

F(i,j) = 0.30R(i,j) + 0.59G(i,j) + 0.11B(i,j))

代码示例：

image = cv.LoadImage('mao.jpg')

new = cv.CreateImage(cv.GetSize(image), image.depth, 1)for i in range(image.height):

for j in range(image.width):

new[i,j] = 0.3 * image[i,j][0] + 0.59 * image[i,j][1] + 0.11 * image[i,j][2]

cv.ShowImage('a_window', new)

cv.WaitKey(0)

上面的公式可以看出绿色（G 分量）所占的比重比较大，所以有时候也会直接取G 分量进行灰度化。

代码示例：

image = cv.LoadImage('mao.jpg')

new = cv.CreateImage(cv.GetSize(image), image.depth, 1)for i in range(image.height):

for j in range(image.width):

new[i,j] = image[i,j][1]

cv.ShowImage('a_window', new)

cv.WaitKey(0)

而OpenCV的Java实现中采用的是加权法来实现图片的灰度化。

4、OpenCV.jar包对图像进行二值化处理原理

图像的二值化处理就是将图像上的点的灰度置为0或255，也就是将整个图像呈现出明显的黑白效果。即将256个亮度等级的灰度图像通过适当的阈值选取而获得仍然可以反映图像整体和局部特征的二值化图像。在数字图像处理中，二值图像占有非常重要的地位，特别是在实用的图像处理中，以二值图像处理实现而构成的系统是很多的，要进行二值图像的处理与分析，首先要把灰度图像二值化，得到二值化图像，这样子有利于在对图像做进一步处理时，图像的集合性质只与像素值为0或255的点的位置有关，不再涉及像素的多级值，使处理变得简单，而且数据的处理和压缩量小。为了得到理想的二值图像，一般采用封闭、连通的边界定义不交叠的区域。所有灰度大于或等于阈值的像素被判定为属于特定物体，其灰度值为255表示，否则这些像素点被排除在物体区域以外，灰度值为0，表示背景或者例外的物体区域。如果某特定物体在内部有均匀一致的灰度值，并且其处在一个具有其他等级灰度值的均匀背景下，使用阈值法就可以得到比较的分割效果。如果物体同背景的差别表现不在灰度值上（比如纹理不同），可以将这个差别特征转换为灰度的差别，然后利用阈值选取技术来分割该图像。动态调节阈值实现图像的二值化可动态观察其分割图像的具体结果。

5、OpenCV.jar包对图像进行腐蚀处理原理

对二值图腐蚀过程：

在下图中，左边是被处理的图象X(二值图象，我们针对的是黑点)，中间是结构元素B，那个标有origin的点是中心点，即当前处理元素的位置。腐蚀的方法是，拿B的中心点和X上的点一个一个地对比，如果B上的所有点（指的是所有黑点）都在X的范围内（即X图上处理元素所在的位置以及它上，左两个点都是黑色），则该点保留，否则将该点去掉（变为白点）；右边是腐蚀后的结果。可以看出，它仍在原来X的范围内，且比X包含的点要少，就像X被腐蚀掉了一层。

对灰度图像的腐蚀：

如下图，左边是要处理图像，中间是结构元素，右边是与对应每个像素的灰度值。

处理过程就是：与上面的B一样，中间是要处理的元素所在的位置，三个1所在的位置对应三个灰度值，然后将中间这个1对应的灰度值改成这三个最小的，如源图像第一个灰度值1，它上左都没有灰度值，所以最小就是它本身，所以输出也是1，再比如处理灰度值为22那个点的时候，上面是7左边是44，所以22应改为7。

6、OCR识别提取图片中文字原理

· 预处理：对包含文字的图像进行处理以便后续进行特征提取、学习。这个过程的主要目的是减少图像中的无用信息，以便方便后面的处理。在这个步骤通常有：灰度化（如果是彩色图像）、降噪、二值化、字符切分以及归一化这些子步骤。经过二值化后，图像只剩下两种颜色，即黑和白，其中一个是图像背景，另一个颜色就是要识别的文字了。降噪在这个阶段非常重要，降噪算法的好坏对特征提取的影响很大。字符切分则是将图像中的文字分割成单个文字——识别的时候是一个字一个字识别的。如果文字行有倾斜的话往往还要进行倾斜校正。归一化则是将单个的文字图像规整到同样的尺寸，在同一个规格下，才能应用统一的算法。

· 特征提取和降维：特征是用来识别文字的关键信息，每个不同的文字都能通过特征来和其他文字进行区分。对于数字和英文字母来说，这个特征提取是比较容易的，因为数字只有10个，英文字母只有52个，都是小字符集。对于汉字来说，特征提取比较困难，因为首先汉字是大字符集，国标中光是最常用的第一级汉字就有3755个；第二个汉字结构复杂，形近字多。在确定了使用何种特征后，视情况而定，还有可能要进行特征降维，这种情况就是如果特征的维数太高（特征一般用一个向量表示，维数即该向量的分量数），分类器的效率会受到很大的影响，为了提高识别速率，往往就要进行降维，这个过程也很重要，既要降低维数吧，又得使得减少维数后的特征向量还保留了足够的信息量（以区分不同的文字）。

· 分类器设计、训练和实际识别：分类器是用来进行识别的，就是对于第二步，对一个文字图像，提取出特征给，丢给分类器，分类器就对其进行分类，告诉你这个特征该识别成哪个文字。

· 后处理：后处理是用来对分类结果进行优化的，第一个，分类器的分类有时候不一定是完全正确的（实际上也做不到完全正确），比如对汉字的识别，由于汉字中形近字的存在，很容易将一个字识别成其形近字。后处理中可以去解决这个问题，比如通过语言模型来进行校正——如果分类器将“在哪里”识别成“存哪里”，通过语言模型会发现“存哪里”是错误的，然后进行校正。第二个，OCR的识别图像往往是有大量文字的，而且这些文字存在排版、字体大小等复杂情况，后处理中可以尝试去对识别结果进行格式化，比如按照图像中的排版排列什么的，举个栗子，一张图像，其左半部分的文字和右半部分的文字毫无关系，而在字符切分过程中，往往是按行切分的，那么识别结果中左半部分的第一行后面会跟着右半部分的第一行诸如此类。

代码：

TestOcr类：

[java]  view plain 
      copy 
     
 package com.njupt.yangmaohu;  
   
 import java.io.File;  
 import java.io.IOException;  
   
 public class TestOcr {  
   
     public static void main(String[] args) {  
         // TODO 自动生成的方法存根  
         //输入图片地址    
         String path = "G:/ka.jpg";    
         PictureManage pictureManage = new PictureManage(path); //对图片进行处理  
         pictureManage.imshow();  
         try {       
             String valCode = new OCR().recognizeText(new File("xintu.jpg"), "jpg");//jpg是图片格式       
             System.out.println("图片中文字为："+"\n"+valCode);       
         } catch (IOException e) {       
             e.printStackTrace();       
         } catch (Exception e) {    
             e.printStackTrace();    
         }        
     }    
   
 }  

PictureManage类：

[java]  view plain 
      copy 
     
 package com.njupt.yangmaohu;  
   
 import java.awt.Graphics;  
 import java.awt.Image;  
 import java.awt.image.BufferedImage;  
 import java.awt.image.DataBufferByte;  
 import java.io.File;  
 import java.io.IOException;  
   
 import javax.imageio.ImageIO;  
 import org.opencv.core.Core;  
 import org.opencv.core.CvType;  
 import org.opencv.core.Mat;  
 import org.opencv.core.Size;  
 import org.opencv.highgui.Highgui;  
 import org.opencv.imgproc.Imgproc;  
   
 public class PictureManage {  
     private Mat image;  
     //private JLabel jLabelImage;  
     public PictureManage(String fileName) {  
         System.loadLibrary(Core.NATIVE_LIBRARY_NAME);  
         this.image= Highgui.imread(fileName);  
     }  
       
   
       
     /** 
      * 图片画质处理 
      * @param image 
      * @return 
      */  
     public static Mat setMatImage(Mat image) {  
         Mat loadeMatImage = new Mat();  
         //灰度处理  
         Imgproc.cvtColor(image,image,Imgproc.COLOR_RGB2GRAY);  
         //二值化处理  
         Mat binaryMat = new Mat(image.height(), image.width(), CvType.CV_8UC1);  
         Imgproc.threshold(image, binaryMat,20, 300, Imgproc.THRESH_BINARY);  
           
         //图像腐蚀  
         Mat element = Imgproc.getStructuringElement(Imgproc.MORPH_RECT,   
                 new Size(500,500));  
         Imgproc.erode(binaryMat, image,element);  
         //loadeMatImage = image;  
         loadeMatImage = binaryMat;  
         return loadeMatImage;  
     }  
       
     /** 
      * Mat转image 
      * @param matrix 
      * @return 
      */  
     private Image toBufferedImage(Mat matrix) {  
         int type = BufferedImage.TYPE_BYTE_GRAY;  
         if (matrix.channels()>1) {  
             type = BufferedImage.TYPE_3BYTE_BGR;  
         }  
         int bufferSize = matrix.channels()*matrix.cols()*matrix.rows();  
         byte[] buffer = new byte[bufferSize];  
         matrix.get(0, 0, buffer);  
         BufferedImage image = new BufferedImage(matrix.cols(), matrix.rows(),type);  
         final byte[] targetPxiels = ((DataBufferByte)image.getRaster().getDataBuffer()).getData();  
         System.arraycopy(buffer, 0, targetPxiels, 0, buffer.length);  
         return image;  
     }  
       
     /*** 
      * 将Image变量保存成图片 
      * @param im 
      * @param fileName 
      */  
     public  void  saveImage(Image im ,String  fileName) {  
         int w = im.getWidth(null);  
         int h = im.getHeight(null);  
         BufferedImage bi = new BufferedImage(w, h, BufferedImage.TYPE_3BYTE_BGR);  
         Graphics g = bi.getGraphics();  
         g.drawImage(im, 0, 0, null);  
         try {  
             ImageIO.write(bi, "jpg", new File(fileName));  
         } catch (IOException e) {  
             e.printStackTrace();  
         }  
     }  
       
     /** 
      * 图片处理 
      * @param args 
      */  
     public void  imshow(){  
           
         //添加原图  
         Image originalImage = toBufferedImage(image);  
         saveImage(originalImage, "yuantu.jpg");  
         //jLabelImage.setIcon(new ImageIcon(originalImage));  
         //添加处理图  
          Mat mat1 = setMatImage(image);  
         Image newImage = toBufferedImage(mat1);  
         saveImage(newImage, "xintu.jpg");  
     }  
       
 }  

ImageIOHelper类：

[java]  view plain 
      copy 
     
 package com.njupt.yangmaohu;  
   
   
 import java.awt.image.BufferedImage;    
 import java.io.File;    
 import java.io.IOException;    
 import java.util.Iterator;    
 import java.util.Locale;    
   
 import javax.imageio.IIOImage;    
 import javax.imageio.ImageIO;    
 import javax.imageio.ImageReader;    
 import javax.imageio.ImageWriteParam;    
 import javax.imageio.ImageWriter;    
 import javax.imageio.metadata.IIOMetadata;    
 import javax.imageio.stream.ImageInputStream;    
 import javax.imageio.stream.ImageOutputStream;    
   
 import com.sun.media.imageio.plugins.tiff.TIFFImageWriteParam;   
   
 public class ImageIOHelper {    
     /**  
      * 图片文件转换为tif格式  
      * @param imageFile 文件路径  
      * @param imageFormat 文件扩展名  
      * @return  
      */    
     public static File createImage(File imageFile, String imageFormat) {    
         File tempFile = null;    
         try {    
             Iterator readers = ImageIO.getImageReadersByFormatName(imageFormat);    
             ImageReader reader = readers.next();    
   
             ImageInputStream iis = ImageIO.createImageInputStream(imageFile);    
             reader.setInput(iis);    
             //Read the stream metadata    
             IIOMetadata streamMetadata = reader.getStreamMetadata();    
   
             //Set up the writeParam    
             TIFFImageWriteParam tiffWriteParam = new TIFFImageWriteParam(Locale.CHINESE);    
             tiffWriteParam.setCompressionMode(ImageWriteParam.MODE_DISABLED);    
   
             //Get tif writer and set output to file    
             Iterator writers = ImageIO.getImageWritersByFormatName("tiff");    
             ImageWriter writer = writers.next();    
   
             BufferedImage bi = reader.read(0);    
             IIOImage image = new IIOImage(bi,null,reader.getImageMetadata(0));    
             tempFile = tempImageFile(imageFile);    
             ImageOutputStream ios = ImageIO.createImageOutputStream(tempFile);    
             writer.setOutput(ios);    
             writer.write(streamMetadata, image, tiffWriteParam);    
             ios.close();    
   
             writer.dispose();    
             reader.dispose();    
   
         } catch (IOException e) {    
             e.printStackTrace();    
         }    
         return tempFile;    
     }    
   
     private static File tempImageFile(File imageFile) {    
         String path = imageFile.getPath();    
         StringBuffer strB = new StringBuffer(path);    
         strB.insert(path.lastIndexOf('.'),0);    
         return new File(strB.toString().replaceFirst("(?<=//.)(//w+)$", "tif"));    
     }    
 }  

OCR类：

[java]  view plain 
      copy 
     
 package com.njupt.yangmaohu;  
   
 import java.io.BufferedReader;    
 import java.io.File;    
 import java.io.FileInputStream;    
 import java.io.InputStreamReader;    
 import java.util.ArrayList;    
 import java.util.List;    
     
 import org.jdesktop.swingx.util.OS;    
     
 public class OCR {    
     private final String LANG_OPTION = "-l";  //英文字母小写l，并非数字1    
     private final String EOL = System.getProperty("line.separator");    
     private String tessPath = "C://Program Files (x86)//Tesseract-OCR";//tesseract-ocr安装地址    
     //private String tessPath = new File("tesseract").getAbsolutePath();    
         
     public String recognizeText(File imageFile,String imageFormat)throws Exception{    
         File tempImage = ImageIOHelper.createImage(imageFile,imageFormat);    
         File outputFile = new File(imageFile.getParentFile(),"output");    
         StringBuffer strB = new StringBuffer();    
         List cmd = new ArrayList();    
         if(OS.isWindowsXP()){    
             cmd.add(tessPath+"//tesseract");    
         }else if(OS.isLinux()){    
             cmd.add("tesseract");    
         }else{    
             cmd.add(tessPath+"//tesseract");    
         }    
         cmd.add("");    
         cmd.add(outputFile.getName());    
         //cmd.add(LANG_OPTION);    
         //cmd.add("chi_sim");    
         //cmd.add("eng");    
             
         ProcessBuilder pb = new ProcessBuilder();    
         pb.directory(imageFile.getParentFile());    
             
         cmd.set(1, tempImage.getName());    
         pb.command(cmd);    
         pb.redirectErrorStream(true);    
             
         Process process = pb.start();    
         //tesseract.exe 1.jpg 1 -l chi_sim    
         int w = process.waitFor();    
             
         //删除临时正在工作文件    
         tempImage.delete();    
             
         if(w==0){    
             BufferedReader in = new BufferedReader(new InputStreamReader(new FileInputStream(outputFile.getAbsolutePath()+".txt"),"UTF-8"));    
                 
             String str;    
             while((str = in.readLine())!=null){    
                 strB.append(str).append(EOL);    
             }    
             in.close();    
         }else{    
             String msg;    
             switch(w){    
                 case 1:    
                     msg = "Errors accessing files.There may be spaces in your image's filename.";    
                     break;    
                 case 29:    
                     msg = "Cannot recongnize the image or its selected region.";    
                     break;    
                 case 31:    
                     msg = "Unsupported image format.";    
                     break;    
                 default:    
                     msg = "Errors occurred.";    
             }    
             tempImage.delete();    
             //throw new RuntimeException(msg);    
         }    
         new File(outputFile.getAbsolutePath()+".txt").delete();    
         return strB.toString();    
     }    
 }    

从opencv-python入门opencv--GUI功能之绘图&鼠标与图像界面的交互这是一个图像 python 计算机外设 opencv GUI 计算机视觉图像处理交互
从opencv-python入门opencv--GUI功能之绘图和鼠标操作一、文章介绍二、opencv绘制直线、矩形、圆形1、cv.line()2、cv.circle()3、cv.rectangle()4、在图像上绘制直线、矩形和圆形5、cv.ellipse()（在空白画布上绘制椭圆）（1）img=cv.ellipse(img,center,axes,angle,startAngle,endAng
Ubuntu20.04 ros-noetic下opencv多版本问题may conflict with libopencv_highgui.so.4.2 JANGHIGH 小技巧 OpenCV opencv 人工智能计算机视觉
Ubuntu20.04ros-noetic下opencv多版本问题问题解决情况1情况2方法当前终端生效将上述命令添加到~/.bashrc中，使其永久生效问题当编译某程序包时，出现如下警告，但是编译通过。/usr/bin/ld:warning:libopencv_highgui.so.406,neededby/lidar_slam_ws/devel/lib/libvikit_common.so,ma
3.4.4- 先颜色后形状的方式 STM32串口通信 openmv+STM32串口通信 openmv串口通信openmv识别物体 openmv神经网络训练 openmv数字识好家伙VCC stm32 神经网络嵌入式硬件单片机硬件工程 51单片机嵌入式实时数据库
非常详细的视频和文字教程，讲解常见的openmv教程包括巡线、物体识别、圆环识别、阈值自动获取等。非常适合学习openmv、K210、K230等项目视频合集链接在:openmv教程合集openmv入门到项目开发openmv和STM32通信openmv和opencv区别openmv巡线openmv数字识别教程LCD3.4.4-先颜色后形状的方式可以再试试先颜色后形状的识别方式。importsenso
3.4.5-识别形状+颜色+增加最小变化阈值 STM32串口通信 openmv+STM32串口通信 openmv串口通信openmv识别物体 openmv神经网络训练 openmv数字识好家伙VCC stm32 神经网络嵌入式硬件硬件工程单片机机器学习人工智能
非常详细的视频和文字教程，讲解常见的openmv教程包括巡线、物体识别、圆环识别、阈值自动获取等。非常适合学习openmv、K210、K230等项目视频合集链接在:openmv教程合集openmv入门到项目开发openmv和STM32通信openmv和opencv区别openmv巡线openmv数字识别教程LCD3.4.5-识别形状+颜色+增加最小变化阈值在形状+颜色的识别效果中，发现小球是不动，
pyQT学习笔记-----pushbutton控制Graphics view内对象移动汉东省长达康 pyQT pyQT Graphics view pushbutton控制移动
pyQT学习笔记-----pushbutton控制Graphicsview内对象移动引言项目需要制作一个美观，大气，高逼格的控制界面，出于项目的需要，以及本人对于python语言的掌握程度远高于C，所以果断采用了python+pyQT这个框架，今天本人终于完成了这个控制系统二维操作的动态显示，历时三个周，前前后后试过很多的方法。第一种尝试：从lable显示图片开始，接着使用openCV，用labl
3.2.2-增加 + 缓冲区显示结果 openmv巡线循迹黑线循迹红线循迹 openmv循迹小车 openmv+STM32循迹小车循迹赛道视觉循迹好家伙VCC stm32 嵌入式硬件单片机
3.2.2-增加+缓冲区显示结果非常详细的视频和文字教程，讲解常见的openmv教程包括巡线、物体识别、圆环识别、阈值自动获取等。非常适合学习openmv、K210、K230等项目视频合集链接在:openmv教程合集openmv入门到项目开发openmv和STM32通信openmv和opencv区别openmv巡线openmv数字识别教程LCD上面的代码识别后结果输出在串行终端还是不够直观，我们可
OpenCV Python 版使用教程（三）摄像头读取延迟解决方法 tianchengwang opencv opencv python 人工智能
文章目录一、上篇回顾二、产生原因三、解决方法1.cap.grab()方法2.多线程法总结一、上篇回顾在上一篇中，简单介绍了如何使用OpenCV操作摄像头，本期来讲在摄像头读取时，可能会出现画面延迟的解决方法。二、产生原因OpenCV在读取的时候，会将视频流放在缓冲区中，然后每次调用的时候，会从缓冲区内读取视频帧。虽然说大多数情况难以出现写入缓冲区远大于读取缓冲区的速度，但是当设备出现性能瓶颈，尤其
《OpenCV》——人脸检测 Kai HVZ opencv 人工智能计算机视觉
人脸检测级联分离器具体实现实例（人脸检测）本实例对合照图片进行人脸检测，并圈出人脸位置，使用的OpenCV自带的级联分类器可从OpenCV源文件的data目录下，加载不同的级联分类器的XML文件对不同对象的检测。代码实现python#导入OpenCV库，用于计算机视觉任务，如读取图像、图像处理和显示图像等importcv2#使用cv2.imread函数读取指定路径下的图像文件'hezhao.jpg
OpenCV计算摄影学（10）将一组不同曝光的图像合并成一张高动态范围（HDR）图像的实现类cv::MergeDebevec 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述resultingHDR图像被计算为考虑了曝光值和相机响应的各次曝光的加权平均值。cv::MergeDebevec是OpenCV中用于将一组不同曝光的图像合并成一张高动态范围（HDR）图像的具体实现类之一。它基于PaulDebevec提出的方法，通过利用相机响应函
android java opencv_OpenCV On Android最佳环境配置指南(Eclipse篇) yuhang555 android java opencv
注：本篇文章作者已不再维护，毕竟现在使用Eclipse的Android程序员少之又少，所以我将只维护AndroidStudio篇。如果你坚持用Eclipse，请确保所有环境与本文章一致。简介本教程是经过本人多次踩坑，并参考网上众多OpenCVOnAndroid的配置教程总结而来，尽希望能帮助学习移动图像处理的朋友们少走弯路。这也是本人第一次在简书上发布文章，如有不足，希望各位dalao能够指正，我
OpenCV 入门（六） —— Android 下的人脸识别 tmacfrank Android #NDK opencv android 人工智能
OpenCV入门系列：OpenCV入门（一）——OpenCV基础OpenCV入门（二）——车牌定位OpenCV入门（三）——车牌筛选OpenCV入门（四）——车牌号识别OpenCV入门（五）——人脸识别模型训练与Windows下的人脸识别OpenCV入门（六）——Android下的人脸识别OpenCV入门（七）——身份证识别本篇我们来介绍在Android下如何实现人脸识别。上一篇我们介绍了如何在W
OpenCV给图像添加噪声村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述如果你已经有了一张干净的图像，并希望通过编程方式向其添加噪声，可以使用OpenCV来实现这一点。以下是一个简单的例子，展示如何在现有图像上添加高斯噪声：#include#includeusingnamespacecv;usingnamespacestd;//函数：
OpenCV计算摄影学（7）HDR成像之多帧图像对齐的类cv::AlignMTB 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述该算法将图像转换为‌中值阈值位图‌（MedianThresholdBitmap，MTB）：1.位图生成‌：计算图像‌亮度中值‌作为全局阈值‌2亮度高于中值的像素标记为1，否则标记为0，形成二值位图‌2.位操作对齐‌：通过位移（bit-shifting）和异或（XO
探索高效图像处理：Android原生OpenCV开发指南农隆龙
探索高效图像处理：Android原生OpenCV开发指南native-opencv-android-templateAtutorialforsettingupOpenCV4.6.0(andother4.x.yversion)forAndroidinAndroidStudiowithNativeDevelopmentKit(NDK)supportforC++development.项目地址:http
【附源码】基于opencv+pyqt5搭建的人脸识别系统 ~啥也不会~ opencv 人工智能计算机视觉人脸识别 pyqt
文章目录前言一、人脸检测二、人脸识别1.训练识别器2.识别人脸三、界面相关1.Qlabel展示图片2.表格跟随内容而增加和减少3.选择图片文件4.警告框四、源码获取总结前言人脸识别技术作为人工智能领域的一颗璀璨明珠，正逐渐渗透到我们生活的每一个角落，从智能手机的解锁到机场的快速通关，从金融交易的安全认证到智慧城市的高效管理，它正以其独特的优势和强大的功能，为我们的生活带来前所未有的便捷与安全。本篇
Android OpenCV开发详细指南缘来的精彩 android opencv 人工智能
如何在Android上使用OpenCV进行开发，需要详细的说明。首先，我需要确定用户的基础，可能是一个有一定Android开发经验的开发者，但对OpenCV不太熟悉。可能需要从环境搭建开始，到基础功能实现，再到高级应用的全流程指导。首先，我应该考虑如何集成OpenCV到Android项目中。常见的方法有两种：使用OpenCVAndroidSDK或者通过Gradle依赖。对于新手来说，Gradle依
Python从0到100（六十八）：Python OpenCV-图像边缘检测及图像融合是Dream呀 opencv python 计算机视觉
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Visual studio 2022配置OpenCV环境及初级使用小镇柠檬先生 OpenCV opencv visual studio 计算机视觉人工智能 c++
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档目录一、下载OpenCV二、配置环境变量三，在VS2022上面配置OpenCV四，测试及OpenCV的初级使用1.图像显示总结前言提示：这里可以添加本文要记录的大概内容：博主写一下自己在VS2022上面配置OpenCV环境及一些初级使用的案例，供自己保存和帮助想要入门OpenCV的人一起学习。提示：以下是本篇文章正文内容，下面案例可供
visual studio 2022 C++ OpenCV开发环境配置(详细教程） Roc-xb visual studio c++opencv
本章教程，主要介绍如何在visualstudio2022中使用opencv。一、下载opencv下载地址：https://opencv.org/releases/选择Windows版本进行下载。下载之后，双击进行安装到指定磁盘中就可以了。二、配置环境变量我是将OpenCV安装到D盘中的，如果你不是安装到D盘的，需要改成你的OpenCV安装目录路径。D:\opencv\build
opencv 自适应阈值虚假程序设计 opencv 人工智能计算机视觉
需要安装扩展库opencv-contrib-pythonCV_class.pyimportcv2importnumpyasnp#importserialimportos,sysfromdatetimeimportdatetimeimport_threadimportthreadingimporttimeimportwin32ui#只有windows能用.#fromCV_classimport*de
OpenCV开源机器视觉软件视觉人机器视觉杂说 opencv 开源人工智能
OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库，广泛应用于实时图像处理、视频分析、物体检测、人脸识别等领域。它由英特尔实验室于1999年发起，现已成为计算机视觉领域最流行的工具之一，支持多种编程语言（如C++、Python、Java）和操作系统（Windows、Linux、macOS、Android、iOS）。核心功能图像处理基
【openCV-89】人脸检测华东算法王华东算法王-opencv opencv 人工智能计算机视觉
人脸检测简介人脸检测是计算机视觉中的一个重要任务，旨在从图像或视频中识别并定位出人脸的位置。人脸检测不仅是人脸识别、表情分析、面部特征点检测等高级任务的前置步骤，而且在安防监控、智能家居、自动驾驶等多个领域都具有广泛应用。人脸检测的目标人脸检测的目标是从输入的图像或视频流中自动检测出所有人脸的区域，通常用矩形框（boundingbox）表示人脸的位置。人脸检测不仅要识别图像中的人脸，还要在各种条件
【CodeBlocks】搭建OpenCV环境指南万众珩
【CodeBlocks】搭建OpenCV环境指南CodeBlocks搭建OpenCV环境项目地址:https://gitcode.com/Resource-Bundle-Collection/e1e1a本资源提供了详细的教程，帮助您在CodeBlocks集成开发环境中顺利搭建OpenCV环境。OpenCV是一个开源的计算机视觉和机器学习软件库，广泛应用于图像处理和视频分析领域。通过这篇指南，即便是
VS C++通过路径遍历文件夹图片并生成xml文件并调用贫僧这就还俗、 c++xml
记录一下(每次用到的时候还得去找...)：网上c++生成xml的方法有很多，这里简单介绍以下opencv自带的FileStorage函数使用方法，1、生成xml文件：#include#includeusingnamespacecv;usingnamespacestd;voidimg_save_xml(Stringimg_path,Stringxml_name){FileStoragefile_st
【openCV-66】内参矩阵和外参矩阵华东算法王华东算法王-opencv opencv 矩阵人工智能
外参矩阵与内参矩阵在计算机视觉、相机标定和三维重建等领域，内参矩阵和外参矩阵是描述相机如何将三维世界映射到二维图像的重要工具。它们分别描述了相机的内部特性和外部位置，是相机标定的核心组成部分。1.内参矩阵（IntrinsicMatrix）内参矩阵描述了相机内部的几何特性，主要涉及焦距、光心和像素的比例等参数。它通常是一个3x3的矩阵，用来将相机的归一化坐标系转换为像素坐标系。1.1内参矩阵的组成内
关于CMAKE中查找自定义路径OpenCV的问题 gxsHeeN opencv opencv cmake 多版本
关于CMAKE中查找自定义路径OpenCV的问题前段时间在机器上（ubuntu16.04）安装了ROS_kinetic，因此机器上散布着opencv2.4.9、opencv3.0.0以及ros引入的opencv3.2.0。删掉机器上的opencv2.4.9之后，发现使用cmake编译opencv程序时，总是找到3.2.0的opencv，而不能找到3.0.0(opencv3.0.0make时的CMA
手把手教你如何使用java开发人脸识别及人脸比对（附源码） java人脸识别后端深度学习
痛点目前，常用的人脸识别算法大多基于Python开发，因为Python对深度学习框架的支持较好，且许多优秀的人脸识别算法都是在深度学习框架下实现的。然而，对于Java开发者来说，这种情况并不十分友好。传统上，Java开发的人脸识别算法主要依赖OpenCV，但与基于深度学习的算法相比，OpenCV的精度相对较低。此外，若Java开发者希望使用Python实现的算法，还需要安装Python环境，并且熟
OpenCV计算摄影学（2）图像去噪函数denoise_TVL1() 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述原始-对偶算法是用于解决特定类型变分问题（即，寻找一个函数以最小化某个泛函）的算法。特别地，图像去噪可以被视为一种变分问题，因此可以使用原始-对偶算法来进行去噪，这正是这里实现的内容。需要注意的是，此实现取自2013年7月的一篇博客文章[194]，该文章还包含了（
Opencv之图像SIFT 特征检测与Harris角点检测是十一月末 opencv opencv 计算机视觉人工智能 python 特征检测
图像SIFT特征检测与Harris角点检测目录图像SIFT特征检测与Harris角点检测1SIFT特征检测1.1概念1.2主要步骤1.3优缺点1.4函数及参数2Harris角点检测2.1概念2.2**算法思想**2.3特点2.4函数及参数3角点、特征检测3.1焦点、特征检测代码及结果1SIFT特征检测1.1概念SIFT（尺度不变特征变换）是一种用于图像处理中检测和描述图像中局部结构的算法。它是由D
kitti数据集【图片、点云、IMU、GPS】话题发布（kitti2bag方式+python源码方式） liiiuzy ROS学习 python
kitti数据集传感器话题发布一、前期准备工作kitti数据集转bag安装vscode新建工作环境安装opencv-python二、发布图片三、发布点云数据四、整理前两次的代码五、添加汽车图片和摄像头视角常规写法优化写法六、发布IMU七、发布GPS一、前期准备工作kitti数据集转bag如果只是想把kitti数据集转成bag，直接用kiiti2bag指令就可以完成，教程在下面链接中。后文是详细的代
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，

OpenCV+OCR文字识别

①、分量法

②、 最大值法

③、平均值法

④、加权平均法

你可能感兴趣的:(opencv)

②、最大值法