TYINY

SLAM学习——使用ARUCO_marker进行AR投影

转载自：https://blog.csdn.net/Kalenee/article/details/90148599

SLAM学习——使用ARUCO_marker进行AR投影

white_Learner 2020-06-06 15:24:03 556 收藏 1

分类专栏： SLAM

最后发布:2020-06-06 15:24:03首次发布:2020-06-06 15:24:03

本文链接：https://blog.csdn.net/Kalenee/article/details/90148599

版权

一、简介

1.1 目标

增强现实技术（Augmented Reality，简称 AR），是一种实时地计算摄影机影像的位置及角度并加上相应图像、视频、3D模型的技术，这种技术的目标是在屏幕上把虚拟世界套在现实世界并进行互动。

将三维模型投影到ARUCO marker上，并获取投影效果。

1.2 实现思路

制作并识别ARUCO marker
估计旋转矩阵和平移矩阵
获取模型数据，并根据需要进行缩放和坐标调整
通过projectPoints重投影将三维坐标转换到图像二维坐标
显示图像

二、ARUCO marker

2.1 简介

ARUCO marker为汉明(海明)码的格子图，如下所示：

汉明码（Hamming Code）利用奇偶校验位的概念，通过在数据位后面增加一些比特，可以验证数据的有效性。利用一个以上的校验位，汉明码不仅可以验证数据是否有效，还能在数据出错的情况下指明错误位置。

2.2 原理解析

一个ArUco marker是一个二进制平方标记，它由一个宽的黑边和一个内部的二进制矩阵组成，内部的矩阵决定了它们的id。黑色的边界有利于快速检测到图像，二进制编码可以验证id，并且允许错误检测和矫正技术的应用。marker的大小决定了内部矩阵的大小。例如，一个4x4的marker由16bits组成。

上图为一个典型的ArUco marker，去除白色边框后为5X5的格子（黑色表示0，白色表示1），5X5的格子的外边缘为黑色。

黑白格子遵循下面的排列规则
p d p d p p d p d p p d p d p p d p d p p d p d p \begin{matrix} p & d & p &d &p\\ p & d & p &d &p\\ p & d & p &d &p\\ p & d & p &d &p\\ p & d & p &d &p\\ \end{matrix} pppppdddddpppppdddddppppp

p为校验位：1,3,5列
d为数据位：2,4列，共10位能表示0-1023的数字

用数字01可表示为下面的排列，去除验位后可获得右侧排列，
0 1 0 0 1 1 0 1 1 1 1 0 0 0 0 1 0 1 1 1 0 1 0 0 1 ⇒ 1 0 0 1 0 0 0 1 1 0 \begin{matrix} 0 & 1 & 0 &0 &1\\ 1 & 0 & 1 &1 &1\\ 1 & 0 & 0 &0 &0\\ 1 & 0 & 1 &1 &1\\ 0 & 1 & 0 &0 &1\\ \end{matrix}\Rightarrow \begin{matrix} 1 & 0 \\ 0 & 1 \\ 0 & 0 \\ 0 & 1 \\ 1 & 0 \\ \end{matrix} 0111010001010100101011011⇒1000101010
将数据行行首尾相接后可获得该ArUco marker的id为582
1001000110 ⇒ 582 10 01 00 01 10\Rightarrow582 1001000110⇒582

2.3 ARUCO marker的生成

注意：此处采用opencv的aruco库实现，opencv版本需要3以上，此处使用的是OpenCV3.3.1，下同

函数解析

void cv::aruco::drawMarker(const Ptr< Dictionary > & dictionary,
						   int 	id,
						   int 	sidePixels,
						   OutputArray 	img,
						   int 	borderBits = 1)

dictionary，包含marker对象的字典：

cv::Ptr dictionary = cv::aruco::getPredefinedDictionary(cv::aruco::DICT_6X6_250);

DICT_6X6_250为6x6的marker，该字典包含id为0-249的marker。
id，返回marker的id，需要在设置的字典的范围内。
sidePixels，返回图像的像素值。
img，输出marker图像。
borderBits，marker图像边缘向像素值。

完整程序

#include 
#include 
#include 

#include 
#include 
#include 

using namespace std;
using namespace cv;

void createArucoMarkers() {
  Mat outputMarker;
  int marker_nums = 10;

  // 6x6,id:0~249
  Ptr markerDictionary =
      aruco::getPredefinedDictionary(aruco::DICT_6X6_250);

  for (int i = 0; i < marker_nums; i++) {
    // generate
    cv::aruco::drawMarker(markerDictionary, i, 200, outputMarker, 1);

    // save
    ostringstream convent;
    string imageName = "6X6_Marker_";
    convent << "marker/" << imageName << i << ".jpg";
    imwrite(convent.str(), outputMarker);
  }
}

int main(int argc, char *argv[]) {
  createArucoMarkers();
  return 0;
}

三、姿态估计

姿态估计（Pose estimation）在计算机视觉领域扮演着十分重要的角色：机器人导航、增强现实以及其它。这一过程的基础是找到现实世界和图像投影之间的对应点。

最为常用的方法是基于二进制平方的标记，这种Marker的主要便利之处在于，一个Marker提供了足够多的对应（四个角）来获取相机的信息。同样的，内部的二进制编码使得算法非常健壮，允许应用错误检测和校正技术的可能性。

此处的姿态估计采用PnP（Perspective-n-Point）的方法获得Marker相对相机的旋转矩阵和平移矩阵。

PnP（Perspective-n-Point）是求解3D到2D点对运动的方法。它描述了当我们知道n个3D空间点以及它们的投影位置时，如何估计相机所在的位姿。

3.1 关键函数解析

1. 识别Marker

void cv::aruco::detectMarkers(InputArray 	image,
							  Dictionary 	dictionary,
							  OutputArrayOfArrays 	corners,
							  OutputArray 	ids,
							  DetectorParameters 	parameters = DetectorParameters(),
							  OutputArrayOfArrays 	rejectedImgPoints = noArray()
                              InputArray 	cameraMatrix = noArray(),
							  InputArray 	distCoeff = noArray())

image，待检测marker的图像。
dictionary，字典对象，为需要识别的marker类型，与生成marker时设置的字典对象一致即可。
corners，检测marker获得的包含所有marker四个角点的数组，数据类型为std::vector >，若检测到N个marker，则数组大小为Nx4，角点顺序为顺时针，第一个点为左上角。
ids，检测marker获得的id，大小与corners一致，只能检测包含在字典内的id。
parameters，marker检测所需参数，输入对象类型为 DetectionParameters。
rejectedCandidates，返回被检测出来但不是有效编码的marker，每个返回的marker同样通过四个角点定义，数据格式与corners一致，该参数可忽略，参用于debug模式和refineDetectedMarkers()
cameraMatrix，相机内参数，可省略。
distCoeff，相机畸变参数，可省略。

2. 姿态估计

void cv::aruco::estimatePoseSingleMarkers(InputArrayOfArrays 	corners,
										  float 	markerLength,
										  InputArray 	cameraMatrix,
										  InputArray 	distCoeffs,
										  OutputArrayOfArrays 	rvecs,
										  OutputArrayOfArrays 	tvecs)

corners，识别的包含marker的角点的数组，为detectMarkers() 函数中corners参数的返回值。
markerLength，marker的边长，单位为米。
cameraMatrix，相机内参数，标定获得。
distCoeffs，相机畸变参数，标定获得。
rvecs，markers相对相机的旋转矩阵。
tvecs，markers相对相机的平移矩阵。

markers的坐标系为：矩形中心为坐标原点，红色为X轴，绿色为Y轴，蓝色为Z轴，轴的指向为该轴的正方向。

3.2 程序实现

姿态估计

bool poseEstimation(Mat image, Vec3d &markerRvec, Vec3d &markerTvec, int detectID) {
  // detect marker
  vector ids;
  vector> corners;
  aruco::detectMarkers(image, dictionary, corners, ids);

  // if at least one marker detected
  if (ids.size() > 0) {
    // estimate Pose
    vector rvecs, tvecs;
    aruco::estimatePoseSingleMarkers(corners, 0.05, cameraMatrix, distCoeffs,
                                     rvecs, tvecs);

    // screen out designed marker rvecs and tvecs
    for (int i = 0; i < ids.size(); i++) {
      if (ids[i] == detectID) {
        // save pose
        markerRvec = rvecs[i];
        markerTvec = tvecs[i];
        return true;
      } else
        return false;
    }
  } else
    return false;
}

四、显示模型

4.1 模型准备与读入

三维模型采用普林斯顿三维模型库的数据，该数据库的模型为.off格式，程序内部通过fstream读入。读入前需对文件进行修改处理：直接修改.off格式为.txt，同时删除首行的OFF。

off文件简析

Object File Format(off)文件通过描述物体表面的多边形来表示一个模型的几何结构

格式为：

OFF

顶点数面数边数

x y z

x y z

…

n个顶点顶点1的索引顶点2的索引 … 顶点n的索引

…
程序实现

  // model data
  vector pointData;
  vector> plantData;
 
  // read model
  fstream modelfile;
  modelfile.open("./marker/m100.txt");
  int pointSize, plantSize, lineSize;
  modelfile >> pointSize;
  modelfile >> plantSize;
  modelfile >> lineSize;

  // point data
  for (int i = 0; i < pointSize; i++) {
    Point3f pointTmp;
    modelfile >> pointTmp.x;
    modelfile >> pointTmp.y;
    modelfile >> pointTmp.z;

    // resize model
    pointTmp.x = pointTmp.x / 0.5 * markerLength - (markerLength / 2.0);
    pointTmp.y = pointTmp.y / 0.5 * markerLength - (markerLength / 2.0);
    pointTmp.z = pointTmp.z / 0.5 * markerLength - (markerLength / 2.0);
    pointData.push_back(pointTmp);
  }

  // plant data
  for (int i = 0; i < plantSize; i++) {
    vector plantTmp;
    for (int j = 0; j < 4; j++) {
      int data;
      modelfile >> data;
      plantTmp.push_back(data);
    }
    plantData.push_back(plantTmp);
  }

4.2 重投影

projectPoints()可根据所给的三维坐标和已知的相机内外参数求解投影到图像坐标系上的二维坐标。

void projectPoints(InputArray objectPoints, 
                   InputArray rvec, 
                   InputArray tvec, 
                   InputArray cameraMatrix, 
                   InputArray distCoeffs, 
                   OutputArray imagePoints, 
                   OutputArray jacobian=noArray(), 
                   double aspectRatio=0 )

objectPoints，三维坐标数组。
rvec，旋转向量，通过estimatePoseSingleMarkers获得。
tvec，平移向量，通过estimatePoseSingleMarkers获得。
cameraMatrix，相机内参数。
distCoeffs，相机畸变参数。
imagePoints，返回图像坐标数组。
jacobian，雅克比行列式，
aspectRatio，相机传感器的感光单元有关的可选参数，如果设置为非0，则函数默认感光单元的dx/dy是固定的，会依此对雅可比矩阵进行调整。

4.3 绘制模型

4.3.1 绘制函数解析

1. 绘制坐标

void cv::aruco::drawAxis(InputOutputArray 	image,
						 InputArray 	cameraMatrix,
						 InputArray 	distCoeffs,
						 InputArray 	rvec,
						 InputArray 	tvec,
						 float 	length)

image ，是输入/输出图像，坐标将会绘制在该图像上（通常就是检测marker的那张图像）。
cameraMatrix，相机内参数，标定获得。
distCoeffs ，相机畸变参数，标定获得。
rvec ，外参数，旋转向量。
tvec ，外参数，平移向量。
length，坐标轴的长度，单位为米。

2. 绘制轮廓

void drawContours(InputOutputArray image, 
                  InputArrayOfArrays contours, 
                  int contourIdx, 
                  const Scalar& color, 
                  int thickness=1, 
                  int lineType=LINE_8, 
                  InputArray hierarchy=noArray(), 
                  int maxLevel=INT_MAX, 
                  Point offset=Point() )

3. 绘制线

void line(InputOutputArray img, 
          Point pt1, 
          Point pt2, 
          const Scalar& color, 
          int thickness=1, 
          int lineType=LINE_8, 
          int shift=0 )

4. 绘制点

void circle(InputOutputArray img, 
            Point center, 
            int radius, 
            const Scalar& color, 
            int thickness=1, 
            int lineType=LINE_8, 
            int shift=0 )

4.3.2 程序实现

#include 
#include 
#include 
#include 
#include 
#include 

#include 
#include 
#include 
#include 

#include 
#include 
#include 

using namespace std;
using namespace cv;

#define markerLength 0.05 // ar码实际边长，单位m
#define modelSize 1       //模型大小0-1

ros::Publisher image_pub;

// init data
Mat cameraMatrix, distCoeffs;
Ptr dictionary =
    cv::aruco::getPredefinedDictionary(cv::aruco::DICT_6X6_250);

// model data
vector pointData;
vector> plantData;

// 绘制模型
Mat drawModel(Mat image, Vec3d rvec, Vec3d tvec, vector modelPoints,
              vector> modelPlants, bool judge) {
  Mat showImage;
  cvtColor(image, showImage, CV_GRAY2BGR);

  if (judge) {
    // draw axis
    aruco::drawAxis(showImage, cameraMatrix, distCoeffs, rvec, tvec, 0.05);

    // draw model
    // projectPoints
    std::vector imagePoints;
    projectPoints(modelPoints, rvec, tvec, cameraMatrix, distCoeffs,
                  imagePoints);

    // draw plant
    vector> plantPoints(modelPlants.size());
    vector tmpPoints(3);
    for (int i = 0; i < modelPlants.size(); i++) {
      tmpPoints[0] = imagePoints[modelPlants[i][1]];
      tmpPoints[1] = imagePoints[modelPlants[i][2]];
      tmpPoints[2] = imagePoints[modelPlants[i][3]];
      plantPoints[i] = tmpPoints;
    }
    for (int i = 0; i < plantPoints.size(); i++) {
      drawContours(showImage, plantPoints, i, Scalar(203, 192, 255), FILLED);
    }

    // draw line
    for (int i = 0; i < modelPlants.size(); i++) {
      line(showImage, imagePoints[modelPlants[i][1]],
           imagePoints[modelPlants[i][2]], Scalar(0, 0, 0), 1);
      line(showImage, imagePoints[modelPlants[i][2]],
           imagePoints[modelPlants[i][3]], Scalar(0, 0, 0), 1);
      line(showImage, imagePoints[modelPlants[i][3]],
           imagePoints[modelPlants[i][1]], Scalar(0, 0, 0), 1);
    }

    // draw point
    for (int i = 0; i < imagePoints.size(); i++) {
      circle(showImage, imagePoints[i], 1, Scalar(0, 0, 0), 1);
    }
  }
  return showImage;
}

// 状态估计
bool poseEstimation(Mat image, Vec3d &markerRvec, Vec3d &markerTvec) {
  Mat imageCopy = image.clone();

  // detect marker
  vector ids;
  vector> corners;
  aruco::detectMarkers(imageCopy, dictionary, corners, ids);

  // if at least one marker detected
  if (ids.size() > 0) {
    // aruco::drawDetectedMarkers(showImage, corners, ids);
    vector rvecs, tvecs;
    aruco::estimatePoseSingleMarkers(corners, 0.05, cameraMatrix, distCoeffs,
                                     rvecs, tvecs);

    // screen out designed marker rvecs and tvecs
    for (int i = 0; i < ids.size(); i++) {
      if (ids[i] == 2) {
        markerRvec = rvecs[i];
        markerTvec = tvecs[i];
        return true;
      } else
        return false;
    }
  } else
    return false;
}

// 回调函数
void imageCb(const sensor_msgs::ImageConstPtr &msg) {
  // get image
  cv_bridge::CvImagePtr cv_ptr =
      cv_bridge::toCvCopy(msg, sensor_msgs::image_encodings::MONO8);
  Mat cameraImage = cv_ptr->image;

  // estimate pose
   Vec3d markerRvec, markerTvec;
   bool judge = poseEstimation(cameraImage, markerRvec, markerTvec);

  // draw model
   Mat showImage = drawModel(cameraImage, markerRvec, markerTvec, pointData,
                            plantData, judge);

  // pub result
  cv_bridge::CvImage out_msg;
  out_msg.encoding = sensor_msgs::image_encodings::BGR8;
  out_msg.image = showImage;
  image_pub.publish(out_msg.toImageMsg());
}

int main(int argc, char *argv[]) {
  // init ros
  ros::init(argc, argv, "aruco");
  ros::NodeHandle nh;
  ros::Subscriber image_sub =
      nh.subscribe("/camera/image", 1, imageCb);
  image_pub = nh.advertise("/camera/aruco", 1);

  // init parms
  vector cameraMatrixData, distCoeffsData;
  ros::param::get("/camera_matrix/data", cameraMatrixData);
  ros::param::get("/distortion_coefficients/data", distCoeffsData);

  Mat cameraMatrixTmp =
      (Mat_(3, 3) << cameraMatrixData[0], cameraMatrixData[1],
       cameraMatrixData[2], cameraMatrixData[3], cameraMatrixData[4],
       cameraMatrixData[5], cameraMatrixData[6], cameraMatrixData[7],
       cameraMatrixData[8]);
  cameraMatrix = cameraMatrixTmp;

  Mat distCoeffsTmp =
      (Mat_(1, 5) << distCoeffsData[0], distCoeffsData[1],
       distCoeffsData[2], distCoeffsData[3], distCoeffsData[4]);
  distCoeffs = distCoeffsTmp;

  // read model
  fstream modelfile;
  modelfile.open("./marker/m100.txt");
  int pointSize, plantSize, lineSize;
  modelfile >> pointSize;
  modelfile >> plantSize;
  modelfile >> lineSize;

  for (int i = 0; i < pointSize; i++) {
    Point3f pointTmp;
    modelfile >> pointTmp.x;
    modelfile >> pointTmp.y;
    modelfile >> pointTmp.z;

    // resize model
    pointTmp.x = pointTmp.x / 0.5 * markerLength - (markerLength / 2.0);
    pointTmp.y = pointTmp.y / 0.5 * markerLength - (markerLength / 2.0);
    pointTmp.z = pointTmp.z / 0.5 * markerLength - (markerLength / 2.0);
    pointData.push_back(pointTmp);
  }

  for (int i = 0; i < plantSize; i++) {
    vector plantTmp;
    for (int j = 0; j < 4; j++) {
      int data;
      modelfile >> data;
      plantTmp.push_back(data);
    }
    plantData.push_back(plantTmp);
  }

  ros::spin();
  return 0;
}

4.4 实现效果

参考

aruco

ARUCO marker的解释

[OpenCV] aruco Markers识别

tutorial_aruco_detection
程序参考

https://github.com/fdcl-gwu/aruco-markers

https://github.com/jeradesign/ar-challenge
原理参考

《视觉SLAM十四讲》——第7讲视觉里程计1
模型数据

off文件格式(Object File Format)

常见的三维点云数据下载链接

普林斯顿三维模型库

你可能感兴趣的:(OpenCV,ARUCO)

051-OpenCV GrabCut图像分割算法
话不多说，上代码，看结果。importcv2#导入库importnumpyasnp'''cv2.imread(filename,flags)#filename为文件名，图片与.py文件在一个文件夹时输入文件名即可#不在一个文件夹时输入图片的路径和名字#flags为图片的颜色类型，默认为1，灰度图像为0'''img=cv2.imread('89.jpg')mask=np.zeros(img.shap
opencv常用函数汇总 Sky.Kevin opencv 计算机视觉
一、色彩空间类型转换1、cv2.cvtColordst=cv2.cvtColor(src,code[,dstCn])式中：dst表示输出图像，与原始输入图像具有同样的数据类型和深度。src表示原始输入图像。可以是8位无符号图像、16位无符号图像，或者单精度浮点数等。code是色彩空间转换码，表4-2展示了其枚举值。dstCn是目标图像的通道数。如果参数为默认的0，则通道数自动通过原始输入图像和co
python ffmpeg pipe_如何使用python从ffmpeg输出管道？ weixin_39611725 python ffmpeg pipe
我正在尝试将FFmpeg的输出用管道输送到Python中。我正在从一个视频采集卡读取图像，我成功地使用dshow从命令行将其读入输出文件。我正在尝试从卡抓取图像到我的OpenCv代码，以便能够进一步处理数据。不幸的是，当我通过管道输出图像时，我只得到视频的显示，如链接所示：link:s000.tinyupload.com/?file_id=15940665795196022618.我使用的代码如下
金属表面划痕检测实践指南 - 使用OpenCV IYA1738
本文还有配套的精品资源，点击获取简介：在机器视觉领域，表面划痕检测是一项关键技术，特别是在金属表面。本文深入探索了如何使用OpenCV库在VisualStudio2019环境下进行表面划痕检测。主要技术包括图像作差、动态阈值处理、边缘检测以及形态学操作。通过这些方法，我们可以有效地从金属表面图像中提取划痕特征。本文详细描述了实施表面划痕检测的步骤，包括图像读取、差分图像计算、阈值处理、边缘检测优化
opencv 4.12.0版本发布详解：核心优化与新特性全解析 Risehuxyc #opencv opencv 人工智能计算机视觉
OpenCV4.12.0夏季更新带来核心模块优化、图像处理增强、深度学习支持扩展及新兴硬件适配，全面提升计算机视觉开发效率与性能。引言OpenCV（开源计算机视觉库）作为计算机视觉领域最受欢迎的开源库之一，在2025年7月发布了4.12.0版本。这个夏季更新带来了大量性能优化、新功能和错误修复，覆盖了核心模块、图像处理、3D校准、深度学习等多个领域。本文将详细介绍OpenCV4.12.0的主要更新
基于Opencv的工业缺陷检测/C++版本 Deeeil opencv c++人工智能
找工作过程中发现要求会C++的工业检测，用一个项目熟悉整个流程#include#include#include//定义一个结构体来存储缺陷信息structDefect{inttype;//缺陷类型，1代表划痕，2代表污渍intx;//缺陷的x坐标inty;//缺陷的y坐标intwidth;//缺陷的宽度intheight;//缺陷的高度//构造函数，初始化缺陷信息Defect(intt,intx,
使用 C++ 和 OpenCV 进行表面划痕检测 whoarethenext c++opencv 开发语言划痕检测
使用C++和OpenCV进行表面划痕检测在工业自动化生产中，产品表面的质量控制至关重要。划痕作为一种常见的表面缺陷，其检测是许多领域（如金属、玻璃、塑料制造）质量保证流程中的一个关键环节。本文将介绍如何使用C++和强大的计算机视觉库OpenCV来实现一个基本的表面划痕检测算法。核心思路划痕通常在图像中表现为具有以下一个或多个特征的区域：高对比度的线性结构：划痕区域的像素强度通常会与其周围背景有明显
ROS2 视频采集节点实现 ZPC8210 ROS 音视频
一个完整的ROS2视频采集节点的实现，使用OpenCV进行视频捕获并通过ROS2发布图像消息。1.创建功能包首先创建一个新的ROS2功能包（如果还没有）：bashros2pkgcreatevideo_capture--build-typeament_python--dependenciesrclpysensor_msgscv_bridgeopencv-python2.实现视频采集节点在video_
ROS2 通过相机确定物品坐标位置
要实现通过相机确定物品坐标位置，通常需要相机标定、物体检测和坐标转换几个步骤。下面我将提供一个完整的解决方案，包括相机标定、物体检测和3D坐标估计。1.系统架构相机标定-获取相机内参和畸变系数物体检测-使用OpenCV或深度学习模型检测物品坐标转换-将2D图像坐标转换为3D世界坐标ROS2集成-将上述功能集成到ROS2节点中2.实现步骤2.1创建功能包bashros2pkgcreateobject
OpenCV特征点提取算法orb、surf、sift对比点云SLAM 图形图像处理 ORB算法 SIFT算法人工智能计算机视觉算法
下面是OpenCV中三种常用特征点提取算法：ORB、SURF和SIFT的详细对比，从算法原理、性能、使用限制和适用场景多维度进行总结，帮助大家在实际项目中合理选择。一览表：ORBvs.SURFvs.SIFT属性/算法ORBSURFSIFT全称OrientedFASTandRotatedBRIEFSpeededUpRobustFeaturesScale-InvariantFeatureTransfo
C#实现基于ffmpeg加虹软的人脸识别
关于人脸识别目前的人脸识别已经相对成熟，有各种收费免费的商业方案和开源方案，其中OpenCV很早就支持了人脸识别，在我选择人脸识别开发库时，也横向对比了三种库，包括在线识别的百度、开源的OpenCV和商业库虹软（中小型规模免费）。百度的人脸识别，才上线不久，文档不太完善，之前联系百度，官方也给了我基于Android的Example，但是不太符合我的需求，一是照片需要上传至百度服务器（这个是最大的问
OpenCV 入门指南 —— 从环境搭建到图像处理 m0_74751715 opencv 图像处理人工智能 python
文章目录前言一、什么是OpenCV？二、环境准备与安装1.Python虚拟环境2.安装OpenCV3.验证安装三、读取与显示图像四、常见图像处理操作1.色彩空间转换2.图像平滑（模糊）3.边缘检测（Canny算法）4.在图像上绘制图形与文字五、视频与摄像头操作六、推荐学习路线七、参考资料前言在计算机视觉领域，OpenCV（OpenSourceComputerVisionLibrary）凭借其开源、
手绘电路图的节点和端点检测一个简化版的算法实现框架 zhangfeng1133 算法
于论文描述，我将提供一个简化版的算法实现框架，用于手绘电路图的节点和端点检测，并整合生成电路原理图。以下代码结合了YOLOv5目标检测和传统图像处理技术，符合论文中提到的98.2%mAP和92%节点识别准确率的关键指标。核心算法实现（Python+OpenCV+YOLOv5）importcv2importnumpyasnpimporttorchfromyolov5importYOLOv5#需要安装
人脸数目统计系统实现：基于OpenCV和C++的人脸识别
本文还有配套的精品资源，点击获取简介：本项目介绍如何利用OpenCV库和C++语言开发一个人脸识别系统，用于统计图像中的人脸数量。内容涵盖人脸识别的基本原理、关键步骤及技术细节，包括使用Haar级联分类器进行人脸检测，并通过C++编程实现从图像处理到人脸统计的全过程。1.人脸识别基本原理与步骤人脸识别技术已经在安全验证、智能家居、社交媒体等多个领域得到了广泛应用。其基本原理是通过分析人脸图像中的特
基于python的图像识别_基于PYTHON的图片文字识别
文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。一般包括以下几个过程：图像输入、图像前处理、预识别：1图像输入：对于不同的图像格式，有着不同的存储格式，不同的压缩方式，目前有OpenCV、CxImage等开源项目。2预处理：主要包括二值化，噪声去除，倾斜较正等。2.1二值化：对摄像头拍摄的图片，大多数是彩色图像，彩色图像所含信息量巨大，对于图片的内容，我们可以简单的分为前景与背景，为
感受大师的代码风格_opencv源代码结构分析一
最近在调用opencv的时候,我总是去看看opencv的原代码.在那些烦琐的宏定义里面感觉自己还是很有意思的.cvGet2D(constCvArr*arr,inty,intx);//第一个坐标是y坐标,第二个是x坐标CV_IMPLCvScalarcvGet2D(constCvArr*arr,inty,intx)//CV_IMPL宏定义extern"C"{CvScalarscalar={{0,0,0
Opencv学习_2 （opencv结构&显示图像）
opencv结构：1：主要包含：cxcorecvmachinelearninghighguicvcamcvaux2：cxcore:基础结构:CvPoint,CvSize,CvScalar等数组结构:cvCreateImage,cvCreateMat等动态结构:CvMemStorage,CvMemBlock等绘图函数:cvLine,cvRectangle等数据保存和运行时类型信息：CvFileSto
探索OpenCV 3.2源码：计算机视觉的架构与实现轩辕姐姐
本文还有配套的精品资源，点击获取简介：OpenCV是一个全面的计算机视觉库，提供广泛的功能如图像处理、对象检测和深度学习支持。OpenCV3.2版本包含了改进的深度学习和GPU加速特性，以及丰富的示例程序。本压缩包文件提供了完整的OpenCV3.2源代码，对于深入学习计算机视觉算法和库实现机制十分宝贵。源码的模块化设计、C++接口、算法实现、多平台支持和性能优化等方面的深入理解，都将有助于开发者的
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
OpenCV图像数据处理:convertTo,normalize和scaleAdd luofeiju OpenCV函数实战 opencv
在OpenCV图像处理的世界里，有几个函数进行一些基本数据变换：cv::convertTo()：类型转换与线性缩放；cv::normalize()：归一化处理；cv::scaleAdd()：加权叠加运算。cv::addWeighted():与scaleAdd相似，进行加权叠加运算；一、cv::convertTo()：线性变换+数据类型转换voidcv::Mat::convertTo(OutputA
用Python和OpenCV从零搭建一个完整的双目视觉系统（三） presenttttt 双目立体视觉数码相机
本系列文章旨在系统性地阐述如何利用Python与OpenCV库，从零开始构建一个完整的双目立体视觉系统。本项目github地址：https://github.com/present-cjn/stereo-vision-python.git在上一篇文章中，我们为项目设计了清晰的架构。现在，我们将深入第一个，也是整个双目视觉系统最关键的模块——相机标定(CameraCalibration)。如果说双目
（一）OpenCV——噪声去除（降噪）
高斯滤波器（针对高斯噪声）高斯噪声是指它的概率密度函数服从高斯分布（即正态分布）的一类噪声。常见的高斯噪声包括起伏噪声、宇宙噪声、热噪声和散粒噪声等等。高斯滤波(Gaussianfilter)包含许多种，包括低通、带通和高通等，我们通常图像上说的高斯滤波，指的是高斯模糊(GaussianBlur)，是一种高斯低通滤波，其过滤调图像高频成分（图像细节部分），保留图像低频成分（图像平滑区域），所以对图
OpenCV图片操作100例：从入门到精通指南（1）总有刁民想爱朕ha opencv 计算机视觉人工智能
OpenCV图片操作100例：从入门到精通指南本文整理了100个OpenCV实用技巧，涵盖图像处理各个领域，助你轻松掌握计算机视觉核心技能！一、入门必备：基础操作1.图像读写与显示importcv2#读取图像（BGR格式）img=cv2.imread('image.jpg')#显示图像cv2.imshow('示例图片',img)cv2.waitKey(0)#按任意键退出cv2.destroyAll
OpenCV图片操作100例：从入门到精通指南（3）总有刁民想爱朕ha opencv 人工智能计算机视觉
高效学习路径：1️⃣分阶段学习：入门：1-20例（基础操作）进阶：21-50例（图像处理）高级：51-100例（计算机视觉）2️⃣项目驱动学习：证件照背景替换（1-15例）停车场车位检测（30-45例）视频运动追踪（70-85例）3️⃣性能优化技巧：#使用UMat加速图像处理umat_img=cv2.UMat(img)processed=cv2.GaussianBlur(umat_img,(5,5
Python OpenCV教程从入门到精通的全面指南【文末送书】一键难忘 python opencv 开发语言
文章目录PythonOpenCV从入门到精通1.安装OpenCV2.基本操作2.1读取和显示图像2.2图像基本操作3.图像处理3.1图像转换3.2图像阈值处理3.3图像平滑4.边缘检测和轮廓4.1Canny边缘检测4.2轮廓检测5.高级操作5.1特征检测5.2目标跟踪5.3深度学习与OpenCVPythonOpenCV从入门到精通【文末送书】PythonOpenCV从入门到精通OpenCV(Ope
OpenCV入门到精通：AI视觉处理的完整指南 AI云原生与云计算技术学院人工智能 opencv 计算机视觉 ai
OpenCV入门到精通：AI视觉处理的完整指南关键词：OpenCV、计算机视觉、图像预处理、目标检测、AI视觉应用摘要：本文是一份面向AI视觉爱好者的OpenCV完整学习指南。从OpenCV的核心概念讲起，结合生活案例、代码示例和项目实战，逐步拆解图像读取/显示、灰度化、边缘检测、目标检测等关键技术。无论你是想入门计算机视觉的新手，还是希望用OpenCV解决实际问题的开发者，都能通过本文掌握从理论
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
libjpeg-turbo图片解码 VS opencv momomo_mocs opencv 人工智能计算机视觉
#include#include#includestd::pairJpegTurboDecode(conststd::string&raw_jpeg_data,std::vector*result_data){if(nullptr==result_data){LOG(INFO)(const_cast(raw_jpeg_data.data())),raw_jpeg_data.size(),&widt
OpenCV探索之旅：多尺度视觉与形状的灵魂--图像金字塔与轮廓分析
在我们学会用Canny算法勾勒处世界的轮廓之后，一个更深层次的问题摆在了面前：这些由像素组成的线条，如何才能被赋予“生命”，成为我们能够理解和分析的“形状”？如果一个物体在图像中时大时小，我们又该如何稳定地识别它？欢迎来到本次的探索之旅。我们将建造两种强大的“金字塔”，赋予我们跨越尺度的“鹰之眼”；然后，我们将不仅仅是找到轮廓，更要深入其内部，测量它的面积、周长，找到它的重心，甚至量化它的“形状”
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include