手工烘焙家

摄像机标定

转载：http://blog.csdn.net/honyniu/article/details/51004397

一、简介

摄像机标定(Camera calibration)简单来说是从世界坐标系换到图像坐标系的过程，也就是求最终的投影矩阵 P 的过程，下面相关的部分主要参考UIUC的计算机视觉的课件（网址Spring 2016 CS543 / ECE549 Computer vision）。

基本的坐标系：

世界坐标系(world coordinate system)；
相机坐标系(camera coordinate system)；
图像坐标系(image coordinate system)；

一般来说，标定的过程分为两个部分：

第一步是从世界坐标系转换为相机坐标系，这一步是三维点到三维点的转换，包括 R ， t （相机外参）等参数；
第二部是从相机坐标系转为图像坐标系，这一步是三维点到二维点的转换，包括 K （相机内参）等参数；

相机坐标系转换到图像坐标系

坐标系介绍

如上图所示（图片来自UIUC计算机视觉课件），是一个小孔成像的模型，其中：

C 点表示camera centre，即相机的中心点，也是相机坐标系的中心点；
Z 轴表示principal axis，即相机的主轴；
p 点所在的平面表示image plane，即相机的像平面，也就是图片坐标系所在的二维平面；
p 点表示principal point，即主点，主轴与像平面相交的点；
C 点到 p 点的距离，也就是右边图中的 f 表示focal length，即相机的焦距；
像平面上的 x 和 y 坐标轴是与相机坐标系上的 X 和 Y 坐标轴互相平行的；
相机坐标系是以 X ， Y ， Z （大写）三个轴组成的且原点在 C 点，度量值为米（m）；
像平面坐标系是以 x ， y （小写）两个轴组成的且原点在 p 点，度量值为米（m）；
图像坐标系一般指图片相对坐标系，在这里可以认为和像平面坐标系在一个平面上，不过原点是在图片的角上，而且度量值为像素的个数（pixel）；

相机转换到像平面

知道上面的简单知识后，如果知道相机坐标系中的一个点 X （现实三维世界中的点），在像平面坐标系对应的点是 x ，要求求从相机坐标系转为像平面坐标系的转换，也就是从 X 点的 (X,Y,Z) 通过一定的转换变为 x 点的 (x,y) 。注意： (X,Y,Z) （大写）是在相机坐标系，而 (x,y) （小写）是在像平面坐标系（还不是图像坐标系，原点不同。）观察第二个图，很简单的可以得到这个转换：

x = f X / Z

y = f Y / Z

(X, Y, Z) \mapsto (f X / Z, f Y / Z)

可以表示为矩阵计算为（在这里用的是齐次坐标的表示方式，关于齐次坐标文章最下面有介绍）：

⎛ ⎝ ⎜ ⎜ ⎜ ⎜ X Y Z 1 ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ \mapsto ⎛ ⎝ ⎜ ⎜ f X f Y Z ⎞ ⎠ ⎟ ⎟ = ⎡ ⎣ ⎢ ⎢ f f 1000 ⎤ ⎦ ⎥ ⎥ ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ X Y Z 1 ⎞ ⎠ ⎟ ⎟ ⎟ ⎟

可以简写为（ P 就是所谓的投影矩阵，当然现在还不完整）：

x = P X

加入偏移量

通过上面，可以把相机坐标系转换到像平面坐标系，但是像平面坐标系和图像坐标系虽然在同一个平面上，但是原点并不是同一个，而目标是要转换到图像坐标系下，所以还需要一步操作，如下图：

如上图所示（图片来自UIUC计算机视觉课件），其中主点 p 是像平面坐标系的原点，但在图像坐标系中的位置为 (px,py) ，在这里，图形坐标系的原点是图片的左下角，所以可以得到：

(X, Y, Z) \mapsto (f X / Z + p x, f Y / Z + p y)

相当于在上面的基础上加了一个p点坐标的偏移量，同时可以表示为矩阵计算为（在这里用的是齐次坐标的表示方式）：

⎛ ⎝ ⎜ ⎜ ⎜ ⎜ X Y Z 1 ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ \mapsto ⎛ ⎝ ⎜ ⎜ ⎜ f X + Z p x f Y + Z p y Z ⎞ ⎠ ⎟ ⎟ ⎟ = ⎡ ⎣ ⎢ ⎢ ⎢ f f p x p y 1 000 ⎤ ⎦ ⎥ ⎥ ⎥ ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ X Y Z 1 ⎞ ⎠ ⎟ ⎟ ⎟ ⎟

整理一下得：

⎛ ⎝ ⎜ ⎜ ⎜ f X + Z p x f Y + Z p y Z ⎞ ⎠ ⎟ ⎟ ⎟ = ⎡ ⎣ ⎢ ⎢ ⎢ f f p x p y 1 ⎤ ⎦ ⎥ ⎥ ⎥ ⎡ ⎣ ⎢ ⎢ 111000 ⎤ ⎦ ⎥ ⎥ ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ X Y Z 1 ⎞ ⎠ ⎟ ⎟ ⎟ ⎟

所以最后可以得到 K ，也就是平时所说的相机内参（Intrinsic parameters）：

K = ⎡ ⎣ ⎢ ⎢ ⎢ f f p x p y 1 ⎤ ⎦ ⎥ ⎥ ⎥

以及投影矩阵

P （在这里可以认为旋转矩阵

R 为单位矩阵

I ，平移矩阵

t 都为0，这也是为什么要拆成这种方式），为：

P = K [I 0]

像素坐标

前面也提到了在图像坐标系中用的不是现实生活中的m来度量，而是用的 pixel 的个数，所以在上面转换到图像坐标系中还有个问题，就是坐标的表示还是m，并没有转换到像素坐标系统；在这里需要引入一个新概念就是：

mx 表示在水平方向1m的长度包含的像素的个数；
my 表示在竖直方向1m的长度包含的像素的个数；

可能有人奇怪为啥不是一个值，还需要分别指定 mx 和 my 呀，这是因为通过上面可以得到一个像素点的大小（m度量）为：

1 m x \times 1 m y

但是需要说明的是像素并不一定是一个正方形，有时候可能也是一个矩形，所以要分别指定。
所以可以把上面相机内参 K 变为更新为，转换公式把 K 替换即可，其他不变：

K = ⎡ ⎣ ⎢ ⎢ ⎢ m x m y 1 ⎤ ⎦ ⎥ ⎥ ⎥ ⎡ ⎣ ⎢ ⎢ ⎢ f f p x p y 1 ⎤ ⎦ ⎥ ⎥ ⎥ = ⎡ ⎣ ⎢ ⎢ ⎢ α x α y β x β y 1 ⎤ ⎦ ⎥ ⎥ ⎥

一般来说，在使用相机内参K计算坐标系转换时，提供的都是已经变换后的值；例如会提供 fx ， fy ， cx ， cy 四个值代表相机内参 K ，其实 fx 就是这里的 αx ，同理 fy 是 αy ， cx 是 βx ， cy 是 βy 。

世界坐标系转换到图像坐标系

坐标系介绍

如上图所示（图片来自UIUC计算机视觉课件），从世界坐标系转换到相机坐标系是三维空间到三维空间的变换，一般来说需要一个平移操作和一个旋转操作就可以完成这个转换，用公式表示如下（可以理解为世界坐标系原点先平移到相机坐标系的位置然后在做一次坐标系旋转，使坐标轴对齐。）：

X ˜ c a m = R (X ˜ - C ˜)

R 表示旋转矩阵；
X˜ 表示 X 点在世界坐标系中的位置；
C˜ 表示相机原点 C 在世界坐标系中的位置；
X˜cam 表示 X 点在相机坐标系中的位置；

世界转换到相机

根据上面的公式可以得到从一个三维点从世界坐标系转换到相机坐标的变换公式如下（也是用的齐次坐标的表示方式）：

X c a m = (X ˜ c a m 1) = [R 0 - R C ˜ 1] (X ˜ 1) = [R 0 - R C ˜ 1] X

世界转换到图像

根据上面的讨论知道了怎样从世界坐标系转换到相机坐标系（平移和旋转）以及从相机坐标系转换到图像坐标系（相机内参变换），所以带入上面的矩阵计算，可以得到：

x = K [I 0] X c a m = K [R - R C ˜] X

这样就得到了最终的投影矩阵 P ：

P = K [R t]

其中：

t = - R C ˜

在这里， K 一般称为相机内参（intrinsic parameters），描述了相机的内部参数，包括焦距 f 、主点 p 的位置、以及像素与真实环境的大小比例等，这个是固有属性，是提供好的； R 和 t 称为相机外参（extrinsic parameters）， R 在这里是旋转矩阵，可以转换为三维的旋转向量，分别表示绕 x ， y ， z 三个轴的旋转角度， t 目前就是一个平移向量，分别表示在 x ， y ， z 三个方向上的平移量。

畸变参数(`distortion parameters`)

在几何光学和阴极射线管(CRT)显示中，畸变（distortion）是对直线投影（rectilinear projection）的一种偏移。简单来说直线投影是场景内的一条直线投影到图片上也保持为一条直线。那畸变简单来说就是一条直线投影到图片上不能保持为一条直线了，这是一种光学畸变（optical aberration）。可能由于摄像机镜头的原因，这里不讨论，有兴趣的可以查阅光学畸变的相关的资料。
畸变一般可以分为两大类，包括径向畸变和切向畸变。主要的一般径向畸变有时也会有轻微的切向畸变。

径向畸变（`Radial distortion`）

径向畸变的效应有三种，一种是桶形畸变（barrel distortion），另一种是枕形畸变（pincushion distortion），还有一种是两种的结合叫做胡子畸变（mustache distortion），从图片中可以很容易看出区别，具体见下图(图片来自wikipedia)：

径向畸变可以用如下公式修正：

x c o r r = x d i s (1 + k 1 r 2 + k 2 r 4 + k 3 r 6)

y c o r r = y d i s (1 + k 1 r 2 + k 2 r 4 + k 3 r 6)

切向畸变（`tangential distortion`）

切向畸变是由于透镜与成像平面不严格的平行，其可以用如下公式修正：

x c o r r = x d i s + [2 p 1 x y + p 2 (r 2 + 2 x 2)]

y c o r r = y d i s + [p 1 (r 2 + 2 y 2) + 2 p 2 x y]

其中：

xdis 和 ydis 表示有畸变的坐标；
xcorr 和 ycorr 表示修复后的坐标；
k1 ， k2 ， k3 表示径向畸变参数；
p1 ， p2 表示切向畸变参数；

所以最终得到5个畸变参数：

D = (k 1, k 2, p 1, p 2, k 3)

二、相机标定

2.1单目标定

（1）使用opencv标定程序或matlab单目相机标定工具箱即可；（2）标定过程大致为：检测棋盘格角点，计算角点Q与像平面图像点q的单应性矩阵，计算相机外参，计算相机内参。

那么可以利用这些来进行最终的任务相机标定，简单的过程可以描述为通过标定板，如下图，可以得到n个对应的世界坐标三维点 i 和对应的图像坐标二维点 xi，这些三维点到二维点的转换都可以通过上面提到的相机内参 K，相机外参 R 和 t，以及畸变参数 D 经过一系列的矩阵变换得到。现在就用这些对应关系来求解这些相机参数。最后就是用线性方法求解方程式，这里就不做讨论了。

2.1双目标定

（1）可以使用opencv标定程序或matlab双目标定工具箱；（2）标定大致过程为：进行单目标定，后根据两个视角内图片配对特征点求解基础矩阵，求解本质矩阵，分解得到量相机相对位置关系。

那为什么要做相机标定呢？每个镜头的畸变程度各不相同，通过相机标定可以校正这种镜头畸变。其实可以认为用这种标定的方式来求解相机内参和畸变参数，相当于一种相机校准，然后这些参数就可以用于后面的求解。例如求解新拍的两幅图片相对的

R 和 t ，求解这个外参用到就是标定得到的相机内参和畸变参数。

齐次坐标
就是将一个原本是n维的向量用一个n+1维向量来表示。
许多图形应用涉及到几何变换，主要包括平移、旋转、缩放。以矩阵表达式来计算这些变换时，平移是矩阵相加，旋转和缩放则是矩阵相乘，综合起来可以表示为 x=R∗X+t （注：因为习惯的原因，实际使用时一般使用变化矩阵左乘向量）( R 旋转缩放矩阵， t 为平移矩阵， X 为原向量， x 为变换后的向量)。引入齐次坐标的目的主要是合并矩阵运算中的乘法和加法，表示为 x=P∗X 的形式。即它提供了用矩阵运算把二维、三维甚至高维空间中的一个点集从一个坐标系变换到另一个坐标系的有效方法。和上面的计算过程是对应的。

你可能感兴趣的:(机器视觉)

【机器视觉】少量样本图片情况下的图片识别技术方案 yuanpan 机器学习人工智能计算机视觉
在只有少量图片样本的情况下，进行图像识别是一个具有挑战性的任务。以下是一些应对小样本问题的有效方案：1.数据增强（DataAugmentation）通过对现有样本进行各种变换来生成更多的训练数据，例如：几何变换：旋转、缩放、平移、翻转等。颜色变换：调整亮度、对比度、饱和度等。噪声添加：高斯噪声、椒盐噪声等。裁剪和填充：随机裁剪图像的一部分或填充边缘。工具：Keras：ImageDataGenera
OpenCV第1课OpenCV 介绍及其树莓派下环境的搭建嵌入式老牛树莓派之OpenCV opencv 人工智能计算机视觉
1.机器是如何“看”的我们人类可以通过眼睛看到五颜六色的世界，是因为人眼的视觉细胞中存在分别对红、绿、蓝敏感的3种细胞。其中的光感色素根据光线的不同进行不同比例的分解，从而让我们识别到各种颜色。对人工智能而言，学会“看”也是非常关键的一步。那么机器人是如何看到这个世界的呢？这就涉及到人工智能方向重要的分支--机器视觉。机器视觉即用机器人代替人眼来做测量和判断，通过机器视觉产品（即图像摄取装置，分C
机器视觉工程师必须知道读码器如何选型视觉人机器视觉杂说数码相机 3d 人工智能 c#
一、明确核心需求应用场景工业场景（产线、仓储）：需高防护等级（IP65+）、抗震动/冲击、宽温工作（-20℃~50℃）。商业场景（零售、物流）：注重扫描速度、多码兼容性（一维/二维码混合）。移动场景（手持设备、AGV）：选择无线连接（蓝牙/Wi-Fi）、轻便设计。特殊环境（高粉尘、强光）：需配备强光源补偿、高帧率图像传感器。码的类型一维码：传统激光扫描器（成本低）或线性图像式扫描器（破损码容错）。
机器视觉中图像的腐蚀和膨胀是什么意思？它能用来做什么？ yuanpan 机器学习人工智能计算机视觉图像处理
腐蚀（Erosion）和膨胀（Dilation）是两种基本的形态学操作，通常用于二值图像（黑白图像）的处理。它们是形态学图像处理的基础，广泛应用于图像分割、边缘检测、噪声去除等任务。1.腐蚀（Erosion）腐蚀操作通过对图像中的前景区域（通常为白色像素）进行“收缩”来去除边界上的像素。具体来说，腐蚀操作使用一个结构元素（通常是一个小的矩阵或核）在图像上滑动，只有当结构元素完全覆盖前景区域时，中心
目前市场上主流的机器视觉的框架有哪些？他们的特点及优劣 yuanpan 机器学习计算机视觉
目前市场上主流的机器视觉框架和工具可以分为商业软件、开源工具和深度学习框架三大类。以下是它们的总结及特点对比：1.商业软件(1)Halcon(MVTec)特点：专注于工业机器视觉，提供高精度、高效率的算法。支持复杂的工业应用，如缺陷检测、3D视觉、深度学习等。提供图形化开发工具HDevelop和多种编程接口。优势：算法优化好，适合实时工业应用。硬件兼容性强，支持多种工业相机和设备。劣势：商业软件，
Halcon 和 opencv比有什么区别与优劣 yuanpan opencv 人工智能计算机视觉
Halcon和OpenCV都是机器视觉领域的重要工具，但它们的设计目标、功能特点和适用场景有所不同。以下是两者的详细对比：1.定位与目标用户Halcon：定位：商业机器视觉软件，专注于工业应用。目标用户：工业自动化、质量控制、机器人引导等领域的专业开发者。OpenCV：定位：开源计算机视觉库，适用于通用图像处理和计算机视觉任务。目标用户：学术研究、教育、初创公司以及需要低成本解决方案的开发者。2.
超小巧且经济的CMOS工业相机——Vieworks的VZ系列 51camera 工业相机
今天我们来看一款超级紧凑小巧且具有成本效益的工业相机——Vieworks的VZ系列。它主要有以下四大特点：1、超紧凑的工业相机VZ系列是最小的相机，适用于广泛的机器视觉应用。由于其29mmx29mm的紧凑外壳尺寸和重量轻，VZ系列可以简单地取代大多数工业相机。2、无缝安装和高可用性PoE千兆以太网和USB3.0接口使得系统集成相对容易，减少了电缆长度和多个摄像头设置。VZ系列通过使用千兆以太网和U
工业相机的主要参数及计算 51camera 工业相机
工业相机是机器视觉系统中的关键组件，其本质是将光信号转变为有序的电信号，进而实现数字图像的获取，广泛应用于工业生产、检测、测量等领域。其成像原理与小孔成像类似，但更为复杂。当被摄物体反射的光线通过工业镜头折射后，会投射到相机的感光传感器上，这个感光传感器通常是电荷耦合器件（CCD）或互补金属氧化物半导体（CMOS）。dalsanano系列工业相机1、工作原理图像采集：通过镜头收集被拍摄物体反射或透
高输出红外光源的特点及应用 51camera 工业光源红外光源机器视觉
我们都知道光源在机器视觉系统中起着重要作用，能够影响成像效果，今天我们来看看红外光源。红外光是指波长比可见光中的红光长并且肉眼看不到的光。与可见光的红光相比，红外光的散射率较低，但透射率较高，因此，可用于透过印刷图案或液体的成像。红外LED的优点LED照射的红外光仅拥有特定波长范围的能量,与卤素光源相比,照射热极少。因此,对象物不易因热能而受损。红外光源成像实例（以ccs光源为例）1、1000nm
什么是机器视觉3D引导大模型视觉人机器视觉机器视觉3D 3d 数码相机机器人人工智能大数据
机器视觉3D引导大模型是结合深度学习、多模态数据融合与三维感知技术的智能化解决方案，旨在提升工业自动化、医疗、物流等领域的操作精度与效率。以下从技术架构、行业应用、挑战与未来趋势等方面综合分析：一、技术架构与核心原理多模态数据融合与深度学习3D视觉引导大模型通常整合RGB图像、点云数据、深度信息等多模态输入，通过深度学习算法（如卷积神经网络、Transformer）进行特征提取与融合。例如，油田机
视觉工程师：工业相机50问钢铁男儿机器视觉机器视觉工业相机
1：工业相机的丢帧的问题是由什么原因引起的?经常会有一些机器视觉工程师认为USB接口的工业相机会造成丢帧现象。一般而言，工业相机丢帧与工业相机所采用的传输接口是没有关系的，无论是USB，还是1394、GigE、或者是CameraLink。设计不良的驱动程序或工业相机硬件才是造成丢帧的真正原因：设计不良的工业相机之所以会发生丢帧的现象，其实就是资料通道的堵塞，无法及时处理,所以新的图像进来时，前一张
MV-EB435i立体相机对垃圾分类开哥kg pytorch 深度学习卷积神经网络分类人工智能
最近在v社区发了一篇文章，懒得转移过来了链接：V社区-机器视觉技术交流社区-MV-EB435i立体相机对垃圾分类我觉得这篇文章对于刚入门深度学习想看点项目学点代码的刚刚好，因为我也是新手，嘻嘻嘻！希望这篇文章对大家有所帮助，如有错误请大家指正。
机器视觉|手势识别：基于YOLOv5的手部检测与MediaPipe的关键点估计 RockLiu@805 机器视觉 YOLO
手势识别：基于YOLOv5的手部检测与MediaPipe的关键点估计在实时计算机视觉应用中，手部检测与关键点估计是实现手势识别的重要基础。本文将介绍一种基于深度学习的手势识别技术方案，通过结合YOLOv5物体检测网络和MediaPipe关键点检测框架，实现实时的手部定位与关键点提取。技术背景gesturerecognition作为计算机视觉领域的重要研究方向，在HCI（人机交互）、遥控行为分析、虚
再添殊荣！移远通信工业智能品牌宝维塔™斩获AI创新应用奖移远通信算力人工智能工业智能
12月24日，2024中国物联网产业大会暨第21届慧聪品牌盛会在深圳圆满落幕。会上，移远通信凭借其工业智能品牌宝维塔™在推动AI技术落地与应用创新方面的卓越贡献，获颁“AI创新应用奖”。作为科技发展的前沿力量，AI技术正深刻改变着各行各业的生产模式和效率，尤其在工业领域，展现出了巨大潜力。宝维塔™是移远通信精心打造的工业智能品牌，专注于将人工智能、边缘计算、机器视觉、深度学习、软件算法平台等前沿技
视觉拣选机械臂骞途人工智能经验分享笔记
本项目机器人拣选工作站应用于以下场景：机器人拣选系统，用于3C产品，美妆个护产品，免注册模式，散乱、密排放置，目的箱视觉引导投放，可实现柔性放货。以上所有相关系统均包括相关配套设备，包括机器人本体、机器视觉系统、控制系统、视觉机械臂工作平台及保证系统正常使用的所有设备、辅材、支架和安全围栏等的设计、制造、包装、运输、安装、调试和售后服务，同时支持前后端系统及设备对接、联调工作。1.机械臂机械臂，即
必看！C# 与 HALCON 构建基于轮廓模板匹配实战宝典 AI_DL_CODE 机器视觉 c#人工智能机器视觉 HALCON 模板匹配特征点匹配
摘要：本文专注于利用C#与HALCON实现基于轮廓的模板匹配技术。从环境搭建，即HALCON安装、C#项目创建及库引用配置，到核心步骤如初始化HALCON环境、读取图像、提取轮廓、创建模板、执行匹配及显示结果等，结合详尽代码示例进行阐述。还深入探讨在实际应用中的优化策略，包括图像预处理、参数精细调整、多模板匹配及实时匹配实现等。旨在助力读者全方位掌握技术，为机器视觉相关项目开发提供有力支撑，高效解
图像处理与机器视觉 Be_auto 图像处理计算机视觉
1.图像处理与机器视觉的概念图像处理（ImageProcessing）是对图像进行分析、增强、变换等操作以改善图像质量或提取有用信息的过程。它通常涉及数字图像处理技术，包括滤波、边缘检测、图像分割、特征提取等。图像处理的目标可以是增强图像的视觉效果，或者使图像更适合于某种特定的机器分析。详细解释图文处理，就像是给照片和文档“化妆”和“打扮”一样。它可不是简单的涂抹或者穿衣搭配，而是需要掌握一系列“
10 大中文医学数据集汇总：涵盖神农中医药、中医药古籍、医学推理、医学问答……
医疗人工智能的快速发展离不开高质量数据集的支持。从疾病诊断到药物研发，再到个性化医疗，数据集在推动机器视觉、大模型等应用于医学领域中发挥着不可或缺的作用。医学数据集的形式多样，涵盖了不同维度和领域的数据资源。例如，在疾病诊断领域，像RJUA-QA这样的问答数据集推动了复杂医学知识的自动化应用；而在中医药领域，神农中医药数据集整合了传统中医药文献、临床案例和药方数据。针对于此，本文整理了医学领域的1
空间智能数据集（不定期更新）数据集
在人工智能领域的顶级会议NeurIPS上，斯坦福大学的杰出教授李飞飞发表了题为《FromSeeingtoDoing:AscendingtheLadderofVisualIntelligence》的主题演讲。在这次演讲中，李飞飞教授探讨了机器视觉的未来以及人工智能如何塑造我们的现实世界。她强调了空间智能的重要性，并将其视为全面智能的基石。李飞飞教授指出，解决空间智能问题是迈向全面智能的基础性、关键性
机器视觉3D上下料技术上的分析视觉人机器视觉杂说 3d c#人工智能 AI编程 opencv 开发语言
机器视觉3D上下料是工业自动化领域的重要应用，通过3D视觉技术引导机器人完成物料的精准抓取、定位和放置，尤其适用于复杂、无序或高精度的场景。以下是其核心内容梳理：核心组成3D视觉系统：硬件：常用3D相机（结构光、ToF、双目视觉等），如Kinect、IntelRealSense、工业级品牌（Keyence、康耐视，苏州大视通智能科技有限公司）。软件：点云处理（如PCL库）、三维匹配算法（ICP、深
PiscTrace以YOLOv12为例定义兴趣区域提高识视图别效率那雨倾城 PiscTrace OpenCV应用人工智能 YOLO 计算机视觉视觉检测 python opencv
在PiscTrace中，裁剪功能允许开发者将图像分割为感兴趣区域（ROI），然后针对此区域进行特定的处理，最终将结果重新合成。这种方法不仅可以大幅提高计算效率，还能够在处理高分辨率图像时避免由于输入尺寸过大导致的小目标无法被识别的问题。2160*38401.裁剪与贴合的运算流程在传统的机器视觉模型中，由于输入尺寸的固定要求，一旦图像尺寸较大，缩放后的目标往往会变得模糊，导致小目标难以被精确识别。而
目标检测YOLO实战应用案例100讲-TDI线阵相机林聪木数码相机计算机视觉人工智能
目录知识储备图像基础知识分辨率单位及换算算法原理一、TDI基本原理二、信噪比提升机制三、时间同步机制四、TDIvs传统线扫描技术五、TDI的技术挑战六、最新的TDI技术发展知识储备图像基础知识首先什么是机器视觉？计算机视觉就是让计算机去理解获取数字图像与视频中的信息。最终实现一个与人类视觉系统实现相同功能的自动化系统。什么是机器视觉中的图像的前置知识——颜色模型？最为常用的颜色模型，分别是RGB颜
T41LQ专为人工智能物联网（AIoT）应用设计，适用于智能安防、智能家居、机器视觉等领域软硬件资料+样品测试 li15817260414 君正人工智能物联网智能家居
君正（Ingenic）T系列芯片涵盖多个型号，每个型号根据不同应用需求提供了多个版本。以下是各型号及其主要版本：1.T23系列：T23N：标准版，适用于移动摄像机、安全监控、视频通话和视频分析等应用。T23ZN：佐罗标准版，功能与T23N类似，针对特定市场需求进行了优化。2.T31系列：T31L：简化版，适用于对成本和功耗有严格要求的应用场景。T31N：标准版，适用于广泛的智能视频应用。T31X：
机器视觉3D线激光轮廓仪的精度为什么高视觉人机器视觉杂说 3d 机器人 opencv 人工智能视觉检测
3D激光轮廓仪的高精度源于其硬件设计、光学系统、软件算法及环境控制等多方面的协同优化，以下是具体原因的分点解析：激光光源的高性能单色性与方向性：激光具有极好的单色性和准直性，光束发散角小，能形成稳定的光斑，减少光路偏差。高稳定性：激光器输出功率和波长稳定，避免因光源波动导致的测量误差。短波长优势：部分激光采用短波长（如蓝光），可检测更微小的表面细节，提升分辨率。高分辨率传感器CMOS/CCD传感器
人工智能基础知识 yzx991013 人工智能
首先分为两大类：一：机器视觉cv1.特征比较明显2.经典模型：cnn，resnet，deepface，yolov（1-12），vi-transformer。缺点：不能解决收听问题。3.落地，无人识别，轨道追踪，无人驾驶，（主要解决看的东西）。二：自然语言处理nlp（语音识别）处理（文本）方面解决（说和听的问题），RNN，LSTM，attention，transformer（基于规则的翻译，超越普通
计算机视觉 vs 机器视觉 | 机器学习 vs 深度学习：核心差异与行业启示程序员Linc 计算机视觉计算机视觉机器学习深度学习机器视觉
一、计算机视觉（CV）与机器视觉（MV）：从学术研究到工业落地的分水岭1.定义与目标差异计算机视觉（CV）目标是赋予计算机类似人类的视觉理解能力，通过算法对图像或视频中的目标进行识别、跟踪和语义理解。其核心是研究如何从二维图像反推三维世界的结构和规律。例如，自动驾驶中通过多摄像头融合实现道路场景理解，属于典型的CV任务。机器视觉（MV）聚焦于工业场景的自动化检测与控制，强调实时性和精准性。MV系统
使用MATLAB，进行机器视觉手势识别 Jack dudu 计算机视觉 matlab
matlab进行手势识别，源码+数据集使用MATLAB，进行机器视觉手势识别。调用计算机相机采集手势数据，通过GUI界面按钮的操作能够及时的停止和启动程序。程序包含相机采集模块，截取相机采集内容模块，手势识别结果模块，以及手势识别文本显示模块，将模块集中在GUI界面上，能够很清晰的观察到程序的运行状态。包含程序源码。
机器视觉初体验---镭雕码自动识别打印奇晓迹 labview 机器视觉数码相机
视觉初体验-镭雕码自动识别打印引言纸上得来终觉浅，绝知此事要躬行！这是第一个关于视觉方面的简单应用，刚开始以为很简单，但做起来却发现还有许多东西需要解决。从需求的分析到相机的选型，再到后面的开发调试等，经过不断的尝试与试错，最总形成了这样的一套切实可行的方案。本文主要介绍关于机器视觉的一个应用-关于镭雕码的识别。可应用于自动化生产线关于SN的识别。1基础硬件环境1、网线一根，用于通讯，一端接电脑，
机器人手眼标定及视觉引导技术杨驰晏Danielle
机器人手眼标定及视觉引导技术【下载地址】机器人手眼标定及视觉引导技术本文档旨在详细介绍**机器人手眼标定及视觉引导技术**的核心概念、实施步骤和应用实践。机器人手眼标定是工业自动化领域中的关键技术之一，主要用于校正机器人末端执行器（“手”）与机器视觉系统（“眼”）之间的相对位置和姿态关系。通过精确的标定，可以确保机器人能够基于视觉信息准确地进行物体定位、抓取或精密装配等操作，极大地提升自动化生产线
机器视觉线阵相机分时频闪选型/机器视觉线阵相机分时频闪选型视觉人机器视觉杂说数码相机计算机视觉人工智能
在机器视觉系统中，线阵相机的分时频闪技术通过单次扫描切换不同光源或亮度，实现在一幅图像中捕捉多角度光照效果，从而提升缺陷检测效率并降低成本。以下是分时频闪线阵相机的选型要点及关键考量因素：一、分时频闪技术的核心需求多光源同步控制分时频闪需相机支持多路光源独立控制，每行图像采集时切换光源类型（如明场、暗场、侧光等）或亮度。例如：苏州大视通智能科技CL-L8KM-R1-100KT相机提供8路光源控制信
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他