作者:Kaustubh Sadekar Satya Mallick翻译:陈之炎
校对:王可汗
本文约3200字,建议阅读5分钟
本文为大家系统地介绍了使用OpenCV实现摄像头标定。
标签:摄像头,标定
摄像头是一种视觉传感器,它已经成为了机器人技术、监控、空间探索、社交媒体、工业自动化,甚至娱乐业等多个领域不可分割的组成部分。
在摄像头的多种应用中,了解摄像头的参数对于视觉传感器的有效使用至关重要。
在本文中,将阐述摄像头标定所涉及的步骤及其涵义。
此外,文中还共享了棋盘格模式示例图像的C++和Python代码。
对摄像头参数进行估计的过程称为摄像头标定。
通过摄像头标定,可以掌握摄像头的所有信息(参数或系数),从而可以确定现实世界中的三维点与摄像头捕获图像的二维投影(像素)之间的精确关系。
通常,摄像头标定意味着恢复以下两类参数:
1. 摄像头 /镜头系统的固有参数。如:镜头的焦距、光心和径向失真系数等参数。
2. 外部参数:这是指摄像头相对于某个世界坐标系的方向(旋转矩阵R和平移向量t)。
在下图中,采用了几何标定来估计透镜的参数,从而消除图像的失真。
对失真图像采用几何标定之后的效果
为了更好地理解整个标定过程,首先需要了解成像的几何特征。点击下面的链接来查看详细的解释。
成像的几何特征
正如前文所述,为了找出一个三维点在图像平面上的投影,首先需要使用外部参数(旋转矩阵R和平移向量t)将该点从世界坐标系转换到摄像头坐标系。
接下来,利用摄像头的固有参数,将该点投影到图像平面上。
将世界坐标中的三维点(Xw, YW,Zw)投影到图像坐标 (u、v)的关联方程如下所示:
其中,P是一个由两部分组成的3×4投影矩阵——包含固有参数的固有矩阵(K)、由3×3旋转矩阵R和3×1平移向量t组合而成的外部矩阵([R|t])。
如前文所述,固有矩阵是上三角矩阵
其中
fx,fy是x和y的焦距(通常二者是相同的)。
cx,cy是图像平面上光心的x、 y坐标,这一坐标通常用图像的中心来近似。
γ是各轴之间的斜度,通常为0。
摄像头标定的目的是:利用一组已知的3D点坐标(Xw, YW,Zw)及其相应的图像坐标(u、v)来找出3×3矩阵K、3×3旋转矩阵R和3×1平移向量t。当得出固有参数和外部参数的值之后,便实现了摄像头标定。
总之,摄像头标定算法应具备以下输入和输出:
1. 输入:已知二维图像坐标和三维世界坐标点的图像集合。
2. 输出:3×3摄像头固有矩阵,每幅图像的旋转矩阵和平移向量。
注:在OpenCV中,摄像头固有矩阵没有倾斜参数,所以该矩阵的形式为
有以下几种摄像头标定方法:
1. 模式标定:当能完全控制成像过程时,执行标定的最佳方法是从不同的角度捕捉一个物体或已知维度模式的多幅图像。本文中涉及到的基于棋盘格的方法属于这种标定。也可以使用已知尺寸的圆形模式来替代棋盘格模式。
2. 几何线索:有时场景中有如直线和消失点等其他的几何线索,可以利用于这些几何线索来进行标定。
3. 基于深度学习的标定:当对成像设置的控制很少时(例如:当只有一个场景的单一图像),可使用基于深度学习的方法获得摄像头的标定信息。
标定过程的步骤可用下图中的流程图来解释。
下面,来看看这些步骤是如何实现的:
第1步:用棋盘格模式定义真实世界的坐标
世界坐标系:世界坐标系由附在房间里一面墙上的棋盘格图案来固定,三维点是棋盘格中正方形的拐角。上述棋盘格中的任何一个角都可以定为世界坐标系的原点。XW轴和YW轴沿墙移动,ZW轴垂直于墙移动。因此,棋盘格上的所有点都在XY平面上(即ZW=0)。
在标定过程中,通过一组已知的三维点(Xw, YW,Zw)及其在图像中相应的像素位置(u,v)来计算出摄像头的参数。
对于3D点,可以在许多不同的方向上拍摄一个已知尺寸的棋盘格图案。将世界坐标映射到棋盘格上,由于所有的角点都在一个平面上,可以任意选取ZW为0。由于各点在棋盘格中是等间隔的,可以将其中一个点设为参考点(0,0),这样,便很容易定义出每个三维点的坐标(XW,YW)。
棋盘格图案的独特之处是:在图像检测过程中,它很容易检测到。不仅如此,棋盘格上的正方形是定位的理想选择,因为它们在两个方向的梯度比较尖锐。此外,这些方格与它们在棋盘线的交叉点有关。所有这些特点,都有利于方便地定位出正方形的拐角。
绘制出检测到的棋盘板拐角坐标后的结果图
上述图像用于标定摄像头。
接下来,确保棋盘格为静态,并通过移动摄像头拍摄出多幅棋盘图像。
或者,也可以保持摄像头不动,拍摄不同方向的棋盘格图案,从数学的角度来看,这两种情况很类似。
有了多幅棋盘格图像之后,世界坐标系上棋盘格上点的三维位置也已知,最后,需要找出的是图像在棋盘格上二维像素的位置。
OpenCV提供了一个名为findChessboardCorners的内置函数,利用这个函数可以找出棋盘格中各个角的坐标。下面,来看看这一代码的用法:
C++
Python
其中:
根据是否检测到一个棋盘格模式,输出为真或假。
良好的标定应完全满足精度的要求。为了获得良好的结果,应对各个角的位置进行调整,以获得亚像素级的精度。
OpenCV有一个 cornerSubPix函数,利用这个函数获取原始图像和棋盘格角的位置,并在原始位置的小范围内找出最佳的位置角度。该算法的本质是一个迭代过程,为此需要指定终止条件(如,迭代次数和/或精度)
C++
Python
其中
摄像头标定的最后一步是:将世界坐标中的三维点及其在所有图像的二维位置传递给OpenCV的calibrateCamera 方法。这是基于张正友的一篇论文。数学上有点复杂,需要线性代数的背景知识。
来看看calibrateCamera方法的语法
C++
Python
其中
摄像头标定源代码
摄像头标定的Python和C++代码如下。利用下面的链接,下载所有的图像和代码则更为简单。
请仔细阅读代码的注释,它们对每一步都在做什么作了详细解释。
请通读每一条注释,以了解每一步都实现了什么。
往期回顾:
独家|OpenCV 1.1 Mat - 基本图像容器(附链接)
独家|OpenCV 1.3 矩阵的掩膜操作(附链接)
独家|OpenCV 1.5 利用OpenCV叠加(混合)两幅图像
独家|OpenCV 1.6 改变图像的对比度和亮度!
独家|OpenCV 1.7 离散傅里叶变换
独家|OpenCV 1.8 使用XML和YAML文件实现文件的输入/输出
独家|OpenCV 1.9 如何利用OpenCV的parallel_for_并行化代码(附代码)
编辑:于腾凯
校对:汪雨晴
译者简介
陈之炎,北京交通大学通信与控制工程专业毕业,获得工学硕士学位,历任长城计算机软件与系统公司工程师,大唐微电子公司工程师,现任北京吾译超群科技有限公司技术支持。目前从事智能化翻译教学系统的运营和维护,在人工智能深度学习和自然语言处理(NLP)方面积累有一定的经验。业余时间喜爱翻译创作,翻译作品主要有:IEC-ISO 7816、伊拉克石油工程项目、新财税主义宣言等等,其中中译英作品“新财税主义宣言”在GLOBAL TIMES正式发表。能够利用业余时间加入到THU 数据派平台的翻译志愿者小组,希望能和大家一起交流分享,共同进步
翻译组招募信息
工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。
你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。
其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。
点击文末“阅读原文”加入数据派团队~
转载须知
如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。
发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。
点击“阅读原文”拥抱组织