世界坐标系、相机坐标系、图像坐标系之间的关系

转载文章:https://www.cnblogs.com/gary-guo/p/6553155.html?share_token=5d357f6f-8321-43ee-8e90-85636d472643&tt_from=copy_link&utm_source=copy_link&utm_medium=toutiao_android&utm_campaign=client_share?=
一、四个坐标系简介和相互转换

相机模型为以后一切标定算法的关键,只有透彻的理解了,对以后的标定算法才有更好的理解。

首先要理解相机模型中的四个平面坐标系的关系:像素平面坐标系(u,v)、像平面坐标系(图像物理坐标系(x,y))、相机坐标系(xc,yc,zc)和世界坐标系(Xw,Yw,Zw)。

我们通过假设一些参数,使上面四个坐标系之间的坐标联系起来,这样我们就可以把拍摄的图片上的一个点坐标反推导出世界坐标系中的那个点坐标,这样就达到了三维重建的目的。而那些我们假设的参数,就是我们要标定的内外参数。

1、像素坐标与像平面坐标系之间的关系

确定他们的关系之前,我们可以假设每一个像素在u轴和v轴方向上的物理尺寸为dx和dy。仔细看下他们的模型可以推出以下公式。
世界坐标系、相机坐标系、图像坐标系之间的关系_第1张图片
世界坐标系、相机坐标系、图像坐标系之间的关系_第2张图片
解释:1、dx,dy,u0,v0其实都是我们假设出来的参数,dxdy表示感光芯片上像素的实际大小,是连接像素坐标系和真实尺寸坐标系的,u0,v0是图像平面中心,最终是要我们求的内外参数。
世界坐标系、相机坐标系、图像坐标系之间的关系_第3张图片
2、相机坐标系与世界坐标系之间的关系
世界坐标系、相机坐标系、图像坐标系之间的关系_第4张图片
解释:1、 在这个公式中,R为3x3矩阵,T为3x1,0为(0,0,0),简化用Lw表示后为4x4矩阵。
3、成像投影关系(相机坐标系与像平面坐标系)
世界坐标系、相机坐标系、图像坐标系之间的关系_第5张图片
在相机模型中我们可以得到以下公式:
世界坐标系、相机坐标系、图像坐标系之间的关系_第6张图片
4、得到公式
世界坐标系、相机坐标系、图像坐标系之间的关系_第7张图片
世界坐标系、相机坐标系、图像坐标系之间的关系_第8张图片
世界坐标系、相机坐标系、图像坐标系之间的关系_第9张图片
世界坐标系、相机坐标系、图像坐标系之间的关系_第10张图片
上图中表示的情况是像素坐标系和图像物理坐标系的两个坐标轴不是平行的关系,像素坐标系的两个坐标轴也不是垂直90°的关系,而图像物理坐标系的两个坐标轴是垂直关系。所以,我们在转换两个坐标轴的坐标之间的关系时就必须考虑像素坐标系两个坐标轴之间的夹角了。就有了上面的不同的内参矩阵,理解了就好了。
二、图像坐标与世界坐标之间的关系

世界坐标是怎样变换进摄像机,投影成图像坐标的呢?

图中显示,世界坐标系通过刚体变换到达摄像机坐标系,然后摄像机坐标系通过透视投影变换到达图像坐标系。可以看出,世界坐标与图像坐标的关系建立在刚体变换和透视投影变换的基础上。

世界坐标系、相机坐标系、图像坐标系之间的关系_第11张图片
首先,让我们来看一下刚体变换是如何将世界坐标系与图像坐标系联系起来的吧。这里,先对刚体变换做一个介绍:

刚体变换(regidbody motion):三维空间中, 当物体不发生形变时,对一个几何物体作旋转, 平移的运动,称之为刚体变换。

因为世界坐标系和摄像机坐标都是右手坐标系,所以其不会发生形变。我们想把世界坐标系下的坐标转换到摄像机坐标下的坐标,如下图所示,可以通过刚体变换的方式。空间中一个坐标系,总可以通过刚体变换转换到另外一个个坐标系的。
世界坐标系、相机坐标系、图像坐标系之间的关系_第12张图片
其中,Xc代表摄像机坐标系,X代表世界坐标系。R代表旋转,T代表平移。R、T与摄像机无关,所以称这两个参数为摄像机的外参数(extrinsic parameter)可以理解为两个坐标原点之间的距离,因其受x,y,z三个方向上的分量共同控制,所以其具有三个自由度。
世界坐标系、相机坐标系、图像坐标系之间的关系_第13张图片

好了,刚体变换就讲完了。大家应该都了解,世界坐标系到摄像机坐标系之间的转换过程了吧。

接下来,让我们看看摄像机坐标下的坐标如何投影到图像坐标系下,最终变为照片中的一个像素。这其中包含两个过程:一是从摄像机坐标到“空间图像坐标”(x,y)所发生的透视投影;二是从“连续图像坐标”到“离散图像坐标”(u,v)。后者我们已经在第一篇博文中解释过。所以在这里,主要介绍一下透视投影。
透视投影(perspective projection): 用中心投影法将形体投射到投影面上,从而获得的一种较为接近视觉效果的单面投影图。有一点像皮影戏。它符合人们心理习惯,即离视点近的物体大,离视点远的物体小,不平行于成像平面的平行线会相交于消隐点(vanish point)。
世界坐标系、相机坐标系、图像坐标系之间的关系_第14张图片
以图中B(XB,YB)点为例,在小孔成像摄像机模型下(几何分析的最常用模型)。这里的f为摄像机的焦距,其属于摄像机的内参数(intrinsic parameter)。其在成像平面上的投影点b(xb,yb)的坐标利用简单的相似三角形比例关系很容易求出:
在这里插入图片描述
上面两式也阐明了摄像机坐标与图像坐标之间的透视投影关系。

好吧,现在已经把图像坐标与世界坐标之间的这场对话所需经历的三个波折的过程加以了解释。即:刚体变换、透视投影、(x,y)换(u,v)(ps.这个在上一篇博文中讲过)。接下来用一张图把三个过程连接起来。实现从世界坐标(X,Y,Z)到(u,v)之间的转换。让图像坐标与世界坐标直接对话。

下图中的转换关系,都是用齐次坐标表达的,大家会发现这样的表达非常整洁。

其实这张图显示的过程还有一个名字:摄像机模型(camera model)。其实也就是摄像机的几何模型了。

将三者相乘,可以把这三个过程和在一起,写成一个矩阵:
世界坐标系、相机坐标系、图像坐标系之间的关系_第15张图片
P就是世界坐标到图像坐标的直接联系人,P就表示了一个投影相机,有下面公式:
在这里插入图片描述
注意在表示齐次坐标时,需要在符号上面加个小帽子。除去齐次坐标控制位P23,P具有11个自由度。
世界坐标系、相机坐标系、图像坐标系之间的关系_第16张图片
摄像机模型及其中涉及的坐标系等,是弄清3D重建几何框架的基础。可以把它们视为基本运算关系。后面对于三维重建几何框架的推导,都是要用到三个基本坐标系和摄像机模型的。

你可能感兴趣的:(机器学习与深度学习理论1,计算机视觉,人工智能)