《计算机视觉中的多视图几何》笔记(一)有限射影摄像机

目录

前言

1.二维射影几何与变换

1.1数学基础

1.2射影变换

2.有限射影摄像机

2.1有限摄像机模型

 2.2射影摄像机的几何含义

2.3射影摄像机对点的作用

2.3.1点对射线的反向投影

2.3.2点的深度


前言

学习资料来源为《计算机视觉中的多视图几何(原书第二版)》,本节主要学习基本射影几何和射影摄像机的几何知识

1.二维射影几何与变换

1.1数学基础

1.平面几何与代数的关系:向量就是,对称矩阵就是二次曲线

2.IR^{n}----n维标准欧式几何空间

IP^{2}----射影空间,在二维标准欧式几何的基础上拓展了理想点集(无穷远点),有了相异直线相交的概念

3.齐次向量:两个只相差一个全局缩放因子的向量

齐次坐标(x,y,0)^{T}不与IR^{2}中任何有限点对应(即理想点)

4.根据对偶定理,可以互换点和直线的作用

1.2射影变换

几何概念的定义: 

射影映射(保线变换,射影变换单应)是把IP^{2}的点(即齐次三维向量)映射到IP^{2}的点的一种可逆映射,它把直线映射到直线,更精确地说:

射影映射是IP^{2}到它自身的一种满足下列条件的可逆映射h:三点x_{1}x_{2}x_{3}共线当且仅当h(x_{1})h(x_{2})h(x_{3})也共线

 代数定义:

一个平面的射影变换是关于三维齐次向量的一种线性变换,并可以用一个非奇异3*3矩阵表示为

\begin{bmatrix} x_{1}^{,}\\ x_{2}^{,} \\ x_{3}^{,} \end{bmatrix}= \begin{bmatrix} h_{11} & h_{12} &h_{13} \\ h_{21} & h_{22} &h_{23} \\ h_{31}& h_{32} & h_{33} \end{bmatrix} \begin{bmatrix} x_{1}\\ x_{2} \\ x_{3} \end{bmatrix}

或更简单地表示为X^{'}=HX

 中心投影:把一张平面的点或直线通过固定公共点(投影中心)映射到另一张平面

透视映射:中心投影两张平面建立的坐标系都为直角坐标系。

2.有限射影摄像机

2.1有限摄像机模型

基本针孔模型如下图所示:

《计算机视觉中的多视图几何》笔记(一)有限射影摄像机_第1张图片 针孔摄像机几何

 考虑空间点到一张平面上的中心投影。令投影中心位于一个欧式坐标系的原点,投影中心C是摄像机中心,也称为光心,图中摄像机中心位于坐标原点。图像平面或聚焦平面Z=f.摄像机到图像平面的垂线是摄像机的主轴主射线,主轴与图像平面的交点P是主点。过摄像机中心且平行于图像平面的平面是摄像机的主平面

摄像机坐标系X_{cam}图像平面x的关系由相似三角形写成齐次为:

x=K[I|0]X_{cam}

K=\begin{bmatrix} f & & p_x \\ & f& p_y \\ & & 1\end{bmatrix}

其中,p_x,p_y是考虑主点偏置的主点坐标,K为摄像机标定矩阵。

对于CCD相机,图像坐标以像素来测量,则需要在每个方向上引入不同的尺度因子。若在x和y方向上图像坐标单位距离的像素数分别是m_x,m_y,那么由K还要左乘附加因子,得到CCD摄像机标定矩阵的一般形式:

K=\begin{bmatrix} fm_x & &m_xp_x \\ & fm_y &m_yp_y \\ & & 1 \end{bmatrix}=\begin{bmatrix} \alpha _x & &x_0 \\ & \alpha_y& y_0\\ & & 1 \end{bmatrix}

摄像机坐标系X_{cam}世界坐标系X的关系由旋转平移表示为:

X_{cam}=\begin{bmatrix} R&-R\tilde{C}\\ 0^{T}&1\\ \end{bmatrix}X

其中R表示摄像机坐标系方向的3*3旋转矩阵,\tilde{C}表示摄像机中心在世界坐标系的坐标。

则图像坐标系与世界坐标系的关系为:

x=PX=KR[I|-\tilde{C}]X=K[R|t]X

其中P为摄像机矩阵,t=-R\tilde{C},通常不显式地标出摄像机中心。K中的参数称为摄像机的内参数或摄像机的内部校准,R和\tilde{C}中的参数称为外参数外部校准,与摄像机在世界坐标系中的方位和位置有关。

事实上,P左边的3*3非奇异子矩阵M=KR可以看作是RQ分解,因此P可以写成如下形式: 

P=M[I|M^{-1}p_4]=[M|p_4]

其中p_4是P的最后一列。

 2.2射影摄像机的几何含义

1.摄像机中心

摄像机中心C是P的一维右零空间,即PC=0.

对于有限摄像机(M非奇异):

C=\binom{-M^{-1}p_4}{1}

对于无穷远摄像机(M奇异):

C=\binom{d}{0}

其中d是M的三维零向量,即Md=0.

2.列向量

射影摄像机的列是3维向量,几何含义是特殊的图像点。对于i=1,...,3,列向量p_{i}分别对应于X,Y,Z轴在图像上的消影点,即这些点是轴方向的图像。列p_{4}是坐标原点的图像。

《计算机视觉中的多视图几何》笔记(一)有限射影摄像机_第2张图片 射影矩阵的列定义的图像点

 3.行向量

射影摄像机的行是4维向量,在几何上可解释成特殊的世界平面。经证明,摄像机的主平面是P的最后一行P^{3}P^{1},P^{2}依赖于图像的x轴和y轴(与图像坐标系的选择有关)

《计算机视觉中的多视图几何》笔记(一)有限射影摄像机_第3张图片 射影矩阵的行定义的三张平面中的两张

 4.主点

事实上主点由下式计算:

x_0=Mm^3

 其中m^{3T}是M的第三行。

 5.主轴向量

v=det(M)m^3

是在主轴方向上指向摄像机前方的向量

2.3射影摄像机对点的作用

2.3.1点对射线的反向投影

根据映射x=PX,可以把空间中一个点X投影到一个图像点上,而给定一个图像点x,需要确定空间中哪些点被映射到该点,这些点组成过摄像机中心的一条空间射线。射线上有两个点已知,它们是摄像机中心和点P^{+}x,其中P^+P的伪逆,P^+=P^T(PP^T)^{-1}.由这两点的连线可以表示这条射线:

X(\lambda )=P^+x+\lambda C

对于有限摄像机,由图像点x反向投影交无穷远平面的点作为第二个点可以导出另一种形式:

X(\mu )=\mu \binom{M^{-1}x}{0}+\binom{-M^{-1}p_4}{1}

2.3.2点的深度

考虑摄像机主平面前后一点离主平面的距离。令X=(X,Y,Z,1)^T是一个3D点,P是有限摄像机的摄像机矩阵,设P(X,Y,Z,T)^T=\omega (x,y,1)^T,则摄像机主平面前方的点X的深度:

depth(X;P)=\frac{sign(detM)\omega }{T\left \| m^3 \right \|}

《计算机视觉中的多视图几何》笔记(一)有限射影摄像机_第4张图片 点的深度

你可能感兴趣的:(机器视觉学习笔记,计算机视觉)