三维坐标变换——旋转矩阵与旋转向量

用 opencv 进行过双目相机标定的同学都知道,单目标定 calibrateCamera() 函数能够对每一张标定图像计算出一对 rvec 和 tvec,即旋转平移向量,代表世界坐标系到相机坐标系的转换关系。而 stereoCalibrate() 函数则可以计算出旋转矩阵 R 和平移向量 T,代表左右相机坐标系之间的转换关系。同样是坐标变换,平移倒总是向量,但旋转怎么有时是向量,有时又是矩阵呢?


旋转矩阵

参考csxiaoshui的博客,三维旋转变换可以看成是矩阵乘法运算,即:

xyz=Rxyz [ x ′ y ′ z ′ ] = R ∗ [ x y z ]
其中 R R 就是三阶的旋转矩阵。仅仅考虑绕 X X Y Y Z Z 单个轴旋转 θ θ (右手螺旋), R R 分别为:
RX=1000cosθsinθ0sinθcosθRY=cosθ0sinθ010sinθ0cosθRZ=cosθsinθ0sinθcosθ0001 R X = [ 1 0 0 0 c o s θ − s i n θ 0 s i n θ c o s θ ] R Y = [ c o s θ 0 s i n θ 0 1 0 − s i n θ 0 c o s θ ] R Z = [ c o s θ − s i n θ 0 s i n θ c o s θ 0 0 0 1 ]
绕任意轴旋转则可以分解成绕三个坐标轴旋转的叠加,最终得到的旋转矩阵 R R 便是上述三个矩阵的乘积。

矩阵运算显然是计算机三维坐标变换最简单方便的计算方法,因此在 opencv、opengl、工业机器人等开发中,提到位姿旋转变换,多半用的是旋转矩阵。然而,用矩阵来表示一个旋转关系有两个缺点:
首先,通过旋转矩阵不能直观地看出旋转的方向和角度,假设给定一个旋转矩阵,要求旋转方向不变,旋转角度变成一半,那么新的旋转矩阵计算起来就比较麻烦了。
另一方面,旋转变换本身只有3个自由度,但旋转矩阵有9个元素,因此旋转矩阵中的元素不是相互独立的,这在非线性优化中会带来问题。


旋转向量

向量旋转公式最早由 Rodrigues 提出,用一个三维向量来表示三维旋转变换,该向量的方向是旋转轴,其模则是旋转角度。百度百科中有其详细的介绍与推导,我在这边只列一下最重要的公式。
设旋转向量的单位向量为 r r ,模为 θ θ 。三维点(或者说三维向量) p p 在旋转向量 r r 的作用下变换至 p p ′ ,则:

p=cosθp+(1cosθ)(pr)r+sinθr×p p ′ = cos ⁡ θ ⋅ p + ( 1 − cos ⁡ θ ) ( p ⋅ r ) r + sin ⁡ θ ⋅ r × p
显然,旋转向量代表的变换关系十分直观,但运算上要比矩阵形式更加复杂。


相互转换

用矩阵形式和向量形式表示旋转变换各有优劣势,因此经常需要来回转换,这里跟数学中的李群与李代数有所关联,本人目前还一知半解,可以参考半闲居士的博客。
opencv 中有函数 Rodrigues() 用于旋转矩阵和旋转向量的转换。参照opencv文档,设旋转向量的单位向量 r=[rx ry rz]T r = [ r x   r y   r z ] T ,旋转角度为 θ θ ,对应的旋转矩阵为 R R ,则 r r R R 的转换是:

R=cosθI+(1cosθ)rrT+sinθ0rzryrz0rxryrx0 R = cos ⁡ θ I + ( 1 − cos ⁡ θ ) r r T + sin ⁡ θ [ 0 − r z r y r z 0 − r x − r y r x 0 ]
其中 I I 是三阶单位矩阵。反过来 R R r r 的转换则可以利用等式:
RRT2=sinθ0rzryrz0rxryrx0 R − R T 2 = sin ⁡ θ [ 0 − r z r y r z 0 − r x − r y r x 0 ]

opencv 官方文档中的原话是:

A rotation vector is a convenient and most compact representation of a rotation matrix (since any rotation matrix has just 3 degrees of freedom). The representation is used in the global 3D geometry optimization procedures like calibrateCamera, stereoCalibrate, or solvePnP .

称旋转向量是旋转矩阵方便而且最紧凑的表示方法,被用于一些需要全局三维几何优化的函数中。

你可能感兴趣的:(笔记)