欧阳紫洲

硬核3-D视觉 - 三维空间的刚体运动

我将不会定义时间、空间、地点和运动，因为它们对于所有人来说都是显然既定的。

—— 艾萨克 · 牛顿

欧几里得运动，也叫做“刚体运动”，以及透视投影，是处于研究3D场景和它的2D图像之间几何关联的核心的两组基本变换。

刚体运动对相机如何运动进行建模，透视投影则描述相机的成像原理。

很早以前，刚体运动和透视投影是分开分别独立进行研究的。

本文介绍三维欧氏空间以及其中的刚体运动。下一章将关注相机的投影模型，可以参考链接：硬核3-D视觉：Image Formation。两章内容都需要一些线性代数的基础知识。

2.1 三维欧氏空间

我们用来表示三维欧氏空间。三维欧氏空间可以用笛卡尔坐标系表示，空间中的点 $p \in E^3$ 可以用在 $\mathbb{R}^3$ 中的三个坐标表示：

$X = \begin{bmatrix} X_1 & X_2 & X_3 \end{bmatrix}^T = \begin{bmatrix} X_1\\ X_2 \\ X_3 \end{bmatrix} \in \mathbb{R}^3$

有时我们也用 $\begin{bmatrix} X & Y & Z \end{bmatrix}$ 表示单独一个坐标系下的点。至此，就建立了到 $\mathbb{R}^3$ 的一一对应。

定义2.1 向量：欧氏空间中，向量由一对点 $p, q \in E^3$ 确定，表示为 $v = \vec{pq}$ 。

点经常被作为的基础点，在坐标系中，被表示为 $\begin{bmatrix} v_1 & v_2 & v_3 \end{bmatrix}^T \in \mathbb{R}^3$ 。如果点有坐标，而有坐标，那么就有坐标为： $v = Y - X \in \mathbb{R}^3$ 。

我们在前面定义的向量是有界向量（bound vector）。

我们也可以定义自由向量（free vector）的概念。自由向量不依赖基础点，如果我们有两组点，并且其坐标满足，我们就可以说它们定义了同一个向量。直觉告诉我们，向量就可以在当中自由移动了。为了不是一般性，我们可以认为自由向量的基础点就是它所在的坐标系的坐标原点，那么就有。当然，这里就会给读者带来混淆，在这儿表示的是向量的坐标，而由于我们将点设称了坐标原点，那么点的坐标变成了和Y坐标相同的了。

读者必须始终在脑海中保持这样的概念，即点和向量是不同的几何对象。这一点非常重要，因为我们将会很快发现，刚体运动在点和向量上的表现是不一样的。

所有三维向量的集合构成了线性向量空间（linear vector space）。两个向量 $v, u \in \mathbb{R}^3$ 的线性组合定义为： $\alpha v + \beta u = \begin{bmatrix} \alpha v_1 + \beta u_1 ,& \alpha v_2 + \beta u_2 ,& \alpha v_3 + \beta u_3 \end{bmatrix}^T \in \mathbb{R}^3, \forall \alpha, \beta \in \mathbb{R}$ 。

的欧氏度量被简单的定义为向量空间 $\mathbb{R}^3$ 的内积。当两个向量的内积为0，我们就说这两个向量正交。

有了内积这样一个的度量，我们就不仅仅可以度量两个点的距离和两个向量的夹角，还可以计算曲线的长度，或者一个区域的大小。

内积的结果是一个实标量。而叉积则是一个向量。

定义2.2 向量叉积：欧氏空间中，向量 $v, u \in \mathbb{R}^3$ 的叉积是由如下公式给定的一个三维坐标向量：

$u \times v = \begin{bmatrix} u_2v_3 - u_3v_2\\ u_3v_1 - u_1v_3\\ u_1v_2 - u_2v_1 \end{bmatrix} \in \mathbb{R}^3$

向量叉积满足下面的公式：

$u \times (\alpha v + \beta w) = \alpha u \times v + \beta u \times w, \forall \alpha ,\beta \in \mathbb{R}$

显然也可以证明下列各式：

$\left \langle u \times v, u \right \rangle = \left \langle u \times v, v \right \rangle = 0, u \times v = - v \times u$

可以证明，向量的叉积 $u \times v$ 还可以表示成 $\hat u v$ ，其中 $\hat u$ 为如下形式的矩阵：

$\hat u \doteq \begin{bmatrix} 0 & -u_3 & u_2\\ u_3 & 0 & -u_1\\ -u_2 & u_1 & 0 \end{bmatrix} \in \mathbb{R}^{3\times3}$

显然， $\hat u$ 是一个反对称矩阵，这意味着， $\hat u = - \hat u^T$ 。

叉积满足右手定则。

同时，我们也可以看到，叉积很自然的定义了一个从三维向量到3x3的反对称矩阵 $\hat u$ 的映射。它相反的映射从反对称矩阵到三维向量也是true。

向量空间 $\mathbb{R}^3$ 和所有的反对称矩阵所组成的空间（后面会对这个空间进行解释）同构（数学上同构意味着存在一一的映射保存着向量空间的结构）。该同构经常用下面的符号和反映射符号表示：

$\wedge : so(3) \rightarrow \mathbb{R}^3; u \mapsto \hat u$

$\vee : so(3) \rightarrow \mathbb{R}^3 ; \hat u \mapsto \hat u^\vee = u.$

2.2 刚体运动

对于刚体运动，我们没必要描述刚体上每一个点的运动，可以从下图看到，我们只需要描述一个点以及以这个点为原点的坐标系的运动即可。

因此，如果和如果是任意两个在刚体上的点和的坐标（时间的函数）。那么这两点之间的距离是恒定的： $X(t) - Y(t) \equiv constant, \forall t \in \mathbb{R}.$

刚体运动就成了一组描述刚体上每个点的坐标如何在满足上式的情况下，在时间上的变化的映射簇。映射是这样的： $g(t) : \mathbb{R}^3 \mapsto \mathbb{R}^3; X \mapsto g(t) (X).$ 如果我们只关心刚体运动的初始和结束，那么就有如下的刚体替代， $g : \mathbb{R}^3 \mapsto \mathbb{R}^3; X \mapsto g(X).$

除了对点坐标进行变换，变换g也对向量进行变换。假设是由两个点确定的向量，，那么经过了变换g，向量变为： $u = g_*(v) \doteq g(Y) - g(X).$

由于变换保留着向量的模长，所以有，对于所有的三维空间向量 $v \in \mathbb{R}^3$ 都有 $\left \| g_*(v) \right \| = \left \| v \right \|$ 。

如果一个映射，能够保持距离不变，那么这种映射就叫做欧氏变换。在3维空间，所有的欧氏变换表示为 $\mathbb{E}(3)$ 表示。

仅仅保持距离不变是不够的，对于刚体变换来说，还要保持相对角度或者姿态是不变的。所以刚体运动的变换被称为特殊欧氏变换（special euclideam transform）。特殊意味着，角度也是保持不变的。所有的特殊欧氏变换组成的矩阵变换群写作：.

定义2.5 刚体运动或者特殊欧氏变换。映射 : $\mathbb{R}^3 \mapsto \mathbb{R}^3$ 是一个刚体运动或者特殊欧氏变换，当且仅当满足下面两条性质:

$1. norm: \left \| g_*(v) \right \| = \left \| v \right \|, \forall v \in \mathbb{R}^3$

$2. cross product: g_*(u) \times g_*(v) = g_*(u \times v), \forall u ,v \in \mathbb{R}^3$

那么很自然的就有推论：

$1. \left \langle u,v \right \rangle = \left \langle g_*(u), g_*(v) \right \rangle$

$2. \left \langle g_*(u), g_*(v) \times g_*(w) \right \rangle = \left \langle u, v \times w \right \rangle$

由于上式2表示的是由三个不共面向量张成的四方体的体积，因此刚体运动同样保持体积不变。

为什么要如此强调特殊欧氏变换的性质呢？

因为如果我们假定物体上有一个附着的坐标系，附着在物体的固定点上，并且有三个相互正交的坐标轴向量满足：

$e_i^Te_j = \delta_{ij} \doteq \left\{\begin{matrix} 1 for \: i = j \\ 0 for \: i \neq j \end{matrix}\right. \; (2.6)$

如果 $e_1 \times e_2 = e_3$ ，那么经过刚体运动，还有 $g_*(e_i)^T g_*(e_j) = \delta_{ij}, g_*(e_1) \times g_*(e_2 ) = g_*(e_3)$ 。

到这，我们就可以说，刚体的运动，可以通过这样一个附着在刚体上的坐标系来进行描述了。

下图2.3中，有一个相机坐标系和一个世界坐标系，相机的位姿由以下两部分确定：

1. 平移部分：世界坐标系原点到相机坐标系原点的向量，我们写作。

2. 旋转部分：相机坐标系三轴相对于世界坐标系的旋转部分，用旋转矩阵表示。

世界坐标系的选择本质上，是任意选取的。我们关注的只是后续相机坐标系相对于世界坐标系的相对运动。

如果我们移动一个刚体，我们显然也可以相反的把它移回去，我们也同样可以把很多移动过程组合称一个。这种可以反向和组合的性质在数学上通过群加以刻画。我们将很快看到，刚体运动可以组成一个叫做特殊欧氏群的矩阵群。同时，仅仅有这样的概念是不够的，我们还要了解如何定义明确的表示并将其用于数学计算。接下来的部分，我们将研究通过矩阵来表示刚体的运动。我们将说明任何刚体的运动都能够通过一个4x4的矩阵来表示。

我们将从旋转部分开始。

2.3 旋转运动及其表示

2.3.1 正交矩阵表示旋转

假设我们有一个刚体绕固定点 $o \in \mathbb{E}^3$ 。为了不是一般性，我们假定世界坐标系的原点就是旋转中心，如果不是这样，我们就把世界坐标系的原点移到。我们现在将另外一个坐标系的原点也放到，和之间的旋转如图2.4：

坐标系相对于坐标系的旋转可以由三个相互正交的向量完全确定：。

三个向量分别就是相机坐标系三个坐标轴方向的单位向量（三个向量的坐标由世界坐标系下表示）。旋转可以通过一个 $3 \times 3$ 矩阵表示：

$R_{WC} \doteq \begin{bmatrix} r_1 & r_2 & r_3 \end{bmatrix} \in \mathbb{R}^3$

三个向量满足正交性质，可以写成 $R_{WC}^TR_{CW} = R_{CW}R_{WC}^T = I$ 。

所有这些正交性质满足的矩阵组成特殊正交群：

$SO(3): \left \{ R \in \mathbb{R}^3 | R^TR= I, det(R) = +1 \right \}$

绕Z轴的旋转角 $\theta$ 可以表示为，其他几个轴的旋转也可以类似的获得：

$R_Z(\theta) = \begin{bmatrix} \cos(\theta) & -sin(\theta) & 0\\ \sin(\theta) & cos(\theta) & 0\\ 0 & 0 & 1 \end{bmatrix}$

回到图2.4，只要我们知道一个点在相机坐标系下的坐标 $X_{1c}, X_{2c}, X_{3c}$ ，同时还知道相机坐标系的三个向量的在世界坐标系下的坐标表示（就是把相机坐标系原点移动到世界坐标系下，相机三个正交的坐标轴的单位向量在世界坐标系下的表示），就可以得到点在世界坐标系下的坐标： $X_w = [r_1X_{1c} + r_2X_{2c} + r_3X_{3c}] = R_{wc} X_c$ ，其中 $R_{wc}$ 就表示相机坐标系到世界坐标系的旋转向量。

2.3.2 旋转的正则指数坐标

我们知道旋转矩阵R是 $3 \times 3$ 矩阵，并且 $\in SO(3)$ 。看起来R有9个元素，但是由于R存在额外的约束，也就是正交性，实际上给R施加了六个独立约束，所以R的自由度小于9个，旋转矩阵的维度空间的维数只有3个。

本章将介绍如何将R参数化的过程。

给定一系列的连续旋转 $R(t) \rightarrow SO(3)$ 。必须满足如下约束条件：

, 将该式对时间求导，得

$\dot{R}(t)R^T(t) + R(t) \dot{R}^T(t) = 0 \Rightarrow \dot{R}(t)R^T(t) = - (\dot{R}(t)R^T(t))^T.$

结果表明，矩阵 $\dot{R}(t)R^T(t)$ 是一个 $3\times 3$ 反对称矩阵。那么，我们就根据本书中之前的结论，一个反对称矩阵，必然对应着唯一的一个三维向量， $\omega (t) \in \mathbb{R}^3$ ，有 $\dot{R}(t)R^T(t) = \hat \omega(t)$ ，等式的两边同时右乘，得 $\dot{R}(t) = \hat \omega(t)R(t) \; (2.9)$ ，对于该式，假定在时，，我们就有了旋转矩阵的在的一阶倒数 $\dot{R}(t_0) = \hat \omega (t_0)$ ，那么根据泰勒展开准则，在单位矩阵附近，可以利用导数的性质对矩阵进行近似，就可以用反对称矩阵来近似旋转矩阵： $R(t_0 + dt) \approx I + \hat \omega (t)dt.$

那么，就有，所有的反对称矩阵所组成的空间可以如下表示：

$so(3) \doteq \left \{ \hat \omega \in \mathbb{R}^{3 \times 3} | \omega \in \mathbb{R}^3 \right \}{\color{Red} }$

它们还有一个别名，叫做旋转矩阵群的切空间（tangent space）。

以上表明，的局部元素只依赖三个参数， $(\omega_1, \omega_2, \omega_3)$ 。

知道了局部性质之后，那么接下来我们进一步讨论。

先假设 $\hat \omega(t)$ 是常数 $\hat \omega$ ，那么就不是t的函数了。那么就有： $\dot{R}(t) = \hat \omega R(t) \; (2.10)$ 。

根据上文，容易得到可以解释为下面线性常微分方程的状态转移矩阵：

$\dot{x}(t) = \hat \omega x(t), x(t) \in \mathbb{R}^3 \;, (2.11)$

那么常微分方程有解：

$x(t) = e^{\hat \omega t} x(0) ,\; (2.12)$

$e^{\hat \omega t}$ 是矩阵的指数映射， $e^{\hat \omega t} = I + \hat \omega t + \frac{(\hat \omega t)^2}{2!} + \cdots + \frac{(\hat \omega t)^n }{n!} + \cdots \;, (2.13)$ ， $e^{\hat \omega t}$ 经常写作 $\exp(\hat \omega t)$ ，由于我们假设为作为初始条件，那么就有 $R(t) = e^{\hat \omega t} \;, (2.14)$ 。

为了证明矩阵 $e^{\hat \omega t}$ 的确是旋转矩阵，我们可以通过2.13式证明， $(e^{\hat \omega t})^{-1} = e^{- \hat \omega t} = e^{\hat \omega^T t} = (e^{\hat \omega t})^T$ .

因此 $(e^{\hat \omega t})^Te^{\hat \omega t} = I$ 。

对于2.14式的物理解释是，如果 $\left \| \omega \right \| = 1$ ，那么 $R(t) = e^{\hat \omega t}$ 就是绕轴 $\omega \in \mathbb{R}^3$ 的弧度为的旋转。更一般的，t可以被吸收进 $\hat \omega t$ ，从而有 $R = e ^ {\hat \omega}$ ， $\omega$ 拥有任意的范数。2.13式所表示的指数映射，就是从到的映射。

$\exp : so(3) \rightarrow SO(3); \hat \omega \mapsto e^{\hat \omega}$ .

到现在，我们是怎么获得2.14式的呢，我们做了一个假设，假设 $\omega(t)$ 是常数，但是这个假设显然不会是经常成立的，问题来了：

所有的旋转矩阵 $R \in SO(3)$ 都可以用式2.14的形式表达吗？

答案是可以。

定理2.8 对数映射：对于任意 $R \in SO(3)$ ，都存在一个 $\omega \in \mathbb{R}^3$ ，使得 $R = \exp(\omega)$ 。这个映射的相反映射是 $\hat \omega = \log(R)$ 。

定理证明如下：

如果R不是单位阵，那么有：

$R = \begin{bmatrix} r_{11} & r_{12} & r_{13}\\ r_{21} & r_{22} & r_{23}\\ r_{31} & r_{32} & r_{33} \end{bmatrix}$ ，对应的 $\omega$ 为：

$\left \| \omega \right \| = \cos^{-1}(\frac{trace(R) - 1}{2}), \frac{\omega}{\left \| \omega \right \|} = \frac{1}{2 \sin(\left \| \omega \right \|)}\begin{bmatrix} r_{32} - r_{23}\\ r_{13} - r_{31}\\ r_{21} - r{12} \end{bmatrix}$

如果R是单位矩阵，那么 $\omega = 0$ ，旋转角任意。

至此，我们可以得到，任何旋转矩阵，都可以通过一个旋转轴 $\omega$ 以及其模 $\left \| \omega \right \|$ 作为旋转角来获得。然而，从到的映射并不是唯一的，由于任何 $2k\pi\omega$ 的旋转，都可以获得相同的旋转矩阵R。其对应方式就是罗德里格斯公式计算得到 $R = e^{\hat \omega }$ 。

根据定理2.8，我们也可以通过特定的旋转矩阵计算得到对应的 $\omega$ 。当给定一个 $\omega$ 我们当然可以通过2.13式中的指数映射获得对应的旋转矩阵R，但是罗德里格斯公式给了我们一个更为简便的计算方法。

定理2.9 罗德里格斯公式：给定一个 $\omega \in \mathbb{R}^3$ ，矩阵的指数映射 $R = e^{\hat \omega}$ 可以通过下式计算：

$e^{\hat \omega} = I + \frac{\hat \omega}{\left \| \omega \right \|}\sin(\left \| \omega \right \|) + \frac{\hat \omega ^ 2}{\left \| \omega \right \|^2} (1 - \cos(\left \| \omega \right \|)). \; (2.16)$

证明：令 $t = \left \| \omega \right \|$ ，重新定义 $\omega$ 为单位向量，我们能发现， $\hat \omega^2 = \omega \omega^T - I, \hat \omega ^ 3 = - \hat \omega$ ，那么指数映射就能够简化为 $e^{\hat \omega t} = I + (t - \frac{t^3}{3!} + \frac{t^5}{5!} - \cdots) \hat \omega+ (\frac{t^2}{2!} - \frac{t^4}{4!} + \frac{t^6}{6!} - \cdots)\hat \omega^2$ ，而 $(t - \frac{t^3}{3!} + \frac{t^5}{5!} - \cdots)$ 恰好就是 $\sin(t)$ 的泰勒展开式， $(\frac{t^2}{2!} - \frac{t^4}{4!} + \frac{t^6}{6!} - \cdots)$ 恰好是 $(1 - \cos(t))$ 的泰勒展开式，从而得证。

通过泰勒公式，我们很容易就得到，如果 $\left \| \omega \right \| = I$ 以及 $t = 2k\pi$ ，我们就有：

$e^{\hat \omega 2k\pi} = I ,\; \; \forall k \in \mathbb{Z}$

此外也能够得出结论，指数映射不具备交换性和结合律，也就是说： $e^{\hat \omega_1}e^{\hat \omega_2} \ne e^{\hat \omega_2}e^{\hat \omega_1} \ne e^{\hat \omega_2 + \hat \omega_1}$ ，除非有 $\hat \omega_1 \hat \omega_2 = \hat \omega_2 \hat \omega_1$ 。

一般的， $\hat \omega_1 \hat \omega_2$ 和 $\hat \omega_2 \hat \omega_1$ 之间的区别，被称为上的李括号，写作：

$\left [ \hat \omega_1, \hat \omega_2 \right ] = \hat \omega_1\hat \omega_2 - \hat \omega_2\hat \omega_1, \forall \hat \omega_1, \hat \omega_2 \in so(3)$ .从这里的定义也可以发现， $\left [ \hat \omega_1, \hat \omega_2 \right ]$ 也是上的反对城矩阵，的线性结构以及李括号一道，组成了李代数中的李群。

给定一个 $\hat \omega$ ，所有由此映射得到的旋转矩阵 $e^{\hat \omega t} , \forall t \in \mathbb{R}$ ，就组成了一个子群，在这个子群（也即平面旋转群）里面，是满足结合律和交换律的，对于同一个 $\omega \in \mathbb{R}^3$ ，我们有 $e^{\hat \omega t_1}e^{\hat \omega t_2} = e^{\hat \omega t_2}e^{\hat \omega t_1} = e^{\hat \omega (t_1 + t_2)}, \forall t_1, t_2 \in \mathbb{R}$ 。

当然，还有其他的对于旋转矩阵进行局部参数化的方法，比如四元数以及欧拉角。选择指数映射，是因为它的形式更简单并且也更加具有启发性。

2.4 刚体运动及其表示

此前我们研究了纯旋转。我们现在将更加一般性的研究刚体运动，旋转（rotation）和平移（translation）。

图2.5展示了一个刚体的C坐标系，如果要描述物体上的点p在世界坐标系下的坐标，显然向量是刚体坐标系原点相对于世界坐标的平移 $T_{wc} \in \mathbb{R}^3$ 和在世界坐标系下面描述的向量的结合。

由于是在相机坐标系下的p点的坐标，那么相对于世界坐标系，它就变成了 $R_{wc}X_c$ ， $R_{wc}$ 是两个坐标系之间的相互旋转，那么最终:

$X_w = R_{wc}X_c + T_{wc}, \; (2.17)$ .

通常，我们将刚体运动记做： $g_{wc} = (R_{wc}, T_{wc})$ ，或者简单的记为，g同时描述了刚体的平移和旋转。紧凑的形式上，我们写作：

$X_w = g_{wc}X_c$

所有可能的刚体运动我们称之为特使欧式变换：

$SE(3) \doteq \left \{ g = (R,T ) | R \in SO(3), T \in \mathbb{R}^3 \right \}$

必须指出，尚不是一个当中的矩阵。为了获得这样的矩阵表示，我们必须引入奇次坐标的概念。

2.4.1 奇次坐标

显然，式2.17描述的变换过程已经不是线性变换，而是仿射变换，下面我们将通过奇次坐标的使用，使得这种仿射变换变为线性变换的形式。通过在 $X = [X_1, X_2, X_3]^T \in \mathbb{R}^3$ 的坐标末尾再添加一位1，使得属于三维欧氏空间的点成为一个四维的向量，记做：

$X = \begin{bmatrix} X_1\\ X_2\\ X_3\\ 1 \end{bmatrix} \in \mathbb{R}^4$

事实上，向量的奇次坐标可以由此由点的奇次坐标指定，向量的奇次坐标为：。

$\bar{v} = \begin{bmatrix} v\\ 0 \end{bmatrix} = \begin{bmatrix} X(q)\\ 1 \end{bmatrix} - \begin{bmatrix} X(p)\\ 1 \end{bmatrix} = \begin{bmatrix} v_1\\ v_2\\ v_3\\ 0 \end{bmatrix} \in \mathbb{R}^4.$

注意到，在 $\mathbb{R}^4$ 中，上式中的向量组成了一个子空间，所有原来的形式的向量 $v \in \mathbb{R}^3$ 都完美的被这种表示保存了。

使用新的表示方式，放射变换（2.17）就可以写成“线性”形式：

$\bar{X}_w = \begin{bmatrix} X_w\\ 1 \end{bmatrix} = \begin{bmatrix} R_{wc} & T_{wc}\\ 0 & 1 \end{bmatrix}\begin{bmatrix} X_c\\ 1 \end{bmatrix} \doteq \bar{g}_{wc} \bar{X}_c,$

这个式子当中 $4 \times 4$ 矩阵 $\bar{g}_{wc} \in \mathbb{R}^{4 \times 4}$ 就叫做刚体运动的奇次表示，对于一个刚体运动它的奇次表示就是：

$\bar{g} = \begin{bmatrix} R & T\\ 0 & 1 \end{bmatrix} \in \mathbb{R}^{4 \times 4}. \;\;\;\;\;\;\;\;\;\;\; (2.18)$

特殊欧氏变换（special Euclidean transformation）的定义如下：

$SE(3) \doteq \left \{ \bar{g} = \begin{bmatrix} R &T \\ 0&1 \end{bmatrix} \left.\begin{matrix} \\ \end{matrix}\right| R \in SO(3) , T \in \mathbb{R}^3 \right \} \subset \mathbb{R}^{4 \times 4}$

说明，特殊欧氏变换矩阵是 $\mathbb{R}^{4 \times 4}$ 矩阵空间的子集。

满足群的所有性质， $\forall g_1, g_2$ 以及 $g \in SE(3)$ ，我们有：

$\bar{g}_1\bar{g}_2 = \begin{bmatrix} R_1 & T_1\\ 0 & 1 \end{bmatrix} \begin{bmatrix} R_2 & T_2\\ 0 & 1 \end{bmatrix} = \begin{bmatrix} R_1R_2 & R_1T_2 + T_1\\ 0 & 1 \end{bmatrix} \in SE(3)$

以及：

$\bar{g}^{-1} = \begin{bmatrix} R & T\\ 0 & 1 \end{bmatrix}^{-1} = \begin{bmatrix} R_T & -R^TT\\ 0 & 1 \end{bmatrix} \in SE(3)$

在奇次坐标的表示下面，刚体运动 $g \in SE(3)$ 作用于向量 $v = X(q) - X(p) \in \mathbb{R}^3$ 就成为了：

$\bar{g}_*(\bar{v}) = \bar{g}\bar{X}(q) - \bar{g}\bar{X}(p) = \bar{g}\bar{v}.$

综上，对于（自由）向量而言（本书提到的向量都是自由向量），刚体变换只是旋转部分会起到作用，而对于点而言，刚体变换的作用包含两个部分，旋转和平移。

2.4.2 刚体运动指数参数化表示

类似旋转矩阵R，完整的刚体运动也有类似的指数坐标。

考虑一个连续刚体的轨迹，，或者用奇次坐标表示：

$g(t) = \begin{bmatrix} R(t) & T(t)\\ 0 & 1 \end{bmatrix} \in \mathbb{R}^{4 \times 4}$

从现在开始，当不存在歧义的时候，就不再用 $\bar{g}$ 表示奇次的刚体变换表示，而直接用。对于点和向量的奇次表示也是类似的。

导数和逆相乘，有：

$\dot{g}(t)g^{-1}(t) = \begin{bmatrix} \dot{R}(t)R^T(t) & \dot{T}(t) - \dot{R}(t)R^T(t)T(t)\\ 0 & 0 \end{bmatrix} \in \mathbb{R}^{4 \times 4}. \;\;\;\;\;\;\;\; (2.19)$

根据前文，我们知道 $\dot{R}(t)R^T(t)$ 是一个反对称矩阵，也就是说，存在 $\hat{\omega}(t) \in so(3)$ 使得 $\hat{\omega}(t) = \dot{R}(t)R^T(t)$ .

定义一个向量 $v(t) \in \mathbb{R}^3$ ， $v(t) = \dot{T}(t) - \hat\omega(t)T(t)$ 。上述2.19式可以写成：

$\dot{g}(t)g^{-1}(t) = \begin{bmatrix} \hat{\omega}(t) & v(t)\\ 0 & 0 \end{bmatrix} \in \mathbb{R}^{4 \times 4}$

如果我们更进一步定义一个矩阵 $\hat{\xi}(t) \in \mathbb{R}^{4 \times 4}$ 使得

$\hat{\xi} = \begin{bmatrix} \hat{\omega}(t) & v(t)\\ 0 & 0 \end{bmatrix}$

那么有：

$\dot{g}(t) = (\dot{g}(t)g^{-1}(t))g(t) = \hat{\xi}(t)g(t) \;\;\;\;\;\;\;\;\;\; (2.20)$

这里的 $\hat{\xi}$ 就可以看成是一个沿着曲线g(t)的“切向量”，虽然这个显然不是一个曲线，而是一个刚体运动变换矩阵。但是，大可以发挥想象力这么去想象一下（这里涉及到的更多的代数学知识）。

类似旋转矩阵，我们在这里得到了 $\hat \xi(t)$ 之后，就可以用来近似g(t)，用什么方式呢？当然是大名顶顶的泰勒展开：

$g(t + dt) \approx g(t) + \dot{g}(t)dt = g(t) + \hat \xi (t) g(t)dt = (I + \hat \xi (t)dt )g(t)$

所有的 $\hat \xi(t)$ 的集合，写作：

$se(3) \doteq \left \{ \hat \xi = \begin{bmatrix} \hat \omega & v\\ 0 & 0 \end{bmatrix} | \hat \omega \in so(3) , v \in \mathbb{R}^3 \right \} \subset \mathbb{R}^{4 \times 4}$

se(3)组成的集合，又叫做矩阵群SE(3)的切空间（或者也经常叫做李代数）。

接下来，我们定义两个符号 $\wedge$ 和 $\vee$ 来表示在se(3)和他在向量空间 $\mathbb{R}^{6 \times 6}$ 中的坐标：

$\begin{bmatrix} \hat \omega & v\\ 0 & 0 \end{bmatrix}^{\vee } \doteq \begin{bmatrix} v\\ \omega \end{bmatrix} \in \mathbb{R}^{6 }$ , $\begin{bmatrix} v\\ \omega \end{bmatrix}^{\wedge } \doteq \begin{bmatrix} \hat \omega & v \\ 0 & 0 \end{bmatrix} \mathbb{R}^{4 \times 4}.$

在twist坐标 $\xi$ 中，我们把看做是线速度， $\omega$ 看做是角速度。这表明，它们和平移和旋转是相关的。

接下来，让我们考虑方程2.20的一个特殊情形，也就是说，令 $\hat \xi(t)$ 为常矩阵，也就是说矩阵的元素不随时间变化，得：

$\dot{g}(t) = \hat \xi g(t)$

那么我们又可以得到一个以时间为自变量的线性常微分方程，可以通过积分得到：

$g(t) = e^{\hat \xi t}g(0)$ .

如果我们假设初始状态的，有：

$g(t) = e^{\hat \xi t},$

$e^{\hat \xi t} = I + \hat \xi t + (\hat \xi)^2 / 2! + (\hat \xi)^3 / 3! + \cdots + (\hat \xi)^n / n! + \cdots \;\;\;\;\;\;\;\;\; (2.21)$

根据罗德里格斯公式2.16，以及矩阵指数映射性质，可以建立如下的联系：

$e^{\hat \xi} = \begin{bmatrix} e^{\hat \omega} & \frac{(I-e^{\hat\omega})\hat\omega v + \omega\omega^T v}{\left \| \omega \right \|}\\ 0 & 1 \end{bmatrix}, if \;\; \omega \neq 0. \;\;\;\;\;\;\;\;\; (2.22)$

如果 $\omega$ =0，那么上式就是一个比较简单的形式： $e^{\hat \xi} = \begin{bmatrix} I & v\\ 0 & 1 \end{bmatrix}$ ，李代数的指数映射，可以描述一个完整的刚体运动过程。指数映射的过程定义了如下的从se(3)到SE(3)的变换：

$\exp : se(3) \rightarrow SE(3); \;\;\; \hat \xi \mapsto e^{\hat \xi}$

$\hat \xi \in se(3)$ 也被称为是SE(3)的指数坐标，类似 $\hat \omega \in so(3)$ 对于SO(3)的情形。

定理2.11 （SE(3)的对数映射）对于任意 $g \in SE(3)$ ，存在（但并非单独的）一个twist coordinates $\xi = (v,\omega)$ ，使得 $g = exp(\hat \xi)$ 。我们把这个映射的相反映射，写作 $\hat \xi = \log(g)$ 。

以下是定理2.11的证明：

证明：

假设，根据定理2.8，对于旋转矩阵 $R \in SO(3)$ 总是可以找到一个 $\omega$ 使得 $e^{\hat \omega} = R$ .

对于 $R \neq I, i.e. \; \left \| \omega \right \| \neq 0$ ，从2.22式中，我们可以解得

$\frac{(I-e^{\hat\omega})\hat\omega v + \omega\omega^T v}{\left \| \omega \right \|} = T \;\;\;\;\;\;\;\;\; (2.23)$

如果旋转矩阵R = I，那么 $\left \| \omega \right \| = 0$ 。在这种情况下，我们可以简单的令 $\omega = 0, v = T$ .

类似的从到的映射，从到的映射也不是单射，而是存在多个（事实上是无穷多个）的元素对应到同一个中的变换。

Remark 2.12 由于的线性结构，同时考虑李括号性质：

$\left [ \hat \xi_1, \hat \xi_2 \right ] = \hat \xi_1 \hat \xi_2 - \hat \xi_2 \hat \xi_1 = \begin{bmatrix} \widehat{\omega_1\times\omega_2} & \omega_1 \times v_2 - \omega_2 \times v_1 \\ 0 & 0 \end{bmatrix} \in se(3)$ ，就使得成为了的李代数。两个刚体运动 $g_1 = e^{\widehat{\xi_1}} \; and \; g_2 = e^{\widehat{\xi_2}}$ ，之间可以交换的前提只有一个，即 $\left [ \widehat{\xi_1}, \widehat{\xi_2} \right ] = 0$ 。

Examples 2.13 （螺旋运动）

螺旋运动是这样一种运动，绕一轴旋转 $\theta$ 角，并且沿着该旋转轴的方向移动d。

定义pitch为位移和旋转角度的比例， $h = d/\theta$ ，假设 $\theta \neq 0$ 。如果我们在旋转轴x上选择一个点X，并且定义一个 $\omega \in \mathbb{R}^3$ 为单位向量从而确定旋转的方向，旋转轴就是这样的一个点集组成的线， $L = \left \{ X + \mu \omega \right \}$ ，这样的运动可以通过下面的式子予以准确描述：

$g = \begin{bmatrix} e^{\hat\omega \theta} & (I - e^{\hat\omega \theta})X + h\theta \omega\\ 0 & 1 \end{bmatrix} \in SE(3) \;\;\;\;\;\;\;\;\; (2.24)$

所有的绕同一个旋转轴的螺旋运动组成的集合构成了一个的子群 $SO(2) \times R$ 。

沙勒定理(Chasles theorem)是一个关于变换的著名定理，该定理断言：既非旋转也非平移的空间第一种合同变换是一个旋转与一个平移之积，且旋转轴平行于这平移的方向。简言之，既非旋转又非平移的空间第一种合同变换(运动变换)是一个螺旋运动。

沙勒定理展现了一个事实，任何刚体运动都可以实现为在空间中绕固定轴旋转，和绕该轴的平移。

2.5 坐标和速度转换

在这本书里，我们经常需要知道一个点的坐标和它的速度如何发生变化（当相机相对于该点移动的时候）。这么做的原因之一是因为通常情况下，我们选取相机坐标系作为参考坐标系是十分方便的，进而，我们需要描述的是相机坐标系下的相机运动以及3-D点相对于相机的位置。

显然的是，相机经常就是在不停的运动，所以我们需要知道当一个相机从一个坐标系变换到另一个坐标系下的时候，坐标和速度是如何变化的。

也就是说，我们想要知道，如何正确的表示一个相对于移动的相机的点的位置和速度。在这里我们将介绍一个约定，这个约定将在接下来一直被用到：

坐标变换法则

我们将用时间 $t \in \mathbb{R}$ 来索引相机的运动。

比如当我们说到相机的运动和位置时我们会说，t时刻的相机位置和速度是多少。

我们将使用 $g(t) = (R(t), T(t)) \in SE(3)$ 或者：

$g(t) = \begin{bmatrix} R(t) &T(t) \\ 0 & 1 \end{bmatrix} \in SE(3)$

来表示在某个固定的世界坐标系W和t时刻的运动中的相机坐标系的相对变换，在这个意义下，其实还有一个下标 $g_{cw}(t)$ ，但是此处省略掉了。

然后呢，我们还假设 $g(0) = I, \; i.e.$ 在t = 0时刻，相机坐标系和世界坐标系相合。所以如果t = 0时刻的点在世界坐标系下的坐标为，那么就有其在相机坐标系下的坐标为：

$X_C(t) = R_{CW}(t)X_W + T_{CW}(t) \;\;\;\;\;\;\;\;\;\;\;\;\; (2.25)$

在2.25式中，由于世界坐标系默认固定不动，所以点在世界坐标系下坐标表示就加上了下标W，并且在式中，还是指明了变换方式，以免引起歧义，这点可能跟书中不太一样，请注意。以下也会酌情加上下标以表明变换的方向。

在奇次坐标下，其表示为：

$X_C(t) = g_{CW}(t)X_W \;\;\;\;\;\;\;\;\;\;\; (2.26)$

如果我们知道了在等一系列时刻的相机的“位置”（此处要打上引号，因为这个位置只是为了表明一个相机的运动，而非真正我们通常理解的位置） $g_{CW}(t_1),g_{CW}(t_2),g_{CW}(t_3), ... , g_{CW}(t_m)$ ，那么相机坐标系下的点的位置就会产生一个点在相机坐标系下的序列，这个序列可以如下表示，在下面的表示中，进行了简化，用直接代表，原因是此处只关心位置，不关心时间，另外由于有了下标，就把表示坐标系的部分放到上标了：

$X_{i}^C = R_{i}^{CW}X^W + T_i^{CW} \;\;\;\;\;\;\;\;\;\;(2.27)$

接下来，除非特别的额外说明，都默认变换的方向是从世界坐标系到相机坐标系的。

如果起始时间不是0，那么也可以得到变换 $g(t_2, t_1) \in SE(3)$ ，表示t_2和t_1时刻之间的相机运动。从而，我们就可以得到点在不同时刻相机坐标系下的位置，这里的下标表示第i时刻的相机位置：

$X_{C_2}(t_2) = g_{C_1 C_2}(t_2, t_1)X_{C_1}(t_1) \;\;\;\;\;\;\;\;\; \forall t_1, t_2 \in \mathbb{R}$

如图2.6，我们考虑一下t_3时刻的相机位置，在t_3到t_2之间的相机运动为，t_3和t_1之间为，我们就有了下面的变换关系：

从而：

这就是刚体变换的结合律。这样的结合律同样满足逆法则： $g^{-1}(t_2, t_1) = g(t_1, t_2)$ ，这是由于.

在时刻t不代表特定的物理含义的时候，我们还可以在符号的表示上做这样的简化：用 $g_{ij}$ 代替。上述法则就可以写成（奇次坐标表示下）：

$X_i = g_{ij}X_j, \; g_{ik} = g_{ij}g_{jk},\;g_{ij}^{-1} = g_{ji} \;\;\;\;\;\;(2.28)$

速度变换法则

前文梳理的坐标变换，现在研究变换过程对于速度的影响。我们知道点相对于相机坐标系的坐标是时间的函数：

$X_C(t) = g_{CW}(t)X_W$

那么速度就是位置的微分：

$\dot X_C(t) = \dot g_{CW}(t)X_W$

接下来，我们先用 $g_{CW}^{-1}(t)X_C(t)$ 代替，并且使用李代数的符号，定义 $\hat V_{CW}^C(t) = \dot g_{CW}(t)g_{CW}^{-1}(t) \in se(3), \;\;\;\;\;\; (2.30)$

对于 $\dot g_{CW}(t)g^{-1}_{CW}(t)$ 的描述可以见2.19式，式2.29可以被重新写作：

$\dot X_C(t) = \hat V_{CW}^C(t)X_C(t)$ , (2.31)

由于 $\hat V_{CW}^C(t)$ 拥有如下的形式：

$\hat V_{CW}^C(t) = \begin{bmatrix} \hat \omega(t) & v(t)\\ 0 & 0 \end{bmatrix}$ ，

我们还可以把一个点的在相机坐标系下的速度写成非奇次坐标的形式：

$\dot X_C(t) = \hat \omega(t)X_C(t) + v(t). \;\;\;\;\;\; (2.32)$

对于 $\hat V_{CW}^C(t)$ 的物理解释就是，在相机坐标系下，世界坐标系相对于相机坐标系的移动的速度。通常情况下，为了说清楚速度的含义，我们必须指定这个速度是哪个坐标系相对于哪个坐标系的，而且必须指定以哪个坐标系为观察系的。如果我们改变我们的观察系，相应的速度也会改变。

比如，我们将观察系变到一个由当前观察系经过刚体运动g $\in SE(3)$ 得到的参考系，那么点p的坐标也会随之改变为. 我们在新的参考系下计算点的速度，就会得到：

$\dot Y(t) = g\dot g_{CW}(t)g^{-1}_{CW}(t)g^{-1}Y(t) = g\hat V_{CW}^C(t)g^{-1}Y(t).$

那么新的twist（原文也说是速度，不过应该与点的速度加以区分）就是：

$\hat V = g \hat V_{CW}^Cg^{-1}$

这就是从不同的参考系观察得到的速度，显然两个速度之间存在一个和g有关的映射：

$ad_g : se(3) \rightarrow se(3); \hat \xi \mapsto g \hat \xi g^{-1}$

这就是所谓的李代数空间上的伴随映射， $\hat V = ad_g(\hat V_{CW}^C)$ 。伴随映射将速度从一个坐标系变换到另一个坐标系。

由于 $g_{CW}(t)g_{WC}(t) = I$ ，很容易证明：

$\hat V^C_{CW} = \dot g_{CW} g^{-1}_{CW} = - g_{CW}(\dot g_{WC}g^{-1}_{WC})g^{-1}_{CW} = ad_{g_{CW}}(-\hat V^W_{WC})$ .

笔者注，还是写下证明。

由于 $g_{CW}(t)g_{WC}(t) = I$ ，等式两边求导， $\dot g_{CW}g_{WC} = -g_{CW}\dot g_{WC}$ ，省略了t，且有 $g_{CW} = g^{-1}_{WC}$ 。代入公式，就可以得到， $\hat V^C_{CW} = \dot g_{CW} g^{-1}_{CW} = -g_{CW}\dot g_{WC} = - g_{CW} \dot g_{WC}g^{-1}_{WC} g^{-1}_{CW} = ad_{g_{CW}}(- \hat V_{WC}^W)$ 。

通过上述式子，可以这么说， $\hat V^C_{CW}$ 也可以解释为，在即时的相机坐标系视角下，相机相对于世界坐标系移动的速度的相反速度。（这句话没太理解）

2.6 总结

放一张表格。

END of Chapter 2.

参考文献

[1] Yi Ma, Stefano Soatto, Jana Kosecka, S. Shankar Sastry. An Invitation to 3D Vision.

你可能感兴趣的:(An,Invitation,to,3D,Vision,计算机视觉,算法)

C语言数据结构与算法专栏目录 CodeAllen嵌入式嵌入式 C语言数据结构算法
后序会开一个《嵌入式数据结构专栏》主要为了学习嵌入式的同学，软件能力提升和大厂面试能力，感谢大家关注！直达专栏：https://blog.csdn.net/super828/category_11083370.html《C语言数据结构与算法》专栏已经更新完毕，共计72篇分享，后期会逐渐修改错误并添加内容0数据之间的关系有哪些？1如何度量一个算法的好坏？2常见的时间复杂度实例
分布式系统核心基石：CAP定理、BASE理论与一致性算法深度解析 Eqwaak00 分布式系统设计实战算法 python java
一、CAP定理：分布式系统的设计边界1.1核心定义与经典三角CAP定理（Brewer'sTheorem）指出，在分布式系统中，一致性（Consistency）、可用性（Availability）、分区容错性（PartitionTolerance）三者不可兼得。（注：若需实际配图，可替换为Mermaid流程图或专业示意图）三大特性详解：一致性（C）：所有节点在同一时间看到的数据完全相同（强一致性）。
LintCode算法刷题记录（入门 + 简单部分）隔壁敲代码的小王算法刷题笔记算法 LintCode
由于是初学者，实现的方法都很简单，暂时不考虑效率，之后（可能）会更新1.A+B问题给出两个整数aa和bb,求他们的和。样例如果a=1并且b=2，返回3。挑战显然你可以直接returna+b，但是你是否可以挑战一下不这样做？（不使用++等算数运算符）说明a和b都是32位整数么？是的我可以使用位运算符么？当然可以注意事项你不需要从输入流读入数据，只需要根据aplusb的两个参数a和b，计算他们的和并返
C++17 并行算法：std::execution::par
在多核处理器普及的今天，如何高效利用硬件资源成为提升软件性能的关键。C++17引入的并行算法库（ParallelAlgorithms）为开发者提供了一套标准化的并行编程接口，通过简单的策略切换即可将顺序算法转换为并行执行。本文将深入探讨C++17并行算法中最核心的执行策略std::execution::par，从基础概念到高级应用，全面解析其原理、用法及最佳实践。一、C++17并行算法概述1.1并
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
求平方根：牛顿迭代法 mjfztms leetcode 算法
应用牛顿迭代法求解方程近似解，收敛速度很快牛顿迭代法求解平方根给你一个非负整数x，计算并返回x的算术平方根n，结果只保留整数部分。算法流程图由题意得，n2=xn^2=xn2=x，即为对f(n)=n2−xf(n)=n^2-xf(n)=n2−x求解。第一步：易得：x2−x1=0−f(x1)f′(x1)x_2-x_1=\frac{0-f(x_1)}{f'(x_1)}x2−x1=f′(x1)0−f(x1)
【秋招算法】2025 届搜广推方向求职历程（SSP、头部计划）秋冬无暖阳° 搜广推等—算法面经面试职场和发展算法
【秋招算法】2025届搜广推方向求职历程（SSP、头部计划）文章目录【秋招算法】2025届搜广推方向求职历程（SSP、头部计划）1.背景2.日常实习3.暑期实习3.1暑期BG3.2暑期记录4.秋招4.1秋招BG4.2转正4.3头部4.4提前批4.5正式批5.面试记录5.1Coding5.2其他高频编程题5.3常见八股、面经6.关于搜广推1.背景关于日常实习、暑期实习、提前批，秋招、春招、补招何为大
推荐算法（推广搜）——广告和推荐有什么不同？
导语近几年新兴起一个行业：推广搜。即推荐、广告、搜索算法的简称。各大厂都隐隐将其作为公司核心技术来发展。此文将带领大家探秘广告和推荐有什么区别以及其相似处。再此强调一下，广告算法里面的推荐广告和自然推荐结果里的推荐系统进行对比，但因为广告算法里面还有“搜索广告”，搜索广告和推荐系统差异性就太大了，这里不做讨论。一、不同点1.1本质不同推荐广告和自然推荐本质中要处理的群体和衡量的利益完全不一样。（图
算法分析与设计实验2：实现克鲁斯卡尔算法和prim算法表白墙上别挂我算法笔记经验分享
实验原理（一）克鲁斯卡尔算法：一种用于求解最小生成树问题的贪心算法，该算法的基本思想是按照边的权重从小到大排序，然后依次选择边，并加入生成树中，同时确保不会形成环路，直到生成树包含图中所有的顶点为止。具体步骤：边的排序：将所有边按照权重从小到大排序。初始化：创建一个空的生成树（可以是一个空的图结构），以及一个用于记录每个顶点所属集合（或称为连通分量）的数据结构（例如并查集）。边的选择：依次选择排序
（面经总结）一篇文章带你整理面试过程中常考的九大排序算法南淮北安冲刺大厂之面经总结面经排序算法二分插入冒泡快速
文章目录一、二分插入排序1.原理2.代码二、冒泡排序1.原理2.代码三、插入排序算法1.原理2.代码四、快速排序算法1.原理2.代码五、希尔排序1.原理2.代码六、归并排序1.原理2.代码七、桶排序八、基数排序九、堆排序1.原理2.代码十、总结1.算法分类2.性能分析一、二分插入排序首先必须是排好序的数组，然后通过二分查找，找到合适的位置，插入1.原理二分查找算法又叫作折半查找，要求待查找的序列有
Python常考面试题汇总（附答案） TT图图面试职场和发展
写在前面本文面向中高级Python开发，太基本的题目不收录。本文只涉及Python相关的面试题，关于网络、MySQL、算法等其他面试必考题会另外开专题整理。不是单纯的提供答案，抵制八股文！！更希望通过代码演示，原理探究等来深入讲解某一知识点，做到融会贯通。部分演示代码也放在了我的github的该目录下。语言基础篇Python的基本数据类型Python3中有六个标准的数据类型：Number（数字）(
opencv-python与opencv-contrib-python的区别联系剑心缘零碎小知识 python opencv
opencv-python包含基本的opencvopencv-contrib-python是高配版，带一些收费或者专利的算法，还有一些比较新的算法的高级版本,这些算法稳定之后会加入上面那个。官网对contrib模块的简介（点击链接跳转）参考链接
通信算法之278：数据链/自组网通信设备--MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码--1.系统指标需求及帧结构设计秋风战士无线通信基带处理算法 MATLAB仿真软件无线电算法无人机经验分享
MIMO(2T2R)-OFDM系统系列–实际工程应用算法代码第一章：系统指标需求拆解分析第二章：通信系统帧结构设计和OFDM参数设计第三章：通信业务速率设计及理论解调门限第四章：同步序列设计及同步性能仿真验证第五章：数据业务设计及性能仿真验证第六章：信道模型设计第七章：接收关键算法设计及仿真验证第八章：其它待补充本文目录MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码一、实际项目：系
通信算法之287：通信技术点咨询秋风战士 MATLAB仿真软件无线电无线通信基带处理算法网络算法无人机经验分享
专业技术咨询方向第一：SFBC编码与解码原理推导第二：SFBC系统中信道均衡推导第三：云哨物理层协议-速率匹配-解调门限-5dB第四：两天线SCFDE系统（SFBC码）帧结构设计第五：两天线OFDM系统（SFBC码）帧结构设计第一：SFBC编码与解码原理推导第二：SFBC系统中信道均衡推导第三：云哨物理层协议-速率匹配-解调门限-5dB第四：两天线SCFDE系统（SFBC码）帧结构设计第五：两天线
知识图谱的个性化智能教学推荐系统(论文+源码) 毕设工作室_wlzytw python论文项目知识图谱人工智能
目录摘要Abstract目录第1章绪论1.1研究背景及意义1.2国内外研究现状1.2.1知识图谱1.2.2个性化推荐系统1.3本文研究内容及创新点1.4全文组织结构第2章相关理论与技术概述2.1知识图谱2.1.1知识图谱的介绍与发展2.1.2知识图谱的构建2.3协同过滤推荐算法2.2.1推荐算法概述2.2.2Pearson相关系数2.2.3Spearman相关系数2.4Bert模型和Albert模
反向传播神经网络极简入门自信哥
单个神经元神经网络是多个“神经元”（感知机）的带权级联，神经网络算法可以提供非线性的复杂模型，它有两个参数：权值矩阵{Wl}和偏置向量{bl}，不同于感知机的单一向量形式，{Wl}是复数个矩阵，{bl}是复数个向量，其中的元素分别属于单个层，而每个层的组成单元，就是神经元。神经元神经网络是由多个“神经元”（感知机）组成的，每个神经元图示如下：这其实就是一个单层感知机，其输入是由和+1组成的向量，其
【限时干货】Calibre智能分类，轻松突破内网限制畅享电子书库比头发还脆弱服务器 tcp/ip linux
文章目录前言1.网络书库软件下载安装2.网络书库服务器设置3.内网穿透工具设置4.公网使用kindle访问内网私人书库前言本研究旨在构建一套运行于微软操作系统环境下的独立电子图书管理体系，核心目标是建立可远程操作的资源访问机制。该架构采用高可用性设计，在第三方阅读平台服务中断时仍能保障数字内容传输的稳定性。系统创新性地融合了两大核心技术组件：通过Calibre开源软件实现文献分类算法与格式转换功能
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
说话人识别python_基于各种分类算法的说话人识别（年龄段识别） weixin_39673184 说话人识别python
基于各种分类算法的语音分类(年龄段识别)概述实习期间作为帮手打杂进行了一段时间的语音识别研究，内容是基于各种分类算法的语音的年龄段识别，总结一下大致框架，基本思想是：获取语料库TIMIT提取数据特征，进行处理MFCC/i-vectorLDA/PLDA/PCA语料提取，基于分类算法进行分类SVM/SVR/GMM/GBDT...用到的工具有HTK(C,shell)/Kaldi(C++,shell)/L
深入解析C++中 std::sort背后的实现原理 —Introsort（Introspective Sort）点云SLAM C++c++算法数据结构快速排序排序算法堆排序深度优先
Introsort简介Introsort是一种混合排序算法，结合了三种经典算法的优点：算法用于特点快速排序通常情况平均时间复杂度O(nlogn)堆排序当快速排序退化（递归过深）时最坏时间复杂度O(nlogn)插入排序小规模数组时（如长度≤16）常数开销小，快Introsort运行机制排序逻辑如下：if(size2*log2(n))堆排序（HeapSort）else快速排序（QuickSort）快速
冒泡排序算法详解（含Python代码实现）算法_小学生算法
冒泡排序（BubbleSort）是最基础的排序算法之一，通常用于学习排序算法的入门理解。本文将通过Python代码实现冒泡排序，并详细讲解其原理、执行流程、复杂度分析及适用情况。✨一、算法简介冒泡排序的核心思想是：相邻两个元素比较，将较大的元素不断“冒泡”至右侧，最终实现排序。其基本过程是重复比较相邻的元素，如果顺序错误就交换，重复这一过程，直到没有任何需要交换的为止。二、Python代码实现下面
揭秘 Spring Cloud Zuul 在后端的负载均衡策略大厂资深架构师 Spring Boot 开发实战 spring cloud 负载均衡 spring ai
揭秘SpringCloudZuul在后端的负载均衡策略关键词：SpringCloudZuul、负载均衡、微服务网关、Ribbon、请求路由摘要：在微服务架构中，API网关是流量的“总调度员”，而负载均衡则是它的“智能大脑”。本文将以“小区门卫派件”为故事主线，用通俗易懂的语言揭秘SpringCloudZuul如何通过集成Ribbon实现后端负载均衡。我们将从核心概念到算法原理，从代码实战到应用场景
【NWFSP问题】基于中华穿山甲算法CPO求解零等待流水车间调度问题NWFSP研究（Matlab代码实现）
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述1.引言2.理论基础2.1中华穿山甲算法（CPO）核心原理2.2NWFSP数学模型3.CPO-NWFSP求解框架设计3.1编码与解码3.2离散化位置更新3.3目标函数适配4.实验设计与性能分析4.1实验设置4.2结果分析4.3敏感性分析5.结论与展望
RTX 30、40、50 系列显卡全面对比：谁才是你的最佳选择？小李也疯狂其他人工智能显卡
目录前言一、架构设计：不断进化的核心驱动力1.1RTX30系列（Ampere架构）1.2RTX40系列（AdaLovelace架构）1.3RTX50系列（Blackwell架构，假设信息，实际可能不同）二、性能表现：数字背后的实力较量2.1游戏性能1080P分辨率2K分辨率4K分辨率2.2创作性能视频编辑3D建模与渲染三、功能特性：前沿科技的魅力呈现3.1DLSS技术对比3.2光线追踪性能3.3编
LRU Cache Mr_Xuhhh c++c语言算法开发语言 python
LRUCache定义缓存算法（LeastRecentlyUsed)核心思想最近最少使用或最久未使用。当缓存空间不足时，它会优先淘汰最长时间没有访问的数据项类比：图书馆的书架管理，经常被借阅的书放在最前面方便取用，而长期无人问津的书会被移到后面或下架数据结构选择与设计1）双向链表1.用于维护元素的访问顺序，最近访问的元素放在链表头部，最久未被访问的放在尾部2.支持O（1）时间复杂度的任意位置插入和删
OpenCV 图像操作：颜色识别、替换与水印添加
目录引言代码实现1.导入必要的库2.图像加法3.图像直接相加4.颜色加权加法5.HSV颜色空间转换概念作用6.查找颜色范围对应的像素点7.与运算-生成掩膜8.添加水印9.主函数总结引言在计算机视觉领域，OpenCV是一个强大的库，提供了丰富的图像操作功能。本文将详细介绍如何使用OpenCV进行图像加法、颜色加权加法、HSV颜色空间转换、颜色范围查找、与运算生成掩膜以及添加水印等操作，并给出相应的P
【Python】simulink与python联合仿真
1.1Simulink的边界：事件驱动、算法复杂性与AI集成瓶颈Simulink的核心优势在于其强大的微分方程求解器和对连续时间系统、离散时间系统的精确描述能力。其基于“信号流”和“框图”的建模范式，使得工程师可以直观地构建与物理现实高度对应的数学模型。然而，这种优势也带来了其天然的局限性：基于时间的驱动核心(Time-BasedCoreEngine):Simulink的“心脏”是一个时间驱动的仿
【PyTorch】教程：torch.nn.GELU 老周有AI~算法定制 PyTorch pytorch 深度学习 python
torch.nn.GELU原型CLASStorch.nn.GELU(approximate='none')参数approximate(str,optional)–gelu近似算法用none或者tanh，默认为none;定义高斯误差线性单元函数GELU(x)=x∗ϕ(x)\text{GELU}(x)=x*\phi(x)GELU(x)=x∗ϕ(x)其中ϕ(x)\phi(x)ϕ(x)为高斯分布的累积分布
数据结构之栈实验 lannnn_ 学习记录数据结构 c语言栈
栈实验实验目的实验环境实验要求实验内容源代码运行结果实验目的掌握栈这种数据结构特性及其主要存储结构，并能在现实生活中灵活运用。实验环境CodeBlocks实验要求1.熟悉c语言的语法知识；2.掌握栈的顺序存储结构—顺序栈的定义、构造、获得栈顶元素、入栈、出栈等基本操作；实验内容完成栈的定义、构造、获得栈顶元素、进栈、出栈等函数的编写。要求在主函数中实现对以上操作的调用，编写一个算法判断给定的字符向
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p