Nie_Xun

概率&滤波器&图优化&最小二乘求解

文章目录

- SLAM后端优化
- 1 预知识点
- - 1.1 高斯分布的正则形式(canonical form)及马氏距离：
  - 1.2 状态方程的协方差及信息矩阵传递
  - 1.3 信息矩阵和Hessian矩阵
  - 1.4 协方差矩阵与信息矩阵
  - 1.5 Schur补概念
  - 1.6 信息矩阵的边缘化
  - 1.7 贝叶斯后验滤波器
- 2 概率在线/全局SLAM算法
- - 2.1 卡尔曼滤波(KF)
  - 2.2 扩展卡尔曼滤波器(EKF)
  - 2.3 UKF：TODO
  - 2.4 Information Filter(IF)
  - 2.5 Extended Information Filter (EIF)
  - 2.6 粒子滤波器：粒子滤波器是贝叶斯滤波器的实现方式。
  - 2.7 图(Graph)优化算法
  - 2.8 SEIF算法
- 3 非线性优化
- - 3.1 梯度矩阵Jacobians矩阵及Hessian矩阵
  - 3.2 最速下降法
  - 3.3 牛顿法：考虑函数向量的二阶导数
  - 3.4 高斯牛顿法(GN)
  - 3.5 LM(Levenberg-Marquadt)
  - 3.6 信赖域法
- 4 解算工具介绍(ceres/g2o)
- - 4.1 Ceres
  - 4.2 G2o
  - 4.3 GTSAM
- 5 参考

SLAM后端优化

前端估计有一定的误差，误差累积，将会造成很大的偏移误差。可以通过机器人传感器得到的环境信息(图像特征点/点云)来优化我们的估计，即机器人走一步，然后估计自己的运动，然后看周围，确定优化自己的位姿估计猜测。通过匹获得当前获得特征点(图像/点云)数据，我们可以得到一个新的位姿估计。有了更精确的估计，从而可以知道更精确的环境特征点分布。后端优化就是通过新的观测或者更充足的数据对前期粗略估计的结果进行优化。

在slam中要求解的变量包含传感器的位姿T及环境信息(地图点云) $p$ 。SLAM分为两种：在线SLAM及全局SLAM。
在线SLAM多以滤波器算法为主要实现方式。

在线SLAM算法维护变量：定义 $k$ 时刻优化变量 $x_k$ ：
$x_k=\left\{T_k,p_1,\cdots,p_m\right\}$
或者以李代数来表示相机的运动状态，则k时刻优化变量 $x_k$ ：
$x_k=\left\{\xi_k,p_1,\cdots,p_m\right\}$
全局SLAM算法维护所有变量：
$x=\left\{\xi_{1:k},p_{1:m}\right\}$

1 预知识点

1.1 高斯分布的正则形式(canonical form)及马氏距离：

设多维变量 $\sim \mathcal{N}(\bm \mu,\ \ \Sigma)$

其中：红色部分为常数项，可以归入归一化因子 $\eta$ 中。

令：

则可以用正则形式表示高斯分布： ${x}\sim\mathcal{N}^{-1}({\bm\xi}, {\Lambda})$

其负log似然函数 $g({x})$ 为：

其中 $c$ 为常数项, $\mathrm{\Lambda}$ 为半正定矩阵。
正则分布的负对数函数 $g\left(\bm{x}\right)$ 是关于x的二次型函数，且当 $\bm{x}=\bm{\mu}$ 时， $g\left(\bm{x}\right)$ 最小。

因此 $g\left(\bm{x}\right)$ 可以看作一种表征 $x$ 距离其中心值 $\bm{\mu}$ 的距离函数。这种加权二次距离函数叫做马氏距离(Mahalanobis distance)。

1.2 状态方程的协方差及信息矩阵传递

$x\sim\mathcal{N}\left(\mu,\Sigma\right),\ \ y=Ax+b$
则 $y$ 的分布的均值和方差满足：

使用估计方程得到的估计变量 ${\bar{x}}_k$ ，优化后的变量为 ${\hat{x}}_k$ 。

1.3 信息矩阵和Hessian矩阵

Negative log likelihood的二阶导数（也就是其Hessian矩阵），正好是协方差的逆，即信息矩阵。
设多维变量 $\bm{x} \sim \mathcal{N} (\bm{\mu},\ \ \Sigma)$

其负log似然函数 $g(\bm{x})$ 为：

$g(\bm{x})$ 的Hessian矩阵为：

1.4 协方差矩阵与信息矩阵

高斯分布 $\mathcal{N}(\mu_t,\mathrm{\Sigma}_t)$ 可以写成canonical form（正则）形式： $\mathcal{N}^{-1}(\eta_t,\Lambda_t)$

令：

$\mathrm{\Sigma}_t$ 为变量 $\xi_t$ 的协方差矩阵， $\Lambda_t$ 对应为其信息矩阵，值为协方差矩阵 $\mathrm{\Sigma}_t$ 的逆。
协方差矩阵能够很方便的理解变量之间的关系，而信息矩阵能够方便计算概率密度函数。因此关于MLE，MAP构成的最小二乘问题，大部分是使用概率函数(高斯)的负对数函数去除常数项后得到的马氏距离形式，如下所示：

其中，

使用牛顿法求解迭代公式：
$H\ \bullet\ \delta\bm{\xi}=-J_f^T$
其中 $H$ 为 $f(\xi)$ 的Hessian矩阵： $H=\frac{\partial^2f(\xi)}{{\partial\xi}^2}$ , $J_f为f(\xi)$ 的雅可比矩阵： $J_f=\frac{\partial f(\xi)}{\partial\xi}$

由1.3信息矩阵和Hessian矩阵内容可知，概率函数的负对数函数的Hessian矩阵对应为高斯状态量正则形式的信息矩阵 $\Lambda$ 。

将 $\bm{r}_{i}\left(\bm{\xi}\right)$ 一阶近似展开代入 $\bm{r}_{i}^T\left(\bm{\xi}\right){\mathrm{\Sigma}_{i}^{-\mathbf{1}}\bm{r}}_{i}\left(\bm{\xi}\right)$ 中，求一阶导，得到 $J_f$ 的近似形式。求二阶导，则可得到 $H$ 的近似形式：

下降迭代过程变为：

使用联合分布来进一步理解协方差与信息矩阵之间的关系。

1.5 Schur补概念

若 A 非奇异，则有：

令 $_A$ 为 $A$ 的schur补： $_A= D-CA^{-1}B$

若 $D$ 非奇异，则： $_D=A-BD^{-1}C$

1.6 信息矩阵的边缘化

参考论文：《The Humble Gaussian Distribution》。
这篇论文讲述了信息矩阵边缘化的原理。我们在去除一些状态量时，这些状态量往往与其他状态量有联系，通过协方差矩阵，我们直接看出状态量之间的联系，但是信息矩阵却不行，我们在使用马氏距离时都是直接与信息矩阵打交道，而求逆的过程比较复杂，因此需要俩用Schur补计算信息矩阵的逆，得到协方差，利用协方差裁剪状态量。以下通过概率形式，阐述边缘化的意义。更加具体的解释请看上述论文。
对于联合信息分布： $p (a, b)$

设 $p (a, b)$ 的协方差为：协方差具有对称性：

利用Schur补求得信息矩阵为：

令：

使用信息矩阵 $\mathrm{\Lambda}$ 表示协方差矩阵 $\mathrm{\Sigma}$ ：（*3)

联合概率密度函数为：

我们需要从联合分布中去掉与 $b$ 相关的项，即需要滤除 $p (b ∣ a)$ ，保留 $p (a)$ 。利用Schur补可以将联合概率分离成 $p (a) p (b ∣ a)$ 的形式。

高斯联合分布普通形式：

高斯联合分布正则形式：

令：

其中 $\mathrm{\Sigma}_{aa}^{-1}\mathrm{\Sigma}_{ab}=-\mathrm{\Lambda}_{ab}{\mathrm{\Lambda}_{bb}}^{-1}$ 使用公式**（*3）**可得出。
最终得：

1.7 贝叶斯后验滤波器

根据贝叶斯条件后验公式：

得到：

令： $p\left(x_k\middle| z_{1:k},u_{1:k}\right)\ \sim\ \mathcal{N}({\hat{x}}_k,{\hat{P}}_k)$ ，对应 $p\left(x_{k-1}\middle| z_{1:k-1},u_{1:k-1}\right)\ \sim\ \mathcal{N}({\hat{x}}_{k-1},{\hat{P}}_{k-1})$
其中：

表示根据t时刻位姿估计得到观测 $z_k$ 的概率。对应观测方程。 $z_k=C_kx_k$

表示由 $k - 1$ 时刻位姿估计、给定信号及观测结果得到 $x_k$ 的概率。

表示由 $k - 1$ 时刻位姿估计结果得到xk的概率，对应状态传递方程 $x_k=A_kx_{k-1}+u_k$ 。

表示由 $k - 1$ 时刻观测结果及给定信号优化得到 $x_{k-1}$ 的概率， $x_{k-1}$ 与 $u_k$ 无关。

$\eta$ 为常数:

贝叶斯概率传递：
EKF及EIF算法皆基于公式 (*1) 作为迭代步骤且假定高斯分布，不同的是EKF使用方差进行状态传递而EIF中使用信息矩阵来进行状态传递且加入了对旧状态的边缘化。

EKF与EIF均分为两步：1）状态传递 2）状态观测优化

1）时间状态传递： $p(x_k|x_{k-1},u_{1:k})$
在已知上一时刻 $k - 1$ 状态 $x_{k-1}$ 及当前时刻k的输入量(或者是先验值) $u_{1:k}$ 后，利用状态传递方程 $x_k=A_kx_{k-1}+u_k$ 推出当前时刻的状态量 $x_k$ 的初始估计，这里设为 ${\bar{x}}_k$ 。
2）状态观测优化
已知当前时刻 $k$ 状态量的初始估计 ${\bar{x}}_k$ 后，利用当前的观测值对 ${\bar{x}}_k$ 及进行优化，优化后的值记作 ${\hat{x}}_k$ 。

注意： 在slam问题中，状态量 $x_k$ 包含相机位姿及环境坐标点，但是在时间状态传递时，只有相机的位姿变量会随时间进行传递 $\xi_{k-1}\rightarrow\xi_k$ ，但是环境坐标点 $p_i$ 不随状态方程传递，即 $A_k$ 中与环境坐标点相关的项为0。

2 概率在线/全局SLAM算法

2.1 卡尔曼滤波(KF)

KF算法思想是：假设位姿估计及观测都是线性的，并且k时刻位姿只与 $k - 1$ 时刻有关系，且估计噪声假设符合高斯分布，如下：

$\omega_k\sim\mathcal{N}\left(0,R_k\right),\ \ v_k\sim \mathcal{N}\left(0,Q_k\right)$
KF滤波器解算步骤：
1、时间状态传递： $p\left(x_t\middle|\ z_{1:k-1},u_{1:k}\right)=p\left(x_k\middle|\ x_{k-1},u_{1:k}\right)p\left(x_{k-1}\middle|\ z_{1:k-1},u_{1:k-1}\right)$
已知 $p\left(x_{k-1}\middle|\ z_{1:k-1},u_{1:k-1}\right)=\mathcal{N}\left({\hat{x}}_{k-1},{\widehat{\ P}}_{k-1}\right)$
估计通常由前端得到，可以通过图像解析，其他类型轮式里程计或者运动方程得到。其预测估计的状态方程可表示为： $P$ 表示方差。

注意：通常预测估计也成为状态时间传递方程，如果变量包含传感器(相机)位置及环境坐标点(即 $x_k=\left\{\xi_k,p_1,\cdots,p_m\right\}$ )在预测估计过程(状态时间传递过程)中，只有相机位置 $\xi_k$ 会随着时间而变化，但环境点不随时间而变化，注意 $A_k$ 中与环境坐标点相关的部分为0。

根据状态方程可知：

2、状态观测优化： $p\left(x_k\middle| z_{1:k},u_{1:k}\right)=\eta p\left(z_k\middle| x_k\right)p\left(x_k\middle| z_{1:k-1},u_{1:k}\right)$
KF的方法是在原始估计上加上对应权重的观测误差值进行修正，从而得到优化后的参数值，如下：

关于K的计算则要利用概率模型来计算求解。

由状态传递步骤得到 $p\left(x_t\middle| z_{1:k-1},u_{1:k}\right)=\ \mathcal{N}\left({\bar{x}}_k,\ {\bar{P}}_k\right)$ ，且同样定义 $p\left(x_k\middle| z_{1:k},u_{1:k}\right)=\mathcal{N}\left({\hat{x}}_k,{\widehat{\ P}}_k\right)$
根据观测方程：
$z_k=C_kx_k+v_k$
可得： $p\left(z_k\middle| x_k\right)=\mathcal{N}\left(C_kx_k,Q_k\right)$
由 $p\left(x_k\middle| z_{1:k},u_{1:k}\right)=\eta p\left(z_k\middle| x_k\right)p\left(x_k\middle| z_{1:k-1},u_{1:k}\right)$ 整理并取出指数项，常数项直接被忽略，得到：

$\left(x_k-{\hat{x}}_k\right)^T{{\widehat{\ P}}_k}^{-1}\left(x_k-{\hat{x}}_k\right)=\left(z_k-C_kx_k\right)^TQ_k^{-1}\left(z_k-C_kx_k\right)+\left(x_k-{\bar{x}}_k\right)^T{{\bar{P}}_k}^{-1}\left(x_k-{\bar{x}}_k\right)$
计算整理得：

${{\widehat{\ P}}_k}^{-1}=C_k^TQ_k^{-1}C_k+{{\bar{P}}_k}^{-1}$
${\hat{x}}_k={\widehat{\ P}}_kC_k^TQ_k^{-1}z_k+{\widehat{\ P}}_k{{\bar{P}}_k}^{-1}{\bar{x}}_k$

令：
$K={\widehat{\ P}}_kC_k^TQ_k^{-1}$
整理得：
${\widehat{\ P}}_k=\left(I-KC_k\right){\bar{P}}_k$
${\hat{x}}_k={\bar{x}}_k+K\left(z_k-z_k-C_k{\bar{x}}_k\right)$

整理KF计算流程： $({\hat{x}}_{k-1},{\widehat{\ P}}_{k-1},\ u_k,\ z_k)$
状态量传递：首先要确立变量的线性状态方程:

K值计算:

观测状态优化：

EKF仿真测试：
参考链接：
https://www.cnblogs.com/liuzhenbo/p/12671246.html
https://github.com/liuzhenboo/EKF-2D-SLAM
结果截图：

2.2 扩展卡尔曼滤波器(EKF)

EKF：现实中，运动模型和观测模型通常不是线性的。则权重 $K$ 得解算变得复杂，因此通过在 $k$ 时刻，泰勒一阶展开近似，化为时刻线性问题求解。

则预测及优化过程如下表示：
状态传递：

卡尔曼增益计算：

状态优化：

预先估计：由 $k - 1$ 位姿 $x_{k-1})$ 与 $k$ 刻指令( $u_k$ )估计k时刻位姿( $x_k$ )。如下：

但是，估计存在误差，设误差wk满足高斯分布。

优化估计：获取到 $k$ 时刻的环境采样信息(图像/点云)后，求出能够产生该采样信息的最大概率的位姿估计，称后验估计，并求出预先估计与后验估计的置信度，分配权重得到优化的位姿估计。

2.3 UKF：TODO

2.4 Information Filter(IF)

IF与KF类似，基于高斯假设，但使用高斯分布的正则形式。IF同KF一样分为状态传递及观测优化两步：时间状态传递与状态观测优化。

1、时间状态传递： $p\left(x_t\middle| z_{1:k-1},u_{1:k}\right)=p\left(x_k\middle| x_{k-1},u_{1:k}\right)p\left(x_{k-1}\middle| z_{1:k-1},u_{1:k-1}\right)$
已知 $p\left(x_{k-1}\middle| z_{1:k-1},u_{1:k-1}\right)=\mathcal{N}^{-1}\left({\hat{\bm{\xi}}}_{k-1},{\hat{\mathrm{\Lambda}}}_{k-1}\right)$ ，根据状态传递方程可得k时刻状态初始估计：

得：

即：

2、状态观测优化： $\bm{p}\left(\bm{x}_\bm{k}\middle|\bm{z}_{\mathbf{1}:\bm{k}},\bm t{u}_{\mathbf{1}:\bm{k}}\right)=\bm{\eta p}\left(\bm{z}_\bm{k}\middle|\bm{x}_\bm{k}\right)\bm{p}\left(\bm{x}_\bm{k}\middle|\bm{z}_{\mathbf{1}:\bm{k}-\mathbf{1}},\bm{u}_{\mathbf{1}:\bm{k}}\right)$
由 $p\left(x_k\middle| z_{1:k},u_{1:k}\right)=\eta p\left(z_k\middle| x_k\right)p\left(x_k\middle| z_{1:k-1},u_{1:k}\right)$ 整理并取出指数项，常数项直接被忽略，得到：

从而可得：

整理IF的计算流程：( ${\hat{\bm{\xi}}}_{k-1},{\hat{\mathrm{\Lambda}}}_{k-1},\ u_k,\ z_k$ )
1、时间状态传递：

2、观测状态优化：

2.5 Extended Information Filter (EIF)

过程与EKF类似，同时也使用一阶近似得到状态方程，但是其使用信息矩阵来进行状态传递及更新。同样的如果变量包含传感器(相机)位置及环境坐标点(即 $x_k=\left\{\xi_k,p_1,\cdots,p_m\right\}$ )。在预测估计过程(状态时间传递过程)中，只有相机位置 $\xi_k$ 会随着时间而变化，但环境点不随时间而变化，注意 $A_k$ 中与环境坐标点相关的部分为0。

定义非线性状态传递方程和观测方程如下：

设：
$G_k=\frac{\partial g}{\partial x_{k-1}},H_k=\frac{\partial h}{\partial x_k}$
在计算过程中，由于要计算 $g(u_k,\ x_{k-1})$ 和 $z_k=h(x_k)+v_k$ 需要输入状态量 $x_{k-1}$ ，(对应 ${\hat{\bm{x}}}_{k-1})及x_k(对应{\bar{\bm{x}}}_k)$ ，因此需要计算对应的状态变量值 ${\hat{\bm{x}}}_{k-1}和{\bar{\bm{x}}}_k$ 。

EIF本意是利用信息矩阵在计算联合概率分布的优势(其负对数形式可以写成马氏距离的形式)，加速求解，但是由于协方差与状态方程的传递方便性 ${\bar{P}}_k=A_k{\hat{P}}_{k-1}A_k^T+R_k$ ，EKF的实用性更高一些，而EIF使用信息矩阵实现传递，但其间也脱离不了求取协方差，反而多了求逆的过程。另外对于应用到非线性系统，仍需计算 ${\hat{\bm{x}}}_{k-1}$ 和 ${\bar{\bm{x}}}_k$ ，反而多了计算量。由此有SEIF算法被提出。

EKF求解过程：
1、时间状态传递：

2、状态观测优化：

2.6 粒子滤波器：粒子滤波器是贝叶斯滤波器的实现方式。

建立一群高斯分布的粒子来模拟估计位姿的实际分布。通过观测调整粒子的分布，缩小范围，增大方差。以Rao、ACML等为代表粒子滤波器算法。https://blog.csdn.net/weixin_41469272/article/details/106387716

2.7 图(Graph)优化算法

将状态传递方程及观测方程作为边约束，位姿及环境点(landmark)作为节点构成图模型，如下图所示：

(1) 状态传递构成边约束：

其负对数函数：

(2) 观测结果构成边约束：

其负对数函数：

(3) 图优化约束方程
二者负对数函数构成关于各时刻的状态量x_k马氏距离的边约束，构成最小二乘问题：

Tips：
由此可以对比滤波器与图优化的区别：
像EKF，粒子滤波器等优化器是主动式的，在得到新的系统输入或者观测量后，都会对状态进行主动预算和优化。而图优化是建立约束方程，通过求解得到状态估计值。此外，图优化可以用于全局的优化，但是随着时间的推移，状态量(所有帧的位姿及landmark)增多，更新的代价会随着时间推移而增大。而EKF的状态量采用单帧运动及landmark，新的位移产生或者得到新的观测都需要对当前状态量进行更新，即单帧的计算量较大，但随时间的推移增加的计算量相对没有图优化算法明显。图优化模型可用于全局优化，EKF多用于单帧优化。

(4) 图优化求解：
1、使用与IF的解法，使用信息矩阵来求解
先利用所有的输入量 $u_{1:t}$ 得到所有的位姿预估值 $\xi_{1:t}$ ，利用输入量 $u_{1:t}$ 和观测值组成状态量的信息矩阵，然后利用信息矩阵计算所有状态量 $x=\left\{\xi_{1:k},p_{1:m}\right\}$ 。
与IF/KF不同的是，图优化算法，是使用所有状态转移方程和观测方程共同维护一个信息矩阵，并不是每个观测值和每个新的位姿状态都更新。
$\xi_{1:k}$ 的求解与IF类似。

2、最小二乘问题的优化，多使用下降迭代法：
牛顿法：
$H\ \bullet\ \delta\bm{x}=-J_f^T$
高斯牛顿法近似：
$\sum_{i}{J_i^T\mathrm{\Sigma}_\bm{i}^{-\mathbf{1}}J_i}\ \bullet\ \delta\bm{x}=\sum_{i}{J_i^T\mathrm{\Sigma}_\bm{i}^{-\mathbf{1}}\bm{r}_\bm{i}}$

最后得到的Hessian矩阵 $H=\sum_{i}{J_i^T\mathrm{\Sigma}_\bm{i}^{-\mathbf{1}}J_i}$ 的形式：

此时，可以利用Schur补来简化求解步骤。
将 $H$ 矩阵分块：

使用原始迭代 $H∆x=g(g=-J^T=2J_rT_r)$ 方程变为：

这样需求解 $∆ x$ 会产生对H的求逆过程，因此计算过程较为复杂，可以通过Schur补的方式将计算分块，简化运算步骤。此外，可以用Huber过滤外点。

利用Schur补，简化求逆过程。
由于H的对称性及Schur补性质，上式可整理成：

从而，可以利用：

得到 $x_c$ ，带回方程，从而得到 $∆ x p$ ，继而得到:

将 $H$ 求逆，转变为 $C$ 求逆，减少了很大的计算量。
利用鲁函数，减少噪声数据对结果的影响。
如最常用的 Huber 核：

当误差 $e$ 大于某个阈值 $δ$ 后，函数增长由二次形式变成了一次形式，相当于限制了梯度的最大值。同时，Huber 核函数又是光滑的，可以很方便地求导。如下图所示。
边缘化(marginalization)变量
当遇到曾经遇到过的landmark时，可以使用边缘化(marginalization)先去掉信息矩阵中landmark项，在将新的观测结果添加到信息矩阵中。另外对于一些观测比较少的landmark变量及较久远的姿态量都可以通过边缘化来削减信息矩阵的维度。
边缘化的优化步骤：
形如的信息矩阵，如下图所示，去掉 $\xi_1$ ，将信息矩阵分为四块， $\beta$ 表示与 $\xi_1$ 有关的信息量，通过矩阵块之间的运算去掉 $\xi_1$ 的信息。在去掉 $\xi_1$ 后，剩余矩阵不再稀疏。详细推导见1…6信息矩阵边缘化

2.8 SEIF算法

SEIF是一种基于EIF改进的算法，可以利用信息矩阵创建便约束来求解状态量。SEIF是一种在线估计算法，其维护的状态变量与EKF相同，只维护当前帧的相机位姿及环境点，如下：
$x_k=\left\{\xi_k,p_1,\cdots,p_m\right\}$
SEIF步骤：运动更新、测量更新、稀疏化和状态估计。

测量更新：

信息矩阵只建立与当前位姿状态相关的环境点(landmark)，这样的点成为(active points)
运动更新:

Marg掉上一姿态信息，加入新的运动状态及测量信息，此时由于边缘化掉上一时刻的位姿信息，会在信息矩阵中引入环境点(landmark)之间的联系。
稀疏化

直接去掉信息矩阵中与当前位姿无关的环境点(landmark)的相关性，从而维持信息矩阵的稀疏性。
状态估计
同样以之前与GraphSLAM的方法类似求解状态量。
此外由于SEIF直接将信息矩阵中非与当前位姿相关的环境路标点的联系去掉，因此带来一些信息的丢失，因此SSEIF等算法被提出。

3 非线性优化

现代算法中很多场景需要计算非线性优化问题，比如图优化算法，以及DL问题，大部分都是使用最小二乘法问题。目前采用逐步迭代法，来一步步优化求解非线性优化的解决方法。目前常用的方法：最速下降法，牛顿法，高斯牛顿法及LM法等。
首先构造最小二乘问题：

通常，如果函数比较简单，我们求导数就可以完成，但是，通常 $r\left(x\right)$ 是多为的，复杂的，而且x是具有区域限制的。因此实际工程中，需要使用迭代法，逐步迭代优化，来步步逼近目标函数最小。如： $r\left(x\right)$ 是多维的，且定义域有限制，这样求解会非常困难。

3.1 梯度矩阵Jacobians矩阵及Hessian矩阵

参考链接：https://blog.csdn.net/tina_ttl/article/details/51202566
梯度(gradient)矩阵, 由一维函数 $f\left(x\right)$ 对自变量各维度的偏导数组成的向量。

梯度向量和Jacobi矩阵的关系：梯度向量用于一维函数，当目标函数为标量函数时，Jacobi矩阵等于梯度向量的转置。

考虑多维函数最小化： $min\ f(x),\ \ x\in\mathbb{R}^n,f(x)\in\mathbb{R}^m$
将函数 $f (x + ∆ x)$ 关于泰勒展开：
$f(x+∆x)=f(x)+J^T(x)∆x+\frac12∆x^TH∆x$
其中， $J({x})$ 成为Jacobians矩阵，如下：

H为hessian矩阵，如下：

迭代法具体步骤：

设定 $x$ 初始值 $x_0$ ；
对于第 $k$ 次迭代，确定迭代下降方向 $x_k$ ，求解 $f(x_k+α_k∆x_k)$ 得下降步长 $\alpha_k$ 。
$f(x_k+α_k∆x_k)$ 足够小，停止迭代。 $f(x_k+α_k∆x_k)||^2_2$
否则，令 ${x_{k+1}=x}_k+\alpha_k∆x_k$ ，继续迭代返回2)。

3.2 最速下降法

使用负梯度方向作为下降方向，即：

3.3 牛顿法：考虑函数向量的二阶导数

将函迭代函数二阶泰勒展开：
$f(x+∆x)=f(x)+J^T(x)∆x+\frac12∆x^TH∆x$
求等式右侧二阶展开近似展开关于 $∆ x$ 的导数=0，求得：迭代方向 $∆ x$

牛顿法相比最速下降法，是考虑了二阶展开式进来，使得函数近似更加接近。

3.4 高斯牛顿法(GN)

由于牛顿法，Hessian阵得逆求解运算量大，或者存在奇异可能。因此高斯牛顿法用来弥补牛顿法得不足。主要用于求最小二乘问题。

我们研究如下形式的非线性最小二乘问题：

牛顿迭代公式：

将 $r\left(x\right)$ 泰勒一阶展开，并其泰勒展开相乘，得到近似的 $r^2\left(x\right)$ ：

高斯牛顿法使用其他矩阵计算代替海森矩阵。

即： $J^T=2{J_r}^Tr，H≈2{J_r}^TJ_r$

证明就是将 $r (x)$ 方程的1阶泰勒展开带入到 $f(x)=r^2(x)$ 中，得到的二阶项的乘数就约等于 $H$ 。这样能够简化 $H$ 阵的计算，且增加 $H$ 正定的可能性。
则迭代公式为：

3.5 LM(Levenberg-Marquadt)

L-M法其实是修正牛顿法，因为hessian矩阵可能是非正定的，那么迭代的方向就不是下降方向。除了GN法，另外LM法修正hessian矩阵来保证下降方向：

$G=H+\mu I$ ，从而保证矩阵正定， $G$ 的特征值： $\lambda_i+\mu$ 。
迭代公式为：

当 $\mu$ 很小时，补偿项 $\mu I$ 作用很小，迭代接近牛顿法。
当 $\mu$ 很大时， $H$ 的作用比例很小， $\left(H+\mu I\right)\nabla f=\mu\ast\nabla f$ ，相当于迭代接近最速下降法。

3.6 信赖域法

信赖区域方法（Trust Region），信赖域方法的思路有所不同。在信赖域方法的每次迭代中，先确定一个信赖域半径，然后在该半径内计算目标函数的二阶近似的极小值。如果该极小值使得目标函数取得了充分的下降，则进入下一个迭代，并扩大信赖域半径，如果该极小值不能令目标函数取得充分的下降，则说明当前信赖域区域内的二阶近似不够可靠，需要缩小信赖域半径，重新计算极小值。如此迭代下去，直到满足收敛所需的条件。

参考链接https://zhuanlan.zhihu.com/p/99392484

考虑近似程度的描述:

若 $\rho$ 太小，则减小近似范围
若 $\rho$ 太大，则增加近似范围

信赖域法流程：

4 解算工具介绍(ceres/g2o)

Ceres 相对g2o的配置要简单一些，ceres需将残差约束添加到定义的问题中，然后配置求解器，就可以求解问题；g2o是基于图优化思路，需要添加点和边的约束，然后配置求解器，求解问题。

4.1 Ceres

Ceres solver 是谷歌开发的一款用于非线性优化的库，在谷歌的开源激光雷达slam项目cartographer中被大量使用。Ceres官网上的文档非常详细地介绍了其具体使用方法，相比于另外一个在slam中被广泛使用的图优化库G2O，ceres的文档可谓相当丰富详细。

官网地址：http://www.ceres-solver.org/
参考链接：https://www.jianshu.com/p/e5b03cf22c80

使用Ceres求解非线性优化问题，一共分为三个部分：
1、第一部分：构建cost fuction结构体，即代价函数结构体。使用仿函数（functor），做法是定义一个cost function的结构体，在结构体内重载（）运算符，这样可以使该结构体cost fuction的一个实例具有函数的性质。重载()运算符时，定义代价函数，即使cost fuction(value)类似函数一样实现代价的计算。
2、第二部分：通过代价函数构建待求解的优化问题ceres::Problem。将所有约束(CostFunction)添加到(AddResidualBlock)到problem中。
3、第三部分：配置求解器参数并求解问题，这个步骤就是设置方程怎么求解、求解过程是否输出等，然后调用一下Solve方法。

#include
#include

using namespace std;
using namespace ceres;

//第一部分：构建代价函数，重载（）符号，仿函数的小技巧
struct CostFunctor {
   template <typename T>
   bool operator()(const T* const x, T* residual) const {
     residual[0] = T(10.0) - x[0];
     return true;
   }
};

//主函数
int main(int argc, char** argv) {

  // 寻优参数x的初始值为5
  double initial_x = 5.0;
  double x = initial_x;

  // 第二部分：构建寻优问题
Problem problem;
  CostFunction* cost_function =
      new AutoDiffCostFunction<CostFunctor, 1, 1>(new CostFunctor); //使用自动求导，将之前的代价函数结构体传入，第一个1是输出维度，即残差的维度，第二个1是输入维度，即待寻优参数x的维度。
  problem.AddResidualBlock(cost_function, NULL, &x); //向问题中添加误差项，本问题比较简单，添加一个就行。

  //第三部分： 配置并运行求解器
  Solver::Options options;
  options.linear_solver_type = ceres::DENSE_QR; //配置增量方程的解法
  options.minimizer_progress_to_stdout = true;//输出到cout
  Solver::Summary summary;//优化信息
  Solve(options, &problem, &summary);//求解!!!

  std::cout << summary.BriefReport() << "\n";//输出优化的简要信息
//最终结果
  std::cout << "x : " << initial_x
            << " -> " << x << "\n";
  return 0;
}

4.2 G2o

G2o（General Graphic Optimization，G2O）是主要在 SLAM 领域广为使用的优化库。它是一个基于图优化的库。图优化是一种将非线性优化与图论结合起来的理论。将点(Vertex)约束和边(Edge)约束添加到求解器求解问题。在slam中点约束(Vertex)是相机在各时刻的位置及环境点的位置，而边约束(Edge)则是环境点在对应时刻被相机观测到的结果。
G2o图优化步骤：

1、定义顶点和边的类型；
1）顶点类：Vertex
继承：g2o::BaseVertex
模板参数：优化变量维度和数据类型。
class pointVertex: public g2o::BaseVertex<3, Eigen::Vector3d>
主要关注实现函数：
virtual void setToOriginImpl()：重置初始评估值。
virtual void oplusImpl( const double* update ) // 更新评估值

15 // 曲线模型的顶点，模板参数：优化变量维度和数据类型
 16 class CurveFittingVertex: public g2o::BaseVertex<3, Eigen::Vector3d>
 17 {
 18 public:
 19     EIGEN_MAKE_ALIGNED_OPERATOR_NEW
 20     virtual void setToOriginImpl() // 重置
 21     {
 22         _estimate << 0,0,0;
 23     }
 24
 25     virtual void oplusImpl( const double* update ) // 更新
 26     {
 27         _estimate += Eigen::Vector3d(update);
 28     }
 29     // 存盘和读盘：留空
 30     virtual bool read( istream& in ) {}
 31     virtual bool write( ostream& out ) const {}
 32 };

2）约束边类：Edge
继承：g2o::BaseUnaryEdge
模板参数：观测值维度，类型，连接顶点类型
class CurveFittingEdge: public g2o::BaseUnaryEdge<1,double,CurveFittingVertex>
主要关注实现函数：
CurveFittingEdge( double x ): BaseUnaryEdge(), _x(x) {}：构造函数
void computeError()：计算曲线模型误差

34 // 误差模型 模板参数：观测值维度，类型，连接顶点类型
 35 class CurveFittingEdge: public g2o::BaseUnaryEdge<1,double,CurveFittingVertex>
 36 {
 37 public:
 38     EIGEN_MAKE_ALIGNED_OPERATOR_NEW
 39     CurveFittingEdge( double x ): BaseUnaryEdge(), _x(x) {}
 40     // 计算曲线模型误差
 41     void computeError()
 42     {
 43         const CurveFittingVertex* v = static_cast<const CurveFittingVertex*> (_vertices[0]);
 44         const Eigen::Vector3d abc = v->estimate();
 45         _error(0,0) = _measurement - std::exp( abc(0,0)*_x*_x + abc(1,0)*_x + abc(2,0) ) ;
 46     }
 47     virtual bool read( istream& in ) {}
 48     virtual bool write( ostream& out ) const {}
 49 public:
 50     double _x;  // x 值， y 值为 _measurement
 51 };

2、构建图
1）创建solver，并设置solver参数(求解器及优化方法等)：
2）创建optimizer。

74     // 构建图优化，先设定g2o
 75     typedef g2o::BlockSolver< g2o::BlockSolverTraits<3,1> > Block;  // 每个误差项优化变量维度为3，误差值维度为1
 76     Block::LinearSolverType* linearSolver = new g2o::LinearSolverDense<Block::PoseMatrixType>(); // 线性方程求解器
 77     Block* solver_ptr = new Block( unique_ptr<Block::LinearSolverType>(linearSolver) );      // 矩阵块求解器
 78     // 梯度下降方法，从GN, LM, DogLeg 中选
 79     g2o::OptimizationAlgorithmLevenberg* solver = new g2o::OptimizationAlgorithmLevenberg( unique_ptr<Block>(solver_ptr) );
 80     // g2o::OptimizationAlgorithmGaussNewton* solver = new g2o::OptimizationAlgorithmGaussNewton( solver_ptr );
 81     // g2o::OptimizationAlgorithmDogleg* solver = new g2o::OptimizationAlgorithmDogleg( solver_ptr );
 82     g2o::SparseOptimizer optimizer;     // 图模型
 83     optimizer.setAlgorithm( solver );   // 设置求解器
 84     optimizer.setVerbose( true );       // 打开调试输出

3）添加节点到图

86     // 往图中增加顶点
 87     CurveFittingVertex* v = new CurveFittingVertex();
 88     v->setEstimate( Eigen::Vector3d(0,0,0) );
 89     v->setId(0);
 90     optimizer.addVertex( v );
 91

4）添加约束边到图

 95         CurveFittingEdge* edge = new CurveFittingEdge( x_data[i] );
 96         edge->setId(i);
 97         edge->setVertex( 0, v );                // 设置连接的顶点
 98         edge->setMeasurement( y_data[i] );      // 观测数值
 99         edge->setInformation( Eigen::Matrix<double,1,1>::Identity()*1/(w_sigma*w_sigma) ); // 信息矩阵：协方差矩阵之逆
100         optimizer.addEdge( edge );

3、Optimizer初始化及优化步设置

106     optimizer.initializeOptimization();
107     optimizer.optimize(100);

参考链接：https://blog.csdn.net/wphkadn/article/details/90317006?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task

4.3 GTSAM

参考链接：
https://gtsam.org/tutorials/intro.html#listing_OdometryOptimize
https://blog.csdn.net/weixin_41394379/article/details/87967446
https://github.com/borglab/gtsam.git
Gtsam能够完成增量式优化，gtsam的使用与g2o的构建思路类似，都是创建graph添加需要计算优化的节点(Nodes)，以及已知的观测约束(Factor)，然后使用calculateEstimate()进行优化计算。大致步骤如下：

1）首先要选择测量变量的约束类型(Factor)，并添加对应头文件，
声明Graph类型，isam2，nodes等

xxxFactorGraph graph;
std::unique_ptr<ISAM2> isam;
Values newNodes; 用于存放需要计算的变量
//Values optimizedNodes;用于存放优化后的变量值
//设置isam参数：
ISAM2Params parameters;
parameters.optimizationParams = ISAM2DoglegParams();
parameters.factorization = ISAM2Params::QR;
//parameters.relinearizeThreshold = 0.01;
//parameters.relinearizeSkip = 5;
isam.reset(new ISAM2(parameters));

Gtsam提供了很多factor：
Slam中常用的有：
双目匹配约束：GenericStereoFactor
图像3D-2D投影约束：GenericProjectionFactor
3D-3D点云约束：ExpressionFactor
等。。。

2）定义变量初始值以及观测的概率模型

noiseModel::Diagonal::shared_ptr xxxNoise = noiseModel::Diagonal::Sigmas((Vector(3)<<0.0,0.0,0.0).finished());
…

3）添加初始化节点

graph.addPrior(xxx);

4）添加待计算的节点变量，每个节点对应各自单独的Symbol。

Nodes.insert(Symbol('x', pose_id), curCamPose);
Nodes.insert<Point3>(Symbol('l', landmark_id), worldPoint);

5）添加观测Factor约束：
两种添加方式：

1、graph.addxxxFactor();
2、graph.emplace_shared<xxxFactor>();

6）计算变量

isam->update(gtSAMgraph, newNodes);
optimizedNodes = isam->calculateEstimate();
//根据节点symble提取变量值
curCamPose = optimizedNodes.at<Pose3>(Symbol('x', pose_id));

5 参考

[1] 《高翔十四讲》
[2] 《Probabilistic Robotics》
[3] 《最优化理论及算法_陈宝林》
[4] Walter M R , Eustice R M , Leonard J J . Exactly Sparse Extended Information Filters for Feature-based SLAM[J]. The International Journal of Robotics Research, 2007, 26(4):335-359.
[5] Mackay D J C . The Humble Gaussian Distribution. 2006.

你可能感兴趣的:(SLAM,机器学习,自动驾驶,计算机视觉)

霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
OpenCV图片操作100例：从入门到精通指南（1）总有刁民想爱朕ha opencv 计算机视觉人工智能
OpenCV图片操作100例：从入门到精通指南本文整理了100个OpenCV实用技巧，涵盖图像处理各个领域，助你轻松掌握计算机视觉核心技能！一、入门必备：基础操作1.图像读写与显示importcv2#读取图像（BGR格式）img=cv2.imread('image.jpg')#显示图像cv2.imshow('示例图片',img)cv2.waitKey(0)#按任意键退出cv2.destroyAll
OpenCV图片操作100例：从入门到精通指南（3）总有刁民想爱朕ha opencv 人工智能计算机视觉
高效学习路径：1️⃣分阶段学习：入门：1-20例（基础操作）进阶：21-50例（图像处理）高级：51-100例（计算机视觉）2️⃣项目驱动学习：证件照背景替换（1-15例）停车场车位检测（30-45例）视频运动追踪（70-85例）3️⃣性能优化技巧：#使用UMat加速图像处理umat_img=cv2.UMat(img)processed=cv2.GaussianBlur(umat_img,(5,5
OpenCV入门到精通：AI视觉处理的完整指南 AI云原生与云计算技术学院人工智能 opencv 计算机视觉 ai
OpenCV入门到精通：AI视觉处理的完整指南关键词：OpenCV、计算机视觉、图像预处理、目标检测、AI视觉应用摘要：本文是一份面向AI视觉爱好者的OpenCV完整学习指南。从OpenCV的核心概念讲起，结合生活案例、代码示例和项目实战，逐步拆解图像读取/显示、灰度化、边缘检测、目标检测等关键技术。无论你是想入门计算机视觉的新手，还是希望用OpenCV解决实际问题的开发者，都能通过本文掌握从理论
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路一、医疗领域：AI驱动的精准诊疗与效率提升1.医学影像诊断AI算法通过深度学习技术，已实现对X光、CT、MRI等影像的快速分析，辅助医生检测癌症、骨折等疾病。例如，GoogleDeepMind的AI系统在乳腺癌筛查中，误检率比人类专家低9.4%；中国的推想医疗AI系统可在20秒内完成肺部CT扫描分析，为急诊救治争取黄金时间。2.药物研发传统药
【大模型与机器学习解惑】什么是A/B测试，为何进行A/B测试？
以下内容将围绕机器学习中的A/B测试展开，从概念与背景到实施细节、示例代码、优化思路和未来建议，并在最后给出一个整体的“输出目录”供参考。目录什么是机器学习的A/B测试为何要进行A/B测试A/B测试的实施流程示例代码与详细解释优化方向与未来建议结语1.什么是机器学习的A/B测试A/B测试（也常被称作对照试验、SplitTest）最早多用于互联网产品的功能或界面迭代中，指的是将用户或样本随机分为两组
详解LLMOps，将DevOps用于大语言模型开发
大家好，在机器学习领域，随着技术的不断发展，将大型语言模型（LLMs）集成到商业产品中已成为一种趋势，同时也带来了许多挑战。为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。本文将介绍LLM-OPS的核心思想，并分析这一策略如何帮助数据科学家更高效地运用DevOps的优秀实践，从而在语言模型的开发和部署过程中，提升工作效率和成果的
铸造软件交付的“自动驾驶”系统——AI大模型如何引爆DevOps革命 LucianaiB 评测人工智能自动驾驶 devops
铸造软件交付的“自动驾驶”系统——AI大模型如何引爆DevOps革命嗨，我是LucianaiB！总有人间一两风，填我十万八千梦。路漫漫其修远兮，吾将上下而求索。摘要(Abstract)本文深入探讨了人工智能大模型（AILargeModels）如何驱动DevOps从“自动化”（Automation）向“自主化”（Autonomous）的革命性跃迁。文章指出，AI大模型正成为现代软件工厂的“中枢神经系
搜广推校招面经九十一
美团机器学习/数据挖掘算法工程师_二面一、介绍一下ESMM模型，是否有进行过函数推导传统的转化率建模方式：只用发生点击（click=1）的样本来训练CVR模型。CVR定义如下：CVR=P(y=1∣x,z=1)CVR=P(y=1|x,z=1)CVR=P(y=1∣x,z=1)y=1表示用户发生了转化（如购买）z=1表示用户点击了广告这样做的问题：样本选择偏差（SampleSelectionBias,S
python 计算生态概览的概述
文章目录前言python计算生态库的介绍1.网络爬虫2.数据分析3.文本处理4.数据可视化5.机器学习6.图形用户界面7.游戏开发8.网络应用开发前言python计算生态概览的解释Python计算生态概览是对Python作为一门强大而广泛使用的编程语言所拥有的庞大软件集合的整体描述和概述。这个生态体系不仅包含了Python的标准库（stdlib），即随Python解释器安装的基本模块，还涵盖了极其
Google机器学习实践指南(模型预测偏差) AI_Auto 人工智能机器学习人工智能
Google机器学习（31）-模型预测偏差预测偏差：模型为何总是"猜不准"的真相揭秘你的模型预测准确率高达95%，却总是与实际情况差那么一点点？这可能是预测偏差在作祟！本文将带你深入探索这个被忽视的模型"隐形杀手"。一、什么是预测偏差？一个生活化案例想象一下，你网购了一个智能体重秤，连续一周称重显示都是60kg。但你去健身房用专业设备测量，实际是62kg。这种系统性的测量偏差，就是预测偏差在现实中
小型化与低功耗工业数据采集卡的在哪些行业有强劲需求？番茄老夫子数据采集卡
小型化与低功耗工业数据采集卡在汽车、医疗、能源等多个行业有着强劲需求，以下是具体介绍：汽车行业：在汽车电子系统中，如电池管理系统、电机控制和自动驾驶系统等，需要采集大量传感器数据。小型化低功耗的数据采集卡可轻松嵌入汽车内部紧凑空间，且能在车辆长时间运行中保持低能耗，例如用于实时监控车载网络信号，优化ECU性能，同时满足汽车对零部件小型化、轻量化以及节能的要求。医疗行业：医疗设备如呼吸机、心脏监测仪
【机器学习|学习笔记】用 Python 结合 graphviz 生成 ID3、C4.5、CART 三种决策树的结构示意图。
【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图文章目录【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图用Python结合graphviz生成ID3、C4.5、CART三种
智能产品经理的核心能力 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
智能产品经理的核心能力1.背景介绍在当今快节奏的数字时代,产品经理扮演着至关重要的角色,他们负责确保产品满足用户需求,实现商业目标,并保持竞争优势。随着人工智能(AI)和机器学习(ML)技术的不断发展,智能产品经理的概念应运而生。智能产品经理需要将传统的产品管理技能与新兴技术相结合,以创建具有创新性和智能化的产品体验。智能产品不仅需要满足功能需求,还需要提供个性化、智能化和无缝的用户体验。这对产品
使用Python进行机器学习入门指南软考和人工智能学堂 Python开发经验 python 机器学习开发语言
使用Python进行机器学习入门指南机器学习（MachineLearning）是人工智能（ArtificialIntelligence,AI）的一个重要分支，旨在通过算法和统计模型，使计算机系统能够自动从数据中学习和改进。Python作为机器学习领域的主流编程语言，提供了丰富的库和工具来实现各种机器学习任务。本文将介绍如何使用Python进行机器学习，包括基本概念、常用库以及一个实战项目示例。目录
【亲测免费】 CatBoost 教程项目使用指南
CatBoost教程项目使用指南tutorials项目地址:https://gitcode.com/gh_mirrors/tutorials1/tutorials1.项目介绍CatBoost是一个高效、灵活且易于使用的梯度提升库，特别适用于处理分类特征。它由Yandex开发，广泛应用于机器学习和数据科学领域。CatBoost提供了丰富的功能，包括自动处理分类特征、支持GPU训练、内置的交叉验证和模
Python自动化机器学习平台库之mindsdb使用详解
概要MindsDB是一个开源的自动化机器学习平台，它通过SQL接口简化了机器学习模型的创建、训练和预测过程。该库的核心理念是将机器学习功能直接集成到数据库中，让开发者无需深入了解复杂的机器学习算法，就能够快速构建和部署预测模型。MindsDB支持多种数据源连接，包括MySQL、PostgreSQL、MongoDB等主流数据库，同时提供了丰富的PythonAPI接口，使得数据科学家和开发者能够在熟悉
堡垒机操作行为异常检测的机器学习算法应用
一、传统检测模式的困境与机器学习的破局价值在数字化转型浪潮中，堡垒机作为运维安全的核心防线，面临着操作行为复杂度激增与检测能力滞后的双重挑战。传统检测手段主要依赖静态规则库与统计模型，存在三大致命缺陷：规则固化与误报泛滥：某金融机构曾因规则库未及时更新，导致运维人员正常批量操作被误判为“暴力破解”，单日误报量超2000次，消耗安全团队60%的精力。动态行为适应性弱：微服务架构下，运维人员访问路径呈
最全自动驾驶数据集（11/4号已更新）数据猎手小k 自动驾驶人工智能机器学习
自动驾驶是一个快速发展的行业，它融合了人工智能、机器学习、传感器技术、高精度地图和先进的计算平台等多种技术。技术方面，自动驾驶汽车依赖于先进的传感器、如激光雷达、摄像头、毫米波雷达等，以及强大的计算平台来处理大量数据，自动驾驶数据集是训练和验证自动驾驶系统的关键资源，它提供了丰富的场景和条件，使算法能够学习和适应复杂的真实世界驾驶环境。一、研究背景自动驾驶技术的发展需要大量的数据来训练和优化算法，
BEV开山之作Lift-Splat-Shot (LSS) 深度详解 shuaishuaideyuzi 3D视觉入门人工智能 python pytorch 3d 计算机视觉
在自动驾驶感知系统中，将多视角图像转换为鸟瞰图（BEV）是一个关键步骤。Lift-Splat-Shot（LSS）是一种高效的视角转换方法，能够将透视视图特征转换为BEV空间，从而实现更准确的3D物体检测。本文将详细解析LSS的工作原理、技术细节及其应用场景。一、LSS概述LSS（Lift-Splat-Shot）是由PhilippHenzler等人于2021年提出的一种用于自动驾驶感知系统的视角转换
自动驾驶环境感知：天气数据采集与融合技术实战遥感研究森1024 实时天气气象智能驾驶
天气与我们日常各类生活场景密不可分，在驾驶场景里当车主发动汽车准备驶向目的地时，窗外的阴晴或许只是直观感受，而真正影响驾驶安全与行程效率的，可能是几公里外的突发暴雨、桥面的结冰预警，或是前方路段的强侧风等级。在智能出行成为趋势的今天，手机App与车机系统的无缝联动，正让天气数据从“泛泛的播报”升级为“贴身的指引”。要实现这一体验跃升，关键在于筛选出那些与驾驶场景深度绑定的天气信息——它们不仅需要精
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name