尘归尘-北尘

超详细：VINS-Mono论文中文记录

VINS-Mono论文笔记

题目
0. 摘要
1. 背景简介
2.相关工作介绍
- 2.1 融合方式
- 2.2 摄像头数据处理
- 2.3 imu数据处理
- 2.4 初始化
- 2.5里程计
3. VINS-Mono系统总览
4 视觉和IMU测量的预处理步骤
- 4.1 视觉部分
- 4.2 imu部分
- 4.3 偏置纠正
5 鲁棒的初始化过程
- 5.1 视觉重构
- 5.2 视觉惯性联合
6 紧耦合的单目VIO系统
- 6.1 公式
- 6.2 imu残差
- 6.3 视觉残差
- 6.4 边缘化残差
- 6.5 针对相机实时帧率的纯运动视觉惯性状态估计器
- 6.6 imu向前传播以得到imu频率的状态估计
7 紧耦合的重定位
- 7.1 回环检测
- 7.2 特征检索
- 7.3紧耦合的重定位
8 全局姿态图的优化和重用
- 8.1 四自由度的累计误差
- 8.2 向姿态图中添加关键帧
- 8.3 四自由度的优化
- 8.4 合并姿态图
- 8.5 保存姿态图
- 8.6 加载姿态图
9 实验结果
- 9.1 数据集对比
- 9.2 现实数据实验
- 9.3 应用
10 结论与展望
论文及代码

题目

VINS-Mono: A Robust and Versatile Monocular Visual-Inertial State Estimator
VINS-Mono是一个单目视觉惯性状态估计器，其中的鲁棒性，如果从论文来看而不涉及工程细节的话，是指其独特的初始化策略（实际上可以对相机与imu间的外参、imu与相机数据间时间戳进行在线校准，借助imu和视觉的融合而可以应对更复杂苛刻的环境等也增加了其鲁棒性）而多用途则一方面因为其本身高性能（前端使用光流追踪特征点，后端使用滑动窗口，对于边缘端还可以使用只优化位姿的方法减少计算量），从而可以适配不同设备。论文中将VINS-Mono适配到了手持设备、小车和无人机上，都取得了很好的效果。另一方面状态估计本身就是很多应用的基石，自动驾驶，AR/VR都需要实时估计设备状态。

接下来会对VINS-Mono原论文进行一对一的记录（中文笔记），有些地方会结合经验添加说明，如果能耐心读完，基本就知道VINS-Mono论文中讲了什么了。

0. 摘要

为什么做VINS-Mono：六自由度状态估计的最小花费就是一个单目摄像头加一个低成本imu。状态估计器的初始化过程是鲁棒性的。对imu预积分值和相机观测进行紧耦合的非线性优化，以取得更准确的结果。
回环检测模块是紧耦合优化相结合，使重定位的计算代价很小。
利用四自由度的姿态图优化以取得全局一致的地图。保存地图和重用地图的方式很高效。通过姿态图优化，可以将当前地图和之前保存的地图进行合并。
算法效果测试是在公开数据集和真实场景都进行过测试并与其他先进算法进行比较（这里指okvis），并在无人机、手机上进行了应用测试。
最后强调VINS-Mono是一个可靠，完整和通用的系统，适合高精度定位的程序，然后说开源了源代码（pc端和手机端ios）。

笔记：从我个人的使用经验来看，VINS-Mono初始化需要设备先运动一会，充分激励imu才行，对于需要系统一启动就要执行任务的设备，这一点其实使用受到了限制。比如你用指南针，需要先把手机绕下8字，手机指南针才能正常工作，这多少有点不方便。另外VINS-Mono对设备标定其实要求很高，标定的不好轨迹很容易发生飞飘的情况。

检索关键词：单目视觉惯性系统(VINSs)，状态估计，传感器融合，SLAM

1. 背景简介

状态估计是很多应用的基础模块，比如机器人导航，自动驾驶，AR和VR等。单目相机由于其价格低，体积小，结构简单，一直是研究人员研究实现状态估计的热门选择，但是单目相机存在尺度不确定的问题，这限制了其实际应用。如果加上imu的辅助，单目相机状态估计不仅可以解决尺度不确定的问题，还可以实现翻滚角和俯仰角的客观（因为imu可以测量重力加速度方向）。
imu在视觉追踪不好的情况下仍然可以发挥作用，imu和相机是两种互补的传感器。所以imu+单目相机（VINS-Mono）不管在地面小车、无人机还是手机上，都在便携性和功耗方面有着巨大优势。
但这样的组合还是有问题的，首先就是初始化的问题，即如何把imu测量和单目视觉测量关联到一起，对于高度非线性的VINS系统，这是极大的挑战，也是限制VINS使用的原因之一。
由于累积误差的原因，状态估计器长期运行不可靠，需要加入回环检测以消除累积误差。回环检测，重定位，全局优化需要加入系统以消除状态估计器的漂移。
地图重用需求也在不断上升。
所以，VINS-Mono为解决这些问题而开发出来，另外，VINS-Mono也是之前三个工作的结合和扩展。

笔记：可以看到初始化策略是秦2017年发布的，重定位，全局图优化和地图重用是秦2018年的发布的，手机AR应用是2017年发布。而本论文是2018年5月发表的。

VINS-Mono的特点：

1.未知初始状态的鲁棒性初始化过程
2.带imu-camera外参校准和imu校准的紧耦合，基于非线性优化的单目VIO系统
3.在线重定位和四个自由度的全局姿态图优化。
4.姿态图可以保存，加载，并和局部姿态图进行合并。

VINS-Mono的贡献：

技术贡献：鲁棒性的初始化、重定位、姿态图重用
工程贡献：集成系统的开源项目、无人机部署和手机应用

成功的应用项目：

手机上小尺度的AR
无人机上中尺度的状态反馈
大尺度的状态估计

论文结构：
第二节：相关工作介绍
第三节：VINS-Mono系统总览
第四节：视觉和IMU测量的预处理步骤
第五节：VINS-Mono的鲁棒的初始化过程
第六节：紧耦合、自校准、基于非线性优化的单目VIO
第七节：紧耦合的重定位
第八节：全局姿态图的优化和重用
第九节：VINS-Mono的测试和对比结果
第十节：对VINS-Mono未来可能的研究方向

2.相关工作介绍

2.1 融合方式

摄像头和imu数据融合方法：

1.最简单的是松耦合法，此时imu是独立于摄像头的模块，常使用EKF算法，imu数据此时用于状态传播，使用纯视觉位姿进行更新。
2.紧耦合，基于EKF或者优化的方式，此时imu数据和摄像头数据在原始数据层面一起进行优化。

MSCKF是基于EKF的紧耦合流行算法。
SR-ISWF（Square Root Inverse Sliding Window Filter）是MSCKF的扩展，使用逆滤波器进行迭代计算，和基于优化的算法等价。
基于图优化或者BA的算法优化所有测量值，以期取得最佳结果。这类算法为了控制求解问题规模，常边缘化过去的状态和测量值（就是滑动窗口法），但求解高度非线性系统本身的耗时性，这类算法难以在计算资源受限的平台（如手机）上进行运行。

2.2 摄像头数据处理

直接法：残差为光度误差，需要良好的初始值，在建立稠密地图上具有天然的优势。
间接法：残差为几何距离误差（即重投影误差），在计算和匹配特征点上需要耗费额外的时间，但工程上来说其技术成熟，鲁棒性好。（建稠密地图没有优势）

2.3 imu数据处理

imu数据频率远高于摄像头数据频率。
最直接利用imu数据的方式是在EKF中，用imu数据进行状态传播。
图优化中，高效利用imu数据的技术为imu预积分。
最开始imu预积分的旋转参数化形式是欧拉角，然后沈等人推导了imu数据在连续时间内协方差的传递（没错，就是秦的导师沈老师的工作：Tightly-coupled monocular visual inertial fusion for autonomous flight of rotorcraft MAVs），然后又有人通过后验IMU偏置校正，进一步提升了imu预积分的效果。

2.4 初始化

利用短时间imu预积分值取得相对旋转的线性状态估计器初始化策略，不能对陀螺仪的偏置和图像数据噪声进行建模。
单目惯性系统的封闭解提出，然后基于此种方法，并加入了陀螺仪偏置校准的初始化方法被提出，但这类方法依赖长时间的imu双重积分，不能对imu积分的不确定度进行估计。
另外有一种基于SVO的重新初始化和故障恢复算法，但需要一个向下的距离传感器来恢复尺度。
最后是ORB-SLAM初始化方式，但其耗时较长（10s以上），对需要立即开始导航任务的机器人不太好使。
笔记：初始化是单目算法很重要的模块，其初始化结果好不好，直接影响算法表现，而单目算法的初始化都需要传感器设备进行移动来完成。

2.5里程计

不管使用何种数学模型，里程计在长期运行始终会有漂移的问题，回环检测是解决这一问题的办法。
ORB-SLAM有回环检测和地图重用模块，使用词袋模型，并在回环检测中加入了7自由度的姿态图优化。

3. VINS-Mono系统总览

VINS-Mono主要包括四个部分，如下图红框所示

1.测量处理线程(measurement preprocessing (see Section IV))：图像特征提取和追踪，在两个图像时间戳间的imu数据被进行预积分。
2.初始化线程（The initialization procedure (see Section V)）：提供姿态（相机和imu）,速度（imu坐标系的速度？），重力向量，陀螺仪偏置（为啥没有加速度计的偏置），特征点的三维坐标。这些值用于引导后续VIO的非线性优化。
3.视觉惯性里程计（滑动窗口内非线性优化）The VIO (see Section VI) with relocalization (see Section VII)：对特征观测和imu预积分值进行紧耦合优化，该模块带重定位功能。
4.姿态图优化模块（the pose graph optimization module (see
Section VIII)）：利用上面的重定位结果，进行姿态图优化，以消除漂移。

VIO线程和姿态图优化跑在分离的线程上，二者是独立的线程。

后面是一堆符号介绍，这里就略过了。

4 视觉和IMU测量的预处理步骤

该部分对应于系统总览第一部分：measurement preprocessing。

4.1 视觉部分

使用KLT稀疏光流追踪法对最新的图像进行光流追踪。如果追踪的点数量少于一个阈值，则会额外检测一些特征点。
特征点是以第一次观测到的为观测值，经过去畸变后，通过相机模型，投影到一个单位圆上（方便做视觉残差）。
关键帧的判断：a)以视觉测量判断为主。如果追踪的特征点间视差大于某一个阈值，则认为是新的关键帧。另外视差不仅可以通过平移，还可以通过旋转来得到，为解决纯旋转问题，使用了短期imu预积分数据来补偿旋转。b)为保证追踪的连续性，如果某一帧种追踪的特征点数少于一个阈值，则认为其是关键帧。

4.2 imu部分

imu数据模型
$\hat{a_t} = a_t+n_{a}+b_{at}+R_w^tG_t\\ \hat{w_t} = w_t+n_b+b_{wt}$
1）噪声和偏置
测量值包括偏置和噪声，加速度则还包含重力加速度。
偏置假设服从随机游走模型（其导数服从高斯分布），噪声假设服从高斯分布。

笔记：imu数据的处理很像数理统计中使用的方法，一个连续的带自己分布特征的数据，要如何描述其离散性质，对该离散数据进行非线性变换，变换结果和该数据本身分布有何联系。
2）imu预积分
补充知识，在世界坐标系下imu积分为

解释：计算imu在世界坐标系下的位移，需要用世界坐标系下的加速度。而imu测量结果都是自己坐标系（即body坐标系下的加速度），需要通过状态量 $q_{wb_{t}}$ 变换为到世界坐标系下状态量。但每一次优化后状态量是会变化的，这样就需要重新积分，这种低效的做法是我们想避免的。

预积分所做的事，就是将状态量分解为上一时刻与当前时刻两部分。上一时刻状态量看为常数，那当前时刻状态量只和imu积分有关，积分运算进行一次就行。原来的积分运算换为如下形式：

所以积分公式可以变为如下：

回到论文：
在相邻两个关键帧（图像帧）之间，对imu数据进行如下预积分计算：
可以看到，这里的加速度值是减去了偏置的，上面推导时默认使用真值（没有偏置的数据）

对预积分量的协方差也会进行计算。

4.3 偏置纠正

当偏置优化结果变化不大时，利用一阶泰勒展开对预积分量进行更新：

如果偏置优化变化较大，则使用新偏置重新计算imu预积分量，方法同第二部分公式。
这种策略可以极大节省计算量。

5 鲁棒的初始化过程

单目惯性系统是高度非线性系统，系统的正常运行高度依赖准确的初始化过程。
初始化过程由松耦合下的imu预积分辅助纯视觉结构还原过程。

5.1 视觉重构

使用滑动窗口中纯视觉的sfm方法。初始化过程从一个sfm过程开始，还原一个缺乏尺度信息的，由相机姿态和特征点位置构成的图模型。
获取视觉计算所需的大位移帧：
因为图像是源源不断地传进来的，开始是不断对最新帧进行特征追踪，计算最新帧与之前所有帧特征的关系。如果最新帧与之前某一帧存在如下关系：对应追踪的特征点不少于30个，特征点间对应位移大于20像素（这里在代码里是平均位移），那么就算找到合适的大位移帧。
利用五点法，计算这两帧之间的位移和旋转（缺乏尺度信息的）。然后任意设置一个尺度，用三角测量方法计算出这两帧中特征点的三维坐标。
基于已三角化的特征点，使用pnp法计算整个滑动窗口中所有帧（一般为10帧）的姿态。
最后，使用完整BA(既包含姿态，又包含特征点)来最小化特征点的重投影误差。
因为还没有关于世界坐标系的信息，这里把相机的第一帧作为sfm过程的参考帧，也就是参考坐标系。
所有帧的姿态和特征点坐标结果都是相对于相机的第一帧（第一帧也就是相机坐标系）。借助于相机和imu的外参 $p^b_c$ 和 $q^b_c$ ，可以把相机坐标系下位姿转换到imu坐标系下：

笔记：这里说的，其实是基于imu和相机的外参，计算每一个相机位姿下对应的imu位姿，其参考帧，还是基于相机坐标系，也就是相机坐标系下对应时刻imu位姿。
这里的尺度信息还是未知的，接下来会进行求解。

5.2 视觉惯性联合

使用imu预积分值，使纯视觉中的尺度信息得以和imu测量相匹配。
A)陀螺仪偏置校准
从纯视觉sfm中可以获得滑动窗口中所有帧得姿态，而从imu预积分中也可也获得连续两帧的相对旋转。最小化如下代价函数：

相对旋转的更新使用第二个函数，可以得到一个初始化的偏置的校正值，使用新的陀螺仪偏置值，对滑动窗口内imu预积分量进行重新积分。
B)速度、重力向量、尺度的初始化
陀螺仪偏置初始化后是对导航必要信息的速度、重力向量、尺度的初始化。

对imu预积分量有如下两个公式

该公式和速度，重力向量、尺度信息相关。

通过最小化上面这个代价函数，可以获得滑动窗口中每一帧的速度。相对于相机坐标系的重力向量和尺度值。
C)重力向量优化

重力向量的更新策略是将 $g$ 向量使用 $g(\hat{g}+\delta g)$ 来代替，其中 $\hat{g}$ 是测量出的平均重力向量单位方向， $\delta g$ 是在正切球空间里的微小扰动。不断迭代这个值，直到 $g$ 向量收敛。

D)初始化的完成
在对重力向量完成优化后，就可以通过把重力向量旋转到z轴来获得世界坐标系和相机坐标系的旋转关系。然后把所有相机坐标系的量旋转到世界坐标系下，此时imu坐标系的量同样也旋转到世界坐标系下。在sfm中的位移关系会缩放到米单位下。到这里，初始化完成，所有米制数据会提供给接下来的紧耦合单目VIO系统。

6 紧耦合的单目VIO系统

完成初始化后，就进入基于滑动窗口的紧耦合单目VIO系统。

6.1 公式

第一个是所有状态的集合。第二个是imu的状态向量，第三个是相机与imu的外参。这里就不解释每个字母含义了，论文里都介绍的很详细。对视觉特征的参数化使用的是逆深度形式。
这里使用的是视觉惯性BA优化方式，使得先验误差和所有测量值残差的马氏距离最小，从而获得最大后验估计。

第一项为先验误差，第二项为imu测量残差，第三项为摄像机测量残差。对视觉测量使用Huber函数以减小特征误匹配带来的影响。

6.2 imu残差

在滑动窗口中连续两帧imu测量残差为：

基于状态量计算得到的相对位移，速度，旋转和imu预积分量的差值。

6.3 视觉残差

与传统方法中将特征点投影到单位平面上计算残差不一样的是，VINS-Mono把像素误差投影到一个单位圆上。即相机残差定义在如下的单位圆：

其原因是这种残差定义方式几乎适用于所有类型的相机，包括广角、鱼眼或全向相机。
将特征点第一次观测的坐标，通过先转到imu局部坐标，然后imu局部坐标转换到世界坐标，imu世界坐标再转换到局部坐标，然后投影到当前相机坐标系，当前坐标系下投影到单位圆，就形成了路标的单位向量。
观测点单位向量与路标单位向量相减，向量差在单位圆上一切平面分解，就得到了两个残差值，即视觉的几何误差残差。

6.4 边缘化残差

为了限制VIO非线性优化的复杂度，使用了边缘化。对imu状态量和视觉特征选择性的进行边缘化，同时把边缘化的状态量转为先验。

如果第二新的帧是关键帧，则把滑动窗口中最老的关键帧边缘化掉（对应于第一种情况），如果第二新的帧不是关键帧，则把该帧对应的特征点舍弃掉，但保留其imu测量值。
为保证稀疏性，非关键帧的测量值不是所有的都会被边缘化掉。（对第二新的帧不是关键帧的情况）。
边缘化方案只是对窗口中的关键帧。它确保三角化特征点过程中计算特征点具有足够的视差，并且加速度计能得到充分的激励。边缘化使用舒尔补。
基于所有与移除状态的测量值，VINS-Mono建立了一个新的先验方法。新的先验被添加到现有的先验中。（VINS-Mono的代码中将姿态和路标信息都进行了边缘化（成为先验信息），这样客观上说是最大程度保留了所有有效信息，但也会导致海参矩阵的求解比较耗时）
我们注意到边缘化导致线性化点的早期固定，这可能导致次优估计结果。然而，由于VIO的小漂移是可以接受的，我们认为由边缘化造成的负面影响并不重要。

笔记：边缘化过程中残差的雅可比可能不是在同一点得到的，这是边缘化一直存在的问题，对于该问题，其实也有很多解决办法。但VINS-Mono中认为漂移本身就存在，后续通过回环也可以来进行消除。

6.5 针对相机实时帧率的纯运动视觉惯性状态估计器

对于计算能力有限的平台，比如手机，紧耦合单目VIO由于非线性优化沉重的计算量，在这些平台是难以达到相机实时帧率更新的。为此，除了完全优化之外，VINS-Mono还采用了轻量级运动视觉惯性优化，将状态估计频率提高到相机率(30Hz)。
纯运动视觉惯性优化的代价函数与单眼视觉优化的代价函数相同。但不同的是，纯运动状态估计并没有优化滑动窗口中的所有状态，而只是优化了固定数量的最新IMU状态的姿态和速度。将特征深度、外部参数、偏差和不想优化的旧IMU状态视为常数值。
但这确实使用所有的视觉和惯性测量来进行仅限运动的优化。（只不过有些值只是约束，不是优化量）

这种方法比单帧的pnp方法结果更为平滑。
这种方法把原来在嵌入式设备上需要50毫秒的全优化计算降低为5毫秒，使得在低算力设备上能得到相机帧率的姿态估计，特别适合在需要AR或者VR的手机上进行运行。

6.6 imu向前传播以得到imu频率的状态估计

IMU测量的速度比视觉测量的速度要高得多。虽然我们的VIO频率受图像捕获频率的限制，但我们仍然可以直接传播最近的IMU测量的VIO估计，以实现IMU速率性能。高频状态估计可以作为回环状态反馈。第九-c节介绍了一个利用这种imu速率状态估计的自主飞行实验。

7 紧耦合的重定位

滑动窗口和边缘化可以控制计算复杂度，但同时也给系统带来了累计漂移。
VINS-Mono使用了一种紧耦合的重定位方式来消除累计误差。重定位从一个回环检测模块开始，以分辨什么地方之前来过。
当前帧和回环帧在特征程度上的约束得以建立。这些对应特征的约束被集成到了单目VIO系统中，优化至最小以得到无漂移的状态估计。
多特征的多次观测约束直接在重定位中使用，可以得到更高精度和平滑度的状态估计。

7.1 回环检测

使用词袋方法DBoW2进行循环检测。
为了进行回环检测，从图像中抽取了500个特征角点并计算其BRIEF描述子。
额外的角点抽取是为了提高召回率。
描述子作为视觉数据库的检索词。
DBoW2在时间和几何一致性检查后返回候选闭环。数据库中保留所有简短的描述符以进行特征检索，但丢弃原始图像以减少内存消耗。

7.2 特征检索

当检测到一个回环时，需要通过特征对应关系来求解回环帧间关系。特征对应关系通过描述符进行匹配。但特征匹配可能会导致误匹配的问题，对该问题通过如下方式来解决。

2D-2D：使用RANSAC的基本矩阵检验。在当前图像和环闭合候选图像中检索到的特征的二维坐标来进行基本矩阵测试，去除离群点。
3D-2D:使用RANSAC进行的PnP测试。基于已知的局部滑动窗口中特征在局部滑动窗口中的三维位置，以及在回环帧图像中的二维特征点坐标，可以进行PnP测试。
在除去异常值后，将该候选对象视为正确的循环检测，并执行重新定位。
笔记：如果去除异常点后，正确匹配的特征点大于某一个阈值，则会基于匹配点计算回环帧间的相对关系，如果几何关系满足某一个限制，则认为发生了回环。

7.3紧耦合的重定位

重定位高效地将滑动窗口的帧与过去的姿态关联到了一起。在重定位时，把回环的帧（滑动窗口中的帧）设为固定帧。
回环帧观察到的特征的视觉测量模型，与VIO中的视觉测量模型相同，其残差的计算方法类似。
唯一的区别是，回环帧的姿态取自姿态图（见第八节，即姿态图合并的情况)，或直接来自过去的VIO里程计的输出(如果这是第一次重新定位），并被视为一个常数。
于是，可以很轻易把回环帧的残差添加进优化中：

其中，回环残差的变量是在回环帧中检索到的所有特征的集合。
请注意，尽管待求解函数与（14）略有不同，但要求解的状态的维数保持相同，因为回环帧的姿态被认为是常数。
当滑动窗口中发生了多个回环时，同时使用所有回环帧的所检索的所有对应特征进行优化。
这为重新定位提供了多视图约束，从而获得了更高的精度和更好的平滑度。重新定位后保持一致性的全局优化将在第八节中进行讨论。

8 全局姿态图的优化和重用

在重定位后，为保证过去的姿态能被正确加载到全局地图中，额外的姿态图优化被开发使用了。

8.1 四自由度的累计误差

得益于对重力的测量，在VINS中对翻滚角和俯仰角是完全可观测的。
如图所示：

随着物体的运动，相对于参考帧的相对的3D位置和旋转就改变了。
但是，我们可以通过重力向量的方向定义水平面，那么相对水平面的翻滚角和俯仰角是可以一直被观测到的。因此这两个量可以被当作世界坐标系下的绝对测量。
而3D位置和偏航角则作为参考帧的相对估计。因此对这四个量来说，会有累计漂移。
为了充分利用有效信息，我们认为翻滚角和俯仰角没有漂移，而对其余四个方向进行四自由度的姿态图优化。

8.2 向姿态图中添加关键帧

在经过VIO处理后，关键帧被加入姿态图。
每一个关键帧在姿态图里是一个顶点，该顶点与其他顶点通过两种类型的边连接。

A)序列边：
一个关键帧与它之前的几个关键帧通过序列边建立联系（图中表示与之前两帧），表示与之前几帧的相对位移关系，这种关系直接通过VIO获得。
考虑到关键帧i和之前的一个关键帧j，序列边只包含相对位置 $P$ 和偏航角 $ψ$ 的约束。

B)闭环边
如果一个帧有回环连接，那么它在姿态图中与闭环帧通过闭环边相连。
与序列边类似，闭环边只包含四自由度的相对位移关系。定义和上面的公式类似。
闭环边的值通过重定位获得。

8.3 四自由度的优化

我们将两帧间的残差最小化定义为：

其中R参数前两个表示翻滚角和俯仰角，从VIO中获得且固定为常值。

整个序列边和闭环边的代价函数为：

前面是序列边集合，后面是闭环边集合。
尽管紧耦合的重定位有助于消除错误的闭环，但我们还是加入了huber函数来进一步降低任何可能的误回环影响。
相反，对序列边则没有加任何鲁棒规范函数。因为这些边都是从VIO中取得，而在VIO中已经有了足够的异常点剔除机制。
姿态图优化和重定位分别跑在两个分离的线程，这使得：
1.重定位可以使用最新的姿态图优化结果来进行。
2.即使姿态图优化尚未完成，仍然可以使用现有的姿态图进行重定位。

8.4 合并姿态图

姿态图不仅可以优化当前地图，还可以将当前地图与以前构建的地图合并。
如果我们加载了以前构建的姿态图，并检测到两个姿态图之间的闭环关系，我们可以将它们合并在一起。
由于两者间所有的边都是相对约束，因此姿态图优化通过闭环边连接自动将两个姿态图合并在一起。如图所示。

当前的地图被闭环边拉到之前的地图中。每个顶点和每条边都是相对变量，因此，我们只需要固定姿态图中的第一个顶点（被加载姿态图的第一个顶点）。

8.5 保存姿态图

姿势图的结构非常简单。我们只需要保存顶点和边，以及每个关键帧的词典查询向量（特征点描述子构成的向量）。丢弃原始图像以减少内存消耗，保存的数据结构如下：

其中i为帧索引， $\hat {p^w_i}$ 和 $\hat {q^w_i}$ 分别为VIO的位置和方向。如果此帧有一个闭环帧，则v是闭环帧的索引。 $\hat {p^i_{iv}}$ 和 $\hat {ψ_{iv}}$ 是这两帧之间的相对位置和偏航角，通过重新定位得到。D（u、v、des）是关键帧的可视化查询向量，每个特性都包含二维位置及其简短的描述子。

8.6 加载姿态图

姿态图的保存格式就是其加载格式。每个关键帧都是姿态图中的一个顶点。顶点的初始姿态是ˆpwi和ˆqwi。回环边由闭环信息ˆpiiv、ψˆiv直接建立。每个关键帧和相邻关键帧建立几条顺序边。加载姿态图后，我们立即进行一次全局4-DOF姿态图优化。姿态图的保存和加载速度与姿态图的规模呈线性关系。

9 实验结果

公开数据集和现场真实世界数据都进行了测试。
首先在公开数据集上和同类先进算法进行一个跑分。
然后在室内，和同类算法来个同台竞技。
大尺度的实验证明其长期有效性。
此外还整了两个程序应用。

1）对于无人机，利用VINS-Mono进行一个位置反馈，以控制其遵循预定的轨迹。
2）把算法移植到了手机上进行运行。

9.1 数据集对比

A) VIO对比：使用EuRoC MAV 视觉惯性数据集。
摄像机型号及测量频率：Aptina MT9V034 global shutter, WVGA monochrome, 20 FPS
IMU型号及测量频率：ADIS16448, 200 Hz
真值标定设备：VICON and Leica MS50（维科和徕卡的测量及运动追踪设备）

笔记：EuRoC MAV数据集是由苏黎世联邦理工学院的自主系统实验室发布的（瑞士的两所联邦理工学院之一，位于德语区苏黎世市区，是欧洲大陆国家大学排名最高的大学，位居全球第25名。有人认为，苏黎世联邦理工学院是做SLAM的殿堂级院校）。其背景是欧洲机器人挑战赛（大概是这个名字），为了评估参赛选手的算法。这个数据集也是被很多队伍使用了，大家都认为这个数据集还是不错的，所以是比较公认的测试数据集。该数据集是一个双目+imu的视觉惯性数据集，由一个微型飞行机器人（MAV）在两个场景中采集，一个是苏黎世联邦理工学院的机器大厅（machine hell）,一个是类似于书房的场景。
EuRoC MAV数据集链接

VINS-Mono是单目算法，图像数据只使用数据集中的左目图像。

与之同台竞技的算法是OKVIS，同样也是一个滑动窗口非线性优化的VIO算法，只不过没有回环检测部分。

使用两个数据集进行对比：MH_03_medium and MH_05_difficult，一个中等难度一个困难难度。
VINS-Mono使用两种模式进行对比，带回环检测和不带回环检测的模式。

MH_03_medium数据集结果

有的地方OKVIS效果好，有的地方VINS-Mono效果好，所以接下来是误差统计（不带回环的OKVIS效果堪比带回环的VINS-Mono，果然苏黎世联邦理工学院还是强）

第一个平移误差，看起来回环确实能控制累计误差（误差不会随着机器人运动距离增加而增加）。而不带回环的版本，后10米阶段vins-mono开始优于OKVIS。
第二个偏航角误差，则OKVIS是优于不带回环的vins,效果和带回环的vins相当。
第三个旋转误差，VINS在20米后误差变化不大，而OKVIS则随着移动距离的增大后误差增加（有误差累积）。

MH_05_difficult 数据集结果

同样，轨迹上看来，两者都有好于对方的部分，精确比较还得进行统计。

各误差比较情况和MH_03_medium数据集结果很类似，平移和旋转是VINS优于OKVIS，但偏航角的估计OKVIS好于VINS。

使用EuRoC全部数据集进行测试，利用绝对轨迹误差作为指标来统计，结果如下：

可以看到，大多数情况下VINS带回环版本表现最好。

还有更多的比较结果可以在如下论文中获得：

总得说来，与其他最先进的算法相比，VINS-Mono具有良好的性能.

B)地图合并结果
EuRoC的五个MH数据集是在不同起点采集（但都是在machine hell采集），利用VINS的全局姿态图合并功能，可以将5个MH序列合并成一个全局姿态图。

利用重定位和姿态图优化，在同一个相机数据下，把第一个序列（第一个数据集下的轨迹估计）中的第一帧的位置和偏航角设置为零（作为基础）。然后把剩下的数据集轨迹重定位并合并到第一个数据集轨迹上，合并结果如图所示：

合并的轨迹和真值的均方根误差（绝对误差）为0.21米，这个对于500米长度的总运行距离来看，还是很令人印象深刻的。
这个实验表明，VINS-Mono具有增量建图的能力。

笔记：500米距离，视觉惯性状态估计器的平均误差在20cm，这个也可以作为视觉方案作为状态估计所能达到的一个精度范围了。

9.2 现实数据实验

A)室内实验
实验装置：单目相机(mvBlueFOXMLC200w，20Hz)，DJIA3控制器（内包含一个IMU，100Hz)
手持传感器套件，人拿着以正常的速度行走。
结果还是与OKVIS进行比较。

实验结果：

在室内旋转时，VIO会产生明显的漂移（对两种算法都是这样）。OKVIS在x、y、z和偏航角上有明显的漂移积累。而VINS的重新定位和闭环模块有效地消除了这些漂移。

B)室外大尺度实验
这个非常大的数据集是在整个HKUST校园（香港科技大学内）使用手持VI-Sensor记录的。

VI-Sensor也是由苏黎世联邦理工学院的自主系统实验室联合开发的，如图：

该数据集覆盖了长度约710米、宽240米、高度变化约60米的地方。总路径长度为5.62km。数据包含25hz图像和200hz的IMU，持续1h34min。这是测试VINS稳定性和耐久性的一个非常重要的实验

在这个大规模的测试中，将关键帧数据库的大小设置为2000（姿态图中包含2000帧？），以提供足够的回环信息并达到实时性能。
使用CPU:Intel i7-4790 3.60GHz CPU
时间统计数据见表二。

可以看到主要耗时部分在回环检测和姿态图优化。

估计的轨迹与谷歌地图对齐结果

可以看到我们的结果在这个非常长期的测试中几乎没有漂移。

笔记：如果这个是绕了整个学校一圈，那香港科技大学校区好像不是很大（长710米，宽240米。）但算法能持续一个半小时左右，为达到实时性，对关键帧数据库的大小进行了限制，但这个的限制是如何做到的并没有说明，但这表明，随着追踪轨迹变长，回环检测和姿态图优化越来越耗时，这一部分对算法实时性会有较高影响。

9.3 应用

A)无人机的反馈控制
将VINS-Mono应用于一个飞行机器人的自动反馈控制中：
摄像头：型号为MatrixVision mvBlueFOX-MLC200w 分辨率： 752 × 480 ，全局快门摄像头，安装位置为飞行器前方。该摄像头为一个190º的鱼眼镜头。
imu:使用DJIA3飞行控制器获取IMU测量数据，同时用于飞行器姿态稳定控制
CPU: Intel i7-5500U (3.00 GHz)
因为传统的针孔相机型号不适合大型FOV相机，使用MEI相机模型，并使用toolkit进行校准。

在本实验中，使用VINS-Mono来进行状态估计，以测试其自主轨迹跟踪性能。本实验关闭了VINS-Mono的重定位功能。四翼飞行器绕8字飞行，8字每个圆半径为1.0m，在轨迹周围设置四个障碍来验证没开回环功能的VINS-Mono的准确性。四翼飞行器在实验过程中连续四次跟踪这个轨迹。100Hz（imu频率）机载状态估计（参见第VI-F，紧耦合单目VIO中，利用imu数据，对最新的VIO估计进行状态传播，可以得到imu频率的状态估计）可实现四翼飞行器的实时反馈控制。

实验追踪结果如下：

轨迹总长度为61.97米（飞了四圈的轨迹长度），最终位置误差为[0.08, 0.09, 0.13]，误差距离与轨迹的比值为0.29%。详细的平移和旋转对比值及其误差如图所示：

可以看到位置的偏差基本在0~0.2米范围内波动，相比于偏航角，俯仰角和翻滚角的偏差更大一些。

B)移动设备

将VINS-Mono移植到移动设备上，并提出了一个简单的AR应用程序来展示它的准确性和鲁棒性。

把移动设备上运行的版本称为VINS-Mobile。
VINS-Mobile在一个iphone上运行。
使用手机获取的照片，30Hz，640x480的分辨率。
imu数据，使用iphone内置的 InvenSense MP67B传感器（可以获得三自由度的加速度和角速度）。
在平面上插入一个虚拟立方体，该平面从估计的视觉特征中提取。

然后人拿着设备，以正常的速度从房间内走进走出。
因为使用imu，所以在回环检测发生时，使用4-DOF姿态图优化来消除x、y、z和yaw的漂移。
走了大概264米后，回到出发点，结果如图：

从方块还在原点（其实有一些微小的偏差，但也足够精确了），可以证明，利用四自由度的姿态图优化能完全消除里程计的累计漂移。

10 结论与展望

在这篇文章中，提出了一种鲁棒且多用途的单目视觉惯性状态估计器VINS-Mono。
VINS-Mono具有对IMU预积分、估计器初始化、在线外参校准、紧耦合的VIO、回环重定位和有效的全局优化的最先进、新颖的解决方案。
通过与其他最先进的开源算法相比，VINS-Mono显示出了优越的性能。
论文介绍的PC和iOS实现现已对社区开源。
尽管基于特性的VINS估计器已经达到了现实世界部署的成熟度（解决方案的成熟度在论文中得到了验证），但这里仍然有许多研究的方向。

单目惯性系统在一些运动情况（比如匀速或者匀加速，此时imu会失灵）和环境（一些缺乏纹理的环境，基于特征点的视觉方案可能会失效），VINS可能会处于弱可观察甚至观测退化的状态。我们感兴趣的研究方向是利用实时在线方法来评估单目视觉所处在状态的可观察性，以及实时生成运动方案来恢复可观察性。
另一个研究方向是关于VINS在各种消费设备上的大规模部署，如安卓手机。在这些设备上部署的话，需要对这些设备的传感器的内参和外参进行在线校准，并对校准质量进行在线评估。
最后，我们感兴趣的是利用单目VINS的状态估计结果来生成稠密点云地图。我们的第一个利用单目VINS生成稠密点云地图以应用于无人机导航的成果发表在如下文章中：

最后总结，为了进一步提高系统的准确性和鲁棒性，仍需要进行大量的研究。

完结，撒花。

论文及代码

1.VINS-Mono: A Robust and Versatile Monocular Visual-Inertial State Estimator-pdf
2.VINS-Mono Github
3.VINS-Fusion Github

你可能感兴趣的:(VSLAM,自动驾驶,SLAM,VINS,论文笔记)

这份「零基础」机器学习实战课程，帮你彻底搞懂AI不再迷茫！——深度解析ML-For-Beginners wylee 人工智能机器学习
引言：告别迷茫，拥抱AI未来在当今科技浪潮之巅，人工智能（AI）无疑是最璀璨的明星。机器学习（MachineLearning），作为AI的核心驱动力，正以前所未有的速度渗透到我们生活的方方面面：从智能推荐系统到自动驾驶，从疾病诊断到金融风控，其应用场景几乎无处不在。然而，对于无数渴望投身AI领域的学习者而言，机器学习的门槛似乎一直高不可攀。你是否也曾有过这样的困惑：面对海量的在线课程和资料，眼花缭
AI伦理与自动驾驶：当机器掌握方向盘时的道德抉择 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能自动驾驶 unix ai
AI伦理与自动驾驶：当机器掌握方向盘时的道德抉择关键词：AI伦理、自动驾驶、道德算法、电车难题、责任归属、技术监管、人机协作摘要：本文深入探讨自动驾驶技术发展过程中面临的伦理挑战，从经典的"电车难题"出发，分析AI决策系统在生死抉择中的道德困境。我们将剖析自动驾驶的伦理框架设计原则，探讨技术实现方案，并通过代码示例展示伦理算法如何嵌入自动驾驶系统。文章还将讨论法律责任划分、社会接受度等现实问题，最
AWS Lambda与RDS连接优化之旅 t0_54manong 编程问题解决手册 aws 云计算个人开发
在云计算的时代，AWSLambda与RDS的结合为开发者提供了高效且灵活的解决方案。然而，在实际应用中，我们常常会遇到一些性能瓶颈。本文将通过一个真实案例，探讨如何优化AWSLambda与RDS之间的连接，以提高API的响应速度。背景介绍最近，我们在AWS上部署了一个使用Dotnet6开发的API，它通过APIGateway暴露给外部，并连接到同VPC内的MySQLAuroraRDS数据库。部署前
智能汽车图像及视频处理方案，支持视频智能包装创作能力美摄科技汽车
在这个日新月异的智能时代，每一帧画面都承载着超越想象的力量。随着自动驾驶技术的飞速发展，智能汽车不仅成为了未来出行的代名词，更是技术与艺术完美融合的典范。在这场变革的浪潮中，美摄科技以创新为翼，推出了领先的智能汽车图像及视频处理方案，为智能汽车行业带来了前所未有的视觉盛宴，重新定义了智能出行的视觉体验。一、智能重塑，视觉新境界美摄科技的智能汽车图像及视频处理方案，是基于深度学习、人工智能及大数据处
降低20%成本暴雨定制化液冷系统落地
暴雨信息凭借多年液冷设计及实施经验，帮助某知名自动驾驶企业完成了车端算力设备和后端数据中心的液冷改造升级，进一步提升了其车端实时数据处理能力及后端模型训练优化效率。但在后期持续运维过程中，由于测试中心尚未配备液冷系统，只能依赖外接散热器和水泵来进行液冷设备的测试与故障排除，不仅噪音大还存在较大的冷却液泄漏风险。为此，客户期望我们帮助其建立起一套规范化的液冷测试系统，以解决当下困境。暴雨信息专业技术
【软件系统架构】系列四：嵌入式软件-NPU（神经网络处理器）系统及模板
目录一、什么是NPU？二、NPU与CPU/GPU/DSP对比三、NPU的工作原理核心结构：数据流架构：四、NPU芯片架构（简化图）五、NPU的优势六、NPU应用场景视觉识别语音识别自动驾驶智能监控AIoT设备七、主流NPU芯片/架构实例八、开发者工具生态（通用）九、NPU集成建议（嵌入式开发场景）十、NPU芯片选型对比+模型部署流程+嵌入式工程模板1.主流NPU芯片选型对比表2.模型部署流程（以T
计算机视觉实战：OpenCV 与深度学习结合 QuantumWalker 计算机视觉 opencv 深度学习 python
```html计算机视觉实战：OpenCV与深度学习结合计算机视觉实战：OpenCV与深度学习结合在当今数字化时代，计算机视觉技术已经渗透到我们生活的方方面面。从智能手机的面部识别解锁，到自动驾驶汽车的环境感知，计算机视觉正在改变我们的世界。而在这个领域中，OpenCV和深度学习的结合，更是推动了计算机视觉技术的发展。什么是OpenCV？OpenCV（OpenSourceComputerVisio
AI 在自动驾驶路径规划中的深度强化学习优化 QuantumWalker 人工智能自动驾驶机器学习
```htmlAI在自动驾驶路径规划中的深度强化学习优化在当今快速发展的科技领域中，人工智能（AI）的应用正在不断拓展其边界。特别是在自动驾驶技术中，AI的应用已经从简单的感知和识别发展到了复杂的决策和控制阶段。其中，深度强化学习作为AI的一个重要分支，在自动驾驶路径规划中发挥着越来越重要的作用。一、深度强化学习简介深度强化学习是一种结合了深度学习和强化学习的机器学习方法。它通过让智能体在环境中进
特斯拉及新能源车企笔试面试题型解析上-21期启芯硬件笔记经验分享 PCB EMI 硬件工程面试职场和发展
本专栏预计更新90期左右。当前第21期-特斯拉硬件.特斯拉作为全球领先的电动汽车、能源存储和人工智能公司，其硬件工程师岗位的招聘通常包括笔试和多轮技术面试，考察领域涵盖数字电路设计、模拟电路、嵌入式系统、电动车技术和自动驾驶等。由于特斯拉的创新性和技术领先地位，其面试问题可能更加注重实际应用和问题解决能力。笔试通常旨在考察候选人的基础理论知识、问题分析能力、电路设计与调试经验、以及对相关工具和方法
特斯拉及新能源车企笔试面试题型解析下启芯硬件笔记经验分享硬件工程嵌入式硬件技术提升面试职场和发展
特斯拉及新能源车企笔试面试题型解析下本专栏预计更新90期左右。当前第22期-特斯拉硬件.由于特斯拉的招聘信息保密，本文根据公开的特斯拉硬件工程师面试经验、招聘需求以及行业通用技术领域，并提供详细的题目解析思路和方法，以期为准备特斯拉硬件工程师职位的候选人提供有价值的参考、总结、和经验分享，结合特斯拉的电动汽车和自动驾驶技术特点，给出可能涉及的题目，并提供详细解析。随着技术的飞速发展和特斯拉业务的不
C++ OpenCV4 实现鱼眼镜头矫正朝风工作室 c++开发语言
一、为什么需要鱼眼镜头矫正？鱼眼镜头通过特殊的光学设计实现180°甚至更广的视野，广泛应用于全景相机、自动驾驶、安防监控等领域。但这种广角特性会引入严重的桶形畸变：直线边缘会向内弯曲（如图像边缘的门框变成弧线），物体尺寸在边缘区域会被拉伸。矫正的核心目标：将鱼眼镜头拍摄的畸变图像还原为接近人眼视觉的正常图像，便于后续的目标检测、图像拼接等处理。矫正前后效果对比（此处可插入图片）矫正前图像（鱼眼畸变
Spring IoC&DI 無限進步island spring java 后端
一、Spring家族Spring=超级工厂（管理对象生命周期）SpringMVC=快递小哥（处理HTTP请求/响应）SpringBoot=智能工具箱（一键集成全家桶）类比：Spring是汽车发动机（动力核心）SpringMVC是方向盘+油门（控制方向）SpringBoot是自动驾驶系统（简化操作）二、IoC：颠覆传统的控制艺术传统开发（自己造车）：Carcar=newCar();//亲手造发动机c
cnn 一维时序数据_AI顶会解读|时序动作分割与检测，附代码链接
时序动作分割与检测时序动作的分割与检测是视频计算机视觉技术的一大常规任务，对自动驾驶和机器人等应用至关重要，下面3篇论文是腾讯AILab在这一方向的探索成果。1.动作识别中的时序帧间差异表征学习TemporalDistinctRepresentationLearningforActionRecognition本文由腾讯AILab、腾讯优图实验室、新加坡南洋理工大学、美国纽约州立大学布法罗分校合作完
一[3.0]、 yolov8 工作原理他人是一面镜子，保持谦虚的态度车道检测研究 YOLO
目录YOLOv8简介什么是YOLOv8？yaml配置文件解析YOLOv8架构图Yolov8有什么新功能？YOLO模型彻底改变了计算机视觉领域。识别物体是计算机视觉中的一项关键任务，可应用于机器人、医学成像、监控系统和自动驾驶汽车等多个领域。YOLO模型的最新版本YOLOv8是一种先进的实时物体检测框架，引起了研究界的关注。在所有流行的物体识别机器学习模型（如FasterR-CNN、SSD和Reti
直击 OpenShift 与 Kubernetes (K8s) 的核心差异欧先生^_^ openshift kubernetes 容器
简单来说，可以把Kubernetes想象成汽车的发动机，它非常强大、标准、可插拔。而OpenShift则是一辆完整的、可以直接上路的豪华汽车，它不仅包含了K8s这个发动机，还配备了车身、仪表盘、导航、安全系统、自动驾驶辅助等所有必需的部件，并且全部由一个厂商（红帽）进行了深度整合和测试。OpenShift多出来的功能，主要是为了提升开发者生产力、增强企业级安全、简化运维管理这三个目标。这些功能是通
图像处理技术研究与实现——python+opencv AnronSakura 图像处理 python opencv
背景介绍21世纪是一个充满信息的时代，图像作为人类感知世界的视觉基础，是人类获取信息、表达信息和传递信息的重要手段。处理图像，可以帮助我们更好地获取信息，也可以使我们更客观、准确地认识世界。图像处理作为计算机视觉领域的重要分支，在各个行业中扮演着越来越重要的角色。从医疗诊断、自动驾驶、安防监控到人工智能领域的图像识别，图像处理无处不在。OpenCVOpenCV是一个开源的计算机视觉库，它包含了丰富
感知框2D反投是咋回事？ SLAM必须dunk 自动驾驶人工智能深度学习机器学习自动驾驶机器人
一、感知框：“2D框反投”是咋回事？（以自动驾驶识别车辆为例）1.核心逻辑：从图像特征“反推”目标框简单说，先用算法在2D图像里识别特征（比如车辆的轮廓、颜色、纹理），再把这些特征对应的区域，用“反投影”思路框成2D矩形。目的是在单张摄像头画面里，标记出“疑似目标”的位置。2.类比理解（找停车场里的红色轿车）假设你开发一个“自动驾驶视觉感知模块”，要识别停车场里的红色轿车第一步（特征提取）：算法学
VINS_MONO视觉导航算法【三】ROS基础知识介绍凳子花❀ SLAM 立体视觉 SLAM VINS_Mono
文章目录其他文章说明ROSlaunch文件基本概念定义用途文件结构根标签常用标签\\\\\\\示例基本示例嵌套示例使用方法启动*.launch文件传递参数总结ROStopicTopic的基本概念Topic的工作原理常用命令示例总结ROS常用命令rosrunroslaunchrosbag主要功能roscorerosnoderostopicrosservicerosparamrqtros::spin(
VINS-Mono 开源项目安装与使用指南劳丽娓Fern
VINS-Mono开源项目安装与使用指南VINS-Mono项目地址:https://gitcode.com/gh_mirrors/vi/VINS-MonoVINS-Mono是一个专为单目视觉惯性系统设计的实时SLAM框架，旨在提供高精度的视觉惯性里程计。本指南将带你深入了解其目录结构、启动文件以及配置文件，帮助你快速上手并应用此项目。目录结构及介绍VINS-Mono的项目结构清晰地组织了不同的组件
当AI拥有空间直觉：SpatialLM如何让机器“看懂”三维世界？遇见小码 AI棱镜实验室人工智能开源
开源地址：https://huggingface.co/manycore-research/SpatialLM-Llama-1B你是否想象过，只需用手机拍一段视频，AI就能像人类一样理解房间的布局、家具的位置，甚至预测柜门打开的方向？这正是群核科技开源的SpatialLM所实现的能力——它让机器第一次拥有了“空间直觉”，能够从普通视频中解析物理世界的三维逻辑，成为机器人、自动驾驶等领域的“空间翻译
基于OpenCv（开源计算机视觉库）的图像旋转匹配我在北京coding 计算机视觉 opencv 人工智能
OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库，具有跨平台特性，广泛应用于工业检测、医疗影像分析、自动驾驶、无人机、机器人视觉等多个领域。本项目解决了图像模板匹配时的旋转问题。传统的模板匹配方法往往假设目标模板在搜索图像中的位置和方向与原图完全一致，但在实际应用中，目标可能因视角变化而发生旋转。因此，旋转匹配成为一种必要的技术。
极越即将迎来“萝卜快跑”时刻螳螂观察极越01
文|螳螂观察作者|刘歌美编|赵倩“9公里的路程只要8块钱，不到出租车、网约车价格的一半”。这是正在火出圈的无人驾驶汽车“萝卜快跑”，它之所以这么低价，是不需要人类司机，可以24小时不间断地跑。大家都知道“萝卜快跑”背后的“大脑”是百度。是百度Apollo自动驾驶10年来的研发，推出了无人驾驶出租车，但少有人知道“萝卜快跑”还有一个“亲兄弟”叫“极越汽车”，是吉利和百度联合打造的汽车品牌。所以，萝卜
20亿！禾赛获百度萝卜快跑独家定点，ADAS激光雷达“破圈”L4应用高工智能汽车百度
继在前装量产领域“破圈”之后，禾赛率先将ADAS半固态激光雷达大规模应用部署在Robotaxi上面。近日，在武汉大街小巷穿梭着的数百辆百度萝卜快跑无人驾驶出租车，让自动驾驶再度火出圈。据了解，此次在武汉投入运营的无人驾驶车辆采用了百度Apollo第五代自动驾驶系统解决方案，搭载了禾赛Pandar系列高性能激光雷达作为感知主雷达。而今年，更安全、体验更舒适的第六代百度Apollo无人车也将陆续投放市
计算机视觉与深度学习实战：以Python为工具，基于深度学习的汽车目标检测好知识传播者 Python实例开发实战计算机视觉深度学习 python 基于深度学习的汽车目标检测
随着人工智能技术的飞速发展，计算机视觉与深度学习已经成为当今科技领域的热点。其中，汽车目标检测作为自动驾驶、智能交通等系统的核心技术，受到了广泛关注。本文将以Python为工具，探讨基于深度学习的汽车目标检测方法及其实战应用。一、计算机视觉与深度学习基础计算机视觉是研究如何让计算机从图像或视频中获取信息、理解内容并作出决策的科学。深度学习则是一种模拟人脑神经网络的机器学习技术，通过构建深层神经网络
0_序章导论 39036953 吴恩达《AI for 人工智能
课程整体框架时长：4周终极目标：学完后比大公司CEO更懂AI，能领导团队解决实际问题每周核心内容分解第一周：重新认识AI的本质弱AI（ANI）vs.强AI（AGI）ANI（弱人工智能）：特点：只精通单一任务（如语音助手、自动驾驶）现状：已创造巨大价值，未来将在零售、制造、交通等非软件行业爆发AGI（强人工智能）：目标：达到或超越人类全能智能真相：数十年内难以突破，无需担忧"机器人灭绝人类"破除AI
空间智能领域，AI人工智能如何大显身手 AI大模型应用之禅人工智能 ai
空间智能领域，AI人工智能如何大显身手关键词：空间智能、人工智能、计算机视觉、地理信息系统、自动驾驶、增强现实、智能城市摘要：本文深入探讨了人工智能在空间智能领域的应用与前景。空间智能作为理解、处理和利用空间信息的能力，正在被AI技术深刻变革。我们将从核心技术原理出发，分析计算机视觉、深度学习、强化学习等技术如何赋能空间智能，探讨其在自动驾驶、智能城市、AR/VR等领域的实际应用，并提供详细的算法
AWS 监控和管理服务 CloudWatch wumingxiaoyao Big Data aws 大数据云计算 CloudWatch 日志监控
AWS监控和管理服务CloudWatch什么是CloudWatchCloudWatch工作原理CloudWatchlog收集方法通过AWSLambda发送日志到CloudWatchLogs使用CloudWatchLogsAgent发送日志通过AWSSDK或API将日志发送到CloudWatchLogs通过CloudWatchAgent将应用和系统日志发送到CloudWatchLogsCloudWa
PHP云原生与Serverless架构深度实践 seopthonshentong 云原生 php serverless
在前六篇系列教程的基础上，本文将深入探讨PHP在云原生和Serverless环境下的高级应用，帮助开发者构建可扩展、高可用的现代化PHP应用。1.ServerlessPHP架构Bref与AWSLambda集成bash#安装Brefcomposerrequirebref/brefphpartisanvendor:publish--tag=serverless-configserverless.yml
VINS-FUSION 优化-在线同步时间td校准云端舞步 VINS-FUSION vins-fusion 重投影误差视觉误差因子同步时间td校准外参校准雅克比
论文结合源码详细介绍VINS-FUSION优化-在线同步时间td校准。视觉惯性里程计中，不同传感器之间的测量时间同步对于系统的精度和鲁棒性都至关重要。在实际操作时，由于传感器触发和传输过程延迟，在不同传感器测量会出现时间偏移，即时间不同步。所以本文将camera和IMU之间的数据流时间偏移td加入优化系统中，在线实时估计同步时间td。camera和IMU数据流之间的时间偏移td如下图所示：一、同步
基于深度学习的智能图像语义分割系统：技术与实践 Blossom.118 机器学习与人工智能深度学习人工智能 python 分类音视频机器学习 sklearn
前言图像语义分割是计算机视觉领域中的一个重要任务，其目标是将图像中的每个像素分配到预定义的语义类别中。这一技术在自动驾驶、医学影像分析、机器人视觉等多个领域有着广泛的应用。近年来，深度学习技术，尤其是卷积神经网络（CNN）及其变体，为图像语义分割带来了显著的改进。本文将详细介绍基于深度学习的智能图像语义分割系统的原理、实现方法以及实际应用案例。一、图像语义分割的基本概念1.1什么是图像语义分割？图
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc