try_again_later

一文详解单目VINS论文与代码解读目录

本文旨在对前一阶段学习vins-mono开源框架的总结。结合暑假秋招之前报名的深蓝学院的《从零开始手写VIO》课程，本文从VIO原理以及开源代码分析两部分进行详细介绍。PS：提升代码能力最好的办法就是从头到尾撸开源框架，这种体验是单纯推导公式体会不到的。

本文只是VINS-Mono的目录部分，具体内容链接如下，共分为12部分，对应系统的4大部分：图像和IMU预处理、初始化、后端滑动窗口优化、闭环检测和优化。

一、文章概述及框架

Vins-mono是香港科技大学开源的一个VIO算法，用紧耦合的方法，通过单目+IMU恢复出尺度，效果非常棒。

VINS的功能模块可包括五个部分：数据预处理、初始化、后端非线性优化、闭环检测及闭环优化。代码中主要开启了四个线程，分别是：前端图像跟踪、后端非线性优化（其中初始化和IMU预积分在这个线程中）、闭环检测、闭环优化。

1 图像和IMU预处理

图像：提取图像Harris角点，金字塔光流跟踪相邻帧，RANSAC去除异常点，最后将跟踪到的特征点push到图像队列中，并通知后端进行处理。

IMU：1）IMU积分，得到PVQ 位置、速度、旋转，2）计算在后端优化中将用到的相邻帧的预积分增量，3）计算预积分误差的Jacobian矩阵和协方差。

2 初始化

SFM纯视觉估计滑动窗所有帧的位姿和3D路标点逆深度

SFM与IMU预积分松耦合，对齐求解初始化参数。

3 后端滑动窗口优化

将视觉约束、IMU约束和闭环约束放在一个大的目标函数中进行非线性优化，求解滑动窗内所有帧的PVQ、bias

4 闭环检测和优化

DBow进行闭环检测，检测成功后重定位，最后对整个相机轨迹进行闭环优化。

二、VINS-Mono论文以及代码详细解读

VINS-mono 论文解读（IMU预积分+Marg边缘化）
VINS-Mono 代码详细解读——视觉跟踪 feature_tracker
VINS-Mono 代码详细解读——vins_estimator/Estimator_node.cpp
VINS-Mono 代码详细解读——基础储备：IMU预积分的残差、Jacobian和协方差 processIMU（）+intergrationBase类+imu_factor.h
VINS-Mono 代码详细解读——基础储备：vins_estimator/feature_manager.cpp
VINS-Mono 代码详细解读——基础储备：外参标定 InitialEXRotation类
VINS-Mono 代码详细解读——初始化1：视觉SFM详解vins_estimator/estimator.cpp/processImage()+initialStructure（）
VINS-Mono 代码详细解读——初始化2：视觉惯性松耦合初始化 vins_estimator/estimator.cpp/visualIntialAlign（）
VINS-Mono 理论详细解读——紧耦合后端非线性优化 IMU+视觉的残差residual、Jacobian、协方差、基于舒尔补的边缘化
VINS-Mono 代码详细解读——基于滑动窗口的紧耦合后端非线性优化 optimization()
VINS-Mono 代码详细解读——回环检测与重定位、四自由度位姿图优化
实操：用imu_utils标定IMU，之后用于kalibr中相机和IMU的联合标定

三、代码的文件目录

1、ar_demo：一个ar应用demo
2、benchmark_publisher：接收并发布数据集的基准值
3、camera_model
calib：相机参数标定
camera_models：各种相机模型类
chessboard：检测棋盘格
gpl
sparse_graph
intrinsic_calib.cc：相机标定模块main函数
4、config：系统配置文件存放处
5、feature_trackers：
feature_tracker_node.cpp ROS 节点函数，回调函数
feature_tracker.cpp 图像特征光流跟踪
6、pose_graph：
keyframe.cpp 关键帧选取、描述子计算与匹配
pose_graph.cpp 位姿图的建立与图优化
pose_graph_node.cpp ROS 节点函数，回调函数，主线程
7、support_files：帮助文档、Bow字典、Brief模板文件
8、vins_estimator
factor：实现IMU、camera等残差模型
initial：系统初始化，外参标定，SFM
utility：相机可视化，四元数等数据转换
estimator.cpp：紧耦合的VIO状态估计器实现
estimator_node.cpp：ROS 节点函数，回调函数，主线程
feature_manager.cpp：特征点管理，三角化，关键帧等
parameters.cpp：读取参数

四、论文介绍

VIO引出原因：

1）单纯视觉：缺点: 尺度不确定性、单目纯旋转无法估计、快速运动易丢失、受图像遮挡运动物体干扰。

优点：不产生漂移、直接测量旋转与平移。

2）单纯IMU：缺点：零偏导致漂移、低精度IMU积分位姿发散

优点：快速响应、可估计绝对尺度、角速度估计准确。

3）结合视觉+IMU：可用视觉弥补IMU的零偏，减少IMU由于零偏导致的发散和累计误差，IMU可为视觉提供快速响应的定位。

融合方案：

松耦合：将 IMU 定位与视觉的位姿直接后处理融合，融合过程对二者本身不产生影响，典型方案为卡尔曼滤波器

紧耦合：融合过程本身会影响视觉和 IMU 中的参数（如 IMU 的零偏和视觉的尺度）典型方案为 MSCKF 和非线性优化。

本文贡献：

1、一个紧耦合、基于优化的单目视觉惯性里程计，具有相机-IMU外部校准和IMU偏置估计。
2、基于有界滑动窗口迭代进行估计。
3、基于滑动窗口里的关键帧维持视觉结构，基于关键帧之间的IMU进行预积分维持惯性测量。
4、鲁棒性：未知状态的初始化、相机和IMU外参数的在线标定、球面不统一重投影误差、回环检测、四自由度位姿图优化（三位置和航向）

0、总体框架

包括五个部分：数据预处理、初始化、后端非线性优化、闭环检测、位姿图优化。

0.1 数据预处理（IMU预积分见标题1）

视觉：1）提取Harris角点，KLT金字塔光流跟踪相邻帧；2）2 维特征点先矫正为不失真的，然后在通过外点剔除后投影到一个单位球面上；3）去除异常点：先进行F矩阵测试，通过RANSAC去除异常点；4）关键帧选取：1、当前帧相对最近的关键帧的特征平均视差大于一个阈值就为关键帧（因为视差可以根据平移和旋转共同得到，而纯旋转则导致不能三角化成功，所以这一步需要IMU预积分进行补偿）2、当前帧跟踪到的特征点数量小于阈值视为关键帧；
IMU：1）两帧k和k+1之间进行位置、速度、姿态（PVQ）预测；2）避免每次姿态优化调整后重复IMU传播，采用预积分算法，计算预积分误差的雅克比矩阵和协方差项。

0.2 初始化

采用松耦合的传感器融合方法得到初始值。首先用SFM进行纯视觉估计滑动窗内所有帧的位姿以及路标点逆深度，然后与IMU预积分对齐，继而恢复对齐尺度s，重力g，imu速度v，和陀螺仪偏置bg。

VINS本文初始化过程中忽视掉了加速度计的bias，因为加速度计与重力耦合，并且重力向量很大，初始化过程动态过程很短，幅度又不大，加速度计偏置很难观测到。

A.滑动窗口(Sliding Window)纯视觉SfM

1、选择一个滑动窗，在最后一帧与滑动窗之前帧寻找帧：跟踪到的点数目大于30个的并且视差超过20的，找到后用5点法本质矩阵初始化恢复出R和t。否则，滑动窗内保留最新图像帧，继续等待下一帧。

2、随意设置一个尺度因子，三角化这两帧观测到的所有路标点。再用PnP算法估计滑动窗内所有其余帧的位姿。滑动窗内全局BA重投影误差优化所有帧位姿。

3、假设IMU-Camera外参已知，乘上视觉得到的位姿，转换到IMU坐标系下。

B. 视觉惯性校准（IMU预积分与视觉结构对齐）

1、陀螺仪零偏bg标定

旋转两种方式：陀螺仪测量值和视觉观测值，二者的误差其实就是陀螺仪偏置bg。

目标函数：visual给出的相邻帧间的旋转应等于IMU预积分的旋转值Q之间的差。

考虑到了陀螺仪bias噪声，

我们得到了陀螺仪偏置bias的初始校准,需要将陀螺仪偏置bg代入到IMU预积分重新计算预积分。

2、速度v、重力g和尺度初始化s

优化变量：速度、重力向量和尺度

目标函数：相邻两帧IMU预积分增量与预测值之间平移、速度（P、V）的差。通过HX=B 利用cholesky分解获得

结合得到：

通过求解线性最小二乘问题：

3、重力矢量修正

重力向量的大小是已知的，加入了模长限制，这导致三维重力向量只剩2个自由度。

主要做的是优化方向，一个二维向量。

在其切线空间上用两个变量重新参数化重力，采用球面坐标进行参数化：

其中，是已知的重力的大小，为重力方向的单位向量。b1和b2是跨越切平面的两个正交基。w1和w2是待优化变量，表示沿着两个正交基方向的位移。

替换后，Hx=b，变化为：之后采用最小二乘对变量重新优化。

其中，待优化变量变为：

0.3 紧耦合后端非线性优化（IMU约束+视觉约束+闭环约束）

初始化后，采用基于滑动窗口的紧耦合单目VIO进行状态估计。

A 公式

需要优化的量：IMU状态（PVQ、加速度bias、陀螺仪bias）、IMU到Camera的外参、m+1个路标点逆深度。

第一个式子是滑动窗口内所有状态量，n是帧数，m是滑动窗口内特征点总数。特征点逆深度为了满足高斯系统。

第二个式子xk是在第k帧图像捕获到的IMU状态，包括位置，速度，旋转（PVQ）和加速度偏置，陀螺仪偏置。

第三个式子是相机外参。

xk只与IMU项和Marg有关；特征点深度也只与camera和Marg有关；

视觉惯性BA，最小化边缘化的先验信息和IMU、视觉测量残差之和。

BA优化模型分为三部分：

1、Marg边缘化残差部分（滑动窗口中去掉位姿和特征点约束）

2、IMU残差部分（滑动窗口中相邻帧间的IMU产生）

3、视觉代价误差函数部分（滑动窗口中特征点在相机下视觉重投影残差）

B IMU残差

残差：状态量传播预测与IMU预积分的残差

优化变量：IMU时刻下的p位置，v速度，Q旋转，两个偏置ba,bw

C 视觉残差

与传统的针孔相机模型不同，这里用的是单位半球体的相机观测残差。是一个鱼眼相机。

在相机的归一化平面上比较残差，再将视觉残差投影到单位球面的正切平面上。由于视觉残差的自由度是2，所以我们将残差向量投影到切平面上。

在第i帧第一次观测到第l个路标点，在第j帧中对该路标点进行观测的残差为：

第一个式子就是残差的表达式，第二个式子是鱼眼相机反投影函数将观测到的像素坐标转换成单位向量的观测值数据，b1和b2是此单位向量的切平面上的一组基。第三个式子是重投影估计模型。其实VINS代码中也可以使用普通的针孔相机模型。

D 边缘化 Marginalization（详见标题2）

为了防止pose和特征的个数的复杂度随着时间不断增长，引入边缘化，在移除位姿时将关联的约束转化为先验放入优化问题中。

为了限制基于优化的VIO计算复杂度，引入边缘化。有选择地从滑动窗口中将IMU状态xK和特征λ1边缘化，同时将对应于边缘状态的测量值转换为先验。

分为两种情况，

1、一种是倒数第二帧如果是关键帧的话，将最旧的pose移出Sliding Window，将最旧帧关联的视觉和惯性数据边缘化掉。把第一个老关键帧及其测量值被边缘化；Margin_Old作为先验值。

2、如果倒数第二帧不是关键帧的话，那么就只剔除倒数第二帧的视觉观测，而不剔除它的IMU约束。原因是边缘化保证关键帧之间有足够视差而能够三角化足够多的地图点。并且保证了IMU预积分的连贯性。

为了保持系统的稀疏性，我们不会边缘化非关键帧的所有测量值。

E 相机速率下的状态估计--只有运动的VIO

采用了一种轻量级的纯运动视觉惯性BA，以提升状态估计速率到相机速率(30Hz)。

代价函数不变。

1、只对固定数量的最新IMU状态的姿态pose和速度v进行了优化，而不是对滑动窗口中的所有状态进行优化

2、将特征深度、外部参数、偏置和旧的IMU状态这些不希望优化的状态作为常量来处理。

与在最先进的嵌入式计算机上可能导致超过50ms的完全紧耦合单目VIO不同，这种纯运动的视觉惯性BA只需大约5ms来计算。

0.4 重定位

尽管滑动窗和边缘化减小了计算复杂度，但是仍旧引进了系统的累计漂移误差。具体来说，就是全局三维位置（xyz）和围绕重力方向的旋转（yaw）。作者采用紧耦合重定位模块与单目VIO进行组合实现漂移误差的消除。

目的：局部滑动窗口移动并与过去的位姿对齐。

vins的重定位模块主要包含回环检测,回环候选帧之间的特征匹配,紧耦合重定位三个部分

上图展示了重定位步骤。

1中VIO启动时刻只进行位姿估计（蓝色部分），过去状态一直被记录（绿色部分）。

2中如果最新帧中回环被检测到，呈现红色虚线连接，表示启动重定位3。

4中多个特征的多个观测直接用于重定位，从而提高了定位的精度和状态估计的平滑性。

5-7是位姿优化。

A、回环检测（只对关键帧）

1、采用DBoW2词袋位置识别方法进行回环检测。经过时间空间一致性检验后，DBoW2返回回环检测候选帧。

2、除了用于单目VIO的角点特征外，还添加了500个角点并使用BRIEF描述子，描述子用作视觉词袋在数据库里进行搜索。这些额外的角点能用来实现更好的回环检测。

3、VINS只保留所有用于特征检索的BRIEF描述子，丢弃原始图像以减小内存。

4、单目VIO可以观测到滚动和俯仰角，VINS并不需要依赖旋转不变性。

B、回环候选帧之间的特征匹配

1、检测到回环时，通过BRIEF描述子匹配找到对应关系。但是直接的描述子匹配会导致很多外点。

2、本文提出两步几何剔除法：

1）2D-2D：使用RANSAC进行F矩阵测试，

2）3D-2D：使用RANSAC进行PnP，基于已知的滑动窗特征点的3D位置，和回路闭合候选处图像的2D观测（像素坐标）。

当内点超过一定阈值时，我们将该候选帧视为正确的循环检测并执行重定位。

C、紧耦合重定位

1、重定位过程使单目VIO维持的当前滑动窗口与过去的位姿图对齐。

2、将所有回环帧的位姿作为常量，利用所有IMU测量值、局部视觉测量和从回环中提取特征对应值，共同优化滑动窗口。

和之前VIO优化模型不同的是，增加了回环项，从位姿图获得回环帧的姿态被视为常数。

在重定位之后（重定位只是基于检测到的回环处暂时对滑动窗里的位姿进行重新优化）

下一步要对过去位姿和闭合回路图像帧的全局优化。

0.5 全局位姿图优化

这一步是为了确保基于重定位结果对过去的位姿进行全局优化。

由于视觉-惯性使得横滚角和俯仰角完全可以观测，因此只有（XYZ和yaw航向）4个自由度存在累积漂移。接下来只进行4-DOF的位姿图优化。

A、位姿图中添加关键帧

当一个关键帧被滑动窗口中边缘化掉后，它会被添加到位姿图中。该关键帧会作为位姿图中一个定点，通过下面两类边与其他顶点相连接：

1、顺序边（Sequential Edge）：关键帧将建立与之前关键帧的几个顺序边，一个顺序边表示局部滑动窗口中两个关键帧之间的相对转换，它的值直接从VIO中获取。令最新边缘化掉的关键帧为i，它的一个以前的关键帧为j，顺序边只包含相对位置和相对航向

2、回路闭合边（Loop Closure Edge）：如果最新的边缘化掉的关键帧存在回路连接，它可以通过位姿图中的回路比河边和回路闭合帧相连接。回环边的值由重定位结果得出。

B、4自由度位姿图优化

关键帧i和j之间的残差最小化表示为；

通过最小化以下代价函数，对顺序边和回环边的整个图进行优化：

S是所有顺序边的集合，L是回环边的集合。尽管紧耦合的重定位已经有助于消除错误的回环，但我们添加了另一个Huber范数 ρ(·)，以进一步减少任何可能的错误回环的影响。相反，我们不对顺序边使用任何鲁棒范数，因为这些边是从VIO中提取出来的，VIO已经包含了足够多的外点排除机制。

位姿图优化和重定位(VII-C)异步运行在两个独立的线程中。以便在需要重定位时，能立即使用最优化的位姿图。同样，即使当前的位姿图优化尚未完成，仍然可以使用现有的位姿图配置进行重新定位。这一过程如图9(b)所示。

C、位姿图管理

随着行程距离的增加，位姿图的大小可能会无限增长，从而限制了长时间系统的实时性。为此，我们实行了一个下采样过程：将位姿图数据库保持在有限的大小。所有具有回环约束的关键帧都将被保留，而其他与相邻帧过近或方向非常相似的关键帧可能会被删除。关键帧被移除的概率和其相邻帧的空间密度成正比。

1、IMU预积分

1.1、IMU模型

测量值：加速度计a^、陀螺仪w^, 加上了bias游走和随机白噪声。

真实值：加速度计a、陀螺仪w。

实际情况下，可以获得测量值a^和w^，需要反推真实值。一般忽略随机游走高斯噪声n

w=w^-bg; a=qwb(a^-ba)-gw;

1.2、连续时间IMU运动模型，积分 PVQ（两帧之间）

将第k帧和第k+1帧所有的IMU进行积分，可得到第k+1帧的 PVQ，作为视觉估计的初始值。

a和w是IMU测量的加速度和角速度，相对于Body坐标系。

1.3、运动模型的离散积分（前后IMU）

从第 i个IMU时刻到第 i+1个IMU时刻的积分过程。两个相邻时刻k到k+1的位姿是由第k时刻测量值a^,w^计算得出的。

这与Estimator::processIMU（）函数中Ps[j]、Rs[j]、Vs[j]是一致的，代码中j就是此处的i+1

IMU积分出来第 j 时刻数值作为第 j 帧图像初始值。

欧拉法

中值法

1.4、 IMU预积分

每次qwbt优化更新后，都要重新进行积分，运算量较大。

将积分模型转为预积分模型：

PVQ积分公式中的积分项变为相对于第i时刻的姿态，而不是相对于世界坐标系的姿态

1.5、预积分量

预积分量只与IMU测量值有关。

1.6、预积分误差

一段时间内IMU构建的预积分量作为测量值，与估计值进行相减。

1.7、预积分离散形式（IMU增量）

中值法：k到k+1时刻位姿由两时刻的测量值a w的平均值来计算。

1.8、bias 预积分量（bias发生变化）

因为 i 时刻的 bias 相关的预积分计算是通过迭代一步一步累计递推的，可以算但是太复杂。所以对于预积分量直接在 i 时刻的 bias 附近用一阶泰勒展开来近似，而不用真的去迭代计算。

https://zhuanlan.zhihu.com/p/60299750

https://blog.csdn.net/u014527548/article/details/86599047

2、基于舒尔补的边缘化

基于高斯牛顿的非线性优化理论可知，H*delta_x=b可以写成：

其中，delta_xa和delta_xb分别是希望marg掉的部分和保留部分。

VINS中需要边缘化滑动窗口中的最老帧，目的是希望不再计算这一帧的位姿或者与其相关的路标点，但是希望保留该帧对窗口内其余帧的约束关系。我们基于与移除状态相关的所有边缘化测量值构造一个先验。新的先验项被添加到现有的先验项中。

2.1、舒尔补

2.2 marg后形成的先验

xa为需要marg的变量，假设为相机pose,我们更关心如何求解希望保留的xb，而不再求解xa（即marg的变量改为0，左乘时左上是0），这里是要变化为上三角。

即：new_H*delta_xb=new_b;

形成新的信息矩阵new_H具体流程：

注意：去掉了x1,但是之前和x1相连的所有量x2 x3 x4 x5 在marg掉x1后变得两两相连。

2.3 具体例子

2.3.1 原来的信息矩阵H的构成

上述最小二乘问题，对用的高斯牛顿求解为：

矩阵乘法公式写成连加：

雅克比J和信息矩阵H的稀疏性：由于每个残差只和某几个状态量有关，因此，雅克比矩阵求导时，无关项的雅克比为 0。

将五个残差的信息矩阵加起来，得到样例最终的信息矩阵 Λ, 可视化如下

2.3.2 舒尔补后形成新的信息矩阵new_H,并构造为先验

2.3.3 新测量信息和先验构成新的系统

参考文献：

VINS技术路线与代码详解 by 五行缺帅wangshuailpp

VINS-Mono论文学习与代码解读——目录与参考 by Manii

VIO-Doc——崔华坤

VINS-mono详细解读 by 极品巧克力

你可能感兴趣的:(视觉,激光SLAM)

AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
国庆节的一天安心雨
昨晚朋友间就转发国庆阅兵时间安排细节。今早，六点起床，到公园散步，一路上国旗招展，浓浓喜庆味。图片发自App准时坐到电脑前，拉上窗帘，关了房门，一个人静静感受，视觉和心灵的震撼。怕大脑内存不足，想要永远留存住那些属于这个时代，属于这个国家的骄傲。于是，拿出手机，对着屏幕拍了一张一张又一张。下午，朋友圈各种关于国庆的想法、评论、图片刷屏，翻了一遍一遍又一遍，每一遍都是骄傲和自豪。为生在这个伟大的时代
导致格式错误的 Lambda 代理响应的原因以及如何修复它 zqhdz米时空汇编
当人们尝试使用AWSAPIGateway和AWSLambda构建无服务器应用程序时，经常出现的一个问题是_由于配置错误而执行失败：Lambda代理响应格式错误。_没有什么比通用错误消息更糟糕的了，它们不会告诉您解决问题所需的任何内容，对吧？AWS并不是以其错误消息设计而闻名，如果甚至可以这样称呼它的话，更不用说为您提供解决问题的方法了。那么如何修复这个Lambda错误以及是什么原因造成的呢？花椒壳
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
你会读书吗阿杰说澄长
一上学那会，朋友W报名了一个快速阅读培训课。出于好奇，我拿着他的培训资料进行了一个月的自我训练，并一度深陷其中。材料主要是无规则的符号以及横跨A4纸的连线，通过视线快速移动，扩大视幅来提升信息的接受速度，又通过图案和符号锻炼大脑的视觉记忆，摆脱音读习惯。那一个月，我沉溺其中，每天用很多的时间练习。一个月后，我确实做到了快速阅读，以句群接受信息，一目一行。只是速度虽快，却读过无痕，该知道的全忘记了。
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
Python和MATLAB及C++信噪比导图(算法模型) 亚图跨际算法交叉知识 Python 视频图像修复模数转换信号链噪音频谱计算量化周期性视觉刺激高斯噪声的矩形脉冲心率失常检测算法
要点视频图像修复模数转换中混合信号链噪音测量频谱计算和量化周期性视觉刺激脑电图高斯噪声的矩形脉冲总谐波失真周期图功率谱密度各种心率失常检测算法胶体悬浮液跟踪检测计算交通监控摄像头图像噪音计算Python信噪比信噪比是科学和工程中使用的一种测量方法，用于比较所需信号水平与背景噪声水平。信噪比定义为信号功率与噪声功率之比，通常以分贝表示。高于1:1（大于0dB）的比率表示信号大于噪声。信噪比是影响处理
Python(PyTorch)和MATLAB及Rust和C++结构相似度指数测量导图亚图跨际 Python 交叉知识算法量化检查图像压缩质量低分辨率多光谱峰值信噪比端到端优化图像压缩手术机器人三维实景实时可微分渲染重建三维可视化
要点量化检查图像压缩质量低分辨率多光谱和高分辨率图像实现超分辨率分析图像质量图像索引/多尺度结构相似度指数和光谱角映射器及视觉信息保真度多种指标峰值信噪比和结构相似度指数测量结构相似性图像分类PNG和JPEG图像相似性近似算法图像压缩，视频压缩、端到端优化图像压缩、神经图像压缩、GPU变速图像压缩手术机器人深度估计算法重建三维可视化推理图像超分辨率算法模型三维实景实时可微分渲染算法MATLAB结构
题解 | #完全数计算#不知道为什么没超时的暴力解法 huaxinjiayou java
兄弟们，坚持就是胜利啊，找工作从去年秋招就开始找，到五月底才收到第一个offer星环的，然后六月初t咋六月了还有面试啊，有兄弟了解这个部门吗面完了家人们，纯纯kpi啊，上来就是一道题是打印多个字符串的华为接头人话术指南：欲投华为，必看此贴!引流华为招聘提前批【奖】这个夏天，和牛牛一起打卡刷题~Java面试实战项目25届本科找暑期实习的历程飞猪旅行运营岗面经百度视觉算法一面面经感谢牛友们，腾子pcg
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
微信小程序常用开发框架有哪些？ +码农快讯+ 分享微信小程序小程序开发
想要开发出一套高质量的小程序，运用框架，组件库是省时省力省心必不可少一部分，随着小程序日渐火爆，各种不同类型的小程序也渐渐更新，其中不乏一些优秀好用的框架/组件库。1：WeUI小程序–使用教程https://weui.io/官方介绍：WeUI是一套同微信原生视觉体验一致的基础样式库，由微信官方设计团队为微信内网页和微信小程序量身设计，令用户的使用感知更加统一。小程序开发中最常用到的一款框架，受广大
js的书写位置和css的书写位置的区别？为什么要这样写？李是啥也不会 javascript css 开发语言
JavaScript和CSS的书写位置有以下区别：CSS通常写在标签中，或者在外部样式表文件中（）。CSS主要用于控制页面的视觉样式和布局，通常在HTML文件的部分引入，以确保在页面渲染时样式已经加载完毕，从而避免样式闪烁。JavaScript通常写在标签中，或者在外部脚本文件中（）。JavaScript用于添加页面的动态行为和交互。一般建议将JavaScript放在HTML文件的末尾（标签之前）
Open3D 实现CSF布料模拟算法今夕是何年，单目+双目 Open3d 计算机视觉
目录一、算法原理二，详细过程三，环境安装四，代码实现五，结果展示6，在cloudcompare中的实现一、算法原理1、流程概述1）利用点云·滤波算法或者点云处理软件滤除异常点;2）将激光雷达点云倒置;3）设置模拟布料，设置布料网格分辨率GR，确定模拟粒子数。布料的位置设置在点云最高点以上;4）将布料模拟点和雷达点投影到水平面，为每个布料模拟点找到最相邻的激光点的高度值，将高度值设置为IHV;5)布
云南印象一玉龙雪山把日子过成诗吧
一顿饱眠后，兴冲冲前往玉龙雪山，为了预防高反，提前数日已服红景天，又买了氧气瓶，心理上安心多了。第一站，观看印象丽江，满满的男子汉气息扑面而来，谁说现在的男人越来越娘，这里的男子个个演的豪情万丈，满足了女性视觉感受。节目是否精彩，因人而异，看懂了等于了解了少数民族的风土人情，看不懂就是一帮群众演员在闹腾。这种表演风格，场面壮观，红色情怀，老谋子的最爱，不深评。图片发自App表演毕，前往玉龙雪山，人
掌握这些思维、习惯，让你在职业生涯中受益匪浅伽马有话说
有哪些对职业生涯有益的思维和习惯呢？这里有四个建议：一、收集各行各业人类失败与灾难的反面案例我们总是高估自己，小瞧别人。有一个有趣的例子。据统计，瑞典有百分之九十的司机都认为他们的驾驶技术在平均水平之上。让我们看看抖音上那些失败的案例吧。有多少视频都是骑着单车到货车的视觉盲区被碾伤碾死；有多少视频都是醉酒开车撞伤路人、撞坏栅栏；有多少视频都是相互赌气，相互别车，最后大打出手。人类失败与灾难案例从来
Unreal Engine——AI生成高精度的虚拟人物和环境（虚拟世界构建、电影场景生成）（二）（技术分析）爱研究的小牛 AIGC—虚拟现实人工智能虚幻游戏引擎 AIGC
UnrealEngine（虚幻引擎）是业界领先的3D实时渲染引擎，广泛应用于游戏开发、影视制作、建筑可视化和虚拟现实等领域。其核心技术实现涵盖了多项复杂的功能模块，包括图形渲染、物理引擎、动画系统、音效系统和网络系统等。1.图形渲染技术UnrealEngine的图形渲染系统非常强大，支持实时渲染复杂的3D场景，生成高品质的视觉效果。虚幻引擎使用先进的渲染管线，主要分为以下几个方面：1.1渲染管线虚
录像与录像装置的区别 wjq77
录像装置是20世纪晚期艺术的一个多元界面。它糅合了艺术与科技、私人空间与公共场所、主观视觉与机器的非透明表面、高雅文化与大众文化、博物馆艺术品的严肃性与卫星电视的数字狂欢，这是一个身体消失的时刻与身体再度被发现的时刻。录像装置不能以信件形式发送或拍成视频。它不能成为原始录像的拷贝或是拷贝的拷贝。没有人能将其买来放在客厅的角落，艺术家也不能靠自己口袋里的小钱来创作它。录像装置拥有它自己的历史，受制于
视频也能分割？！在云服务器上部署最新视觉大模型SAM2教程、详细代码注释和视频演示 Hanley_Yeung 图像处理人工智能 python 人工智能 python 深度学习 SAM2 计算机视觉图像分割
使用SAM2进行视频分割本笔记本展示了如何使用SAM2在视频中进行交互式分割。它将涵盖以下内容：在帧上添加点击以获取和细化masklets（时空掩码）在整个视频中传播点击以获取_masklets同时分割和跟踪多个目标我们使用术语_segment_或_mask_来指代单个帧上对象的模型预测，_masklet_指代整个视频中的时空掩码。如果使用Jupyter在本地运行，请首先根据安装说明在您的环境中安
ROS yaml参数文件的使用 Sun Shiteng ROS
举个例子，若在params.yaml文件中定义如下参数LidarImageFusion:points_src:"/hilbert_h/deskew/cloud_info"image_src:"/usb_cam0/image_raw"camera_info_src:"/home/hdj/fusion_slam/Color_SLAM_ws/src/hilbert_h/config/firefly_8s
万里素食行是一场巅峰体验吉林长春张耀辉
2020年5月24日，全家周日观影日，是N师学院的一次特别精神大餐，感谢互加计划吴虹校长的推荐和邀约，徐立导演的素食题材电影《巅峰体验》，这是一部超过瘾的影片，全程视觉享受，影片中体验人生巅峰为了寻找人生的终极意义，为了挖掘自己未知的潜能，记录了一群人63天的素食雷达骑行者从繁华似锦的大上海万里到达宁静致远的拉萨圣地，预计骑行1万里的故事。这是一部真人真事的纪录片，没有任何情节设计，也没有预设台词
基于XTDrone的ZD550+Mid360实现夜雨拾年无人机
前言本文是对ZD550搭载Mid360激光雷达Gazebo仿真平台搭建记录的实现文件导入先下载提供的文件链接:https://pan.baidu.com/s/1reqGCcQOj1T_tGBY3EZWpw?pwd=328c提取码:328c将文件夹ZD550_Mid360中的5个文件夹都添加到PX4_Firmware/Tools/sitl_gazebo/models目录下，其中models目录下可能
XTDrone+ZD550+Livox_Mid360+IMU仿真实现夜雨拾年无人机
简介本文是前两篇博客Livox_Mid360+IMU仿真搭建、基于XTDrone的ZD550+Mid360实现的结合，将ZD550与Livox_Mid360+IMU结合，从原有的xacro文件转为sdf文件，更适合gazebo仿真的实现。最终效果DIY若想实现对激光雷达参数的修改，可参考以下部分标签内部的元素详细定义了Gazebo中使用的雷达传感器的扫描特性和性能。这些设置影响雷达模拟的准确性和效
Python计算机视觉编程第三章图像到图像的映射一只小小程序猿计算机视觉 python opencv
目录单应性变换直接线性变换算法仿射变换图像扭曲图像中的图像分段仿射扭曲创建全景图RANSAC拼接图像单应性变换单应性变换是将一个平面内的点映射到另一个平面内的二维投影变换。在这里，平面是指图像或者三维中的平面表面。单应性变换具有很强的实用性，比如图像配准、图像纠正和纹理扭曲，以及创建全景图像。单应性变换本质上是一种二维到二维的映射，可以将一个平面内的点映射到另一个平面上的对应点。代码如下：impo
DIODE：超高分辨率室内室外数据集（猫脸码客第186期）猫脸码客: catCode2024 开源数据集猫脸码客开源数据集超高分辨率室内室外数据集
亲爱的读者们，您是否在寻找某个特定的数据集，用于研究或项目实践？欢迎您在评论区留言，或者通过公众号私信告诉我，您想要的数据集的类型主题。小编会竭尽全力为您寻找，并在找到后第一时间与您分享。在计算机视觉和深度学习领域，深度信息作为三维空间感知的重要组成部分，对于实现高级视觉任务如场景理解、机器人导航、增强现实等具有至关重要的作用。然而，获取准确且密集的深度数据一直是一个挑战，尤其是在同时涵盖室内和室
《秒速五厘米》：经历过异地恋的人才懂的心酸，因为爱，所以坚持好姑娘黄黄啊
《秒速五厘米》应该是新海诚在国内出名的第一部作品了，《秒速五厘米》虽然故事情节简单，却获得好评一片，除了给人在视觉上的享受以外，更多的是给心灵带来的动容。简单一点来说，《秒速五厘米》主要讲诉了两个青梅竹马、相互喜欢的小孩明里和贵树的故事，因为父母工作的原因导致分隔两地，两个人在不同的城市读完了高中、大学，随着时间的推移走到了人生的分叉路口，最后相忘于江湖的故事。有人说，宁愿在电影院多看十次《你的名
微软 Azure AI 服务免费试用及申请：语音识别、文本转语音、基于视觉、语言处理、文档分析等10大场景全云在线allcloudonline microsoft azure 人工智能
为方便企业认识和快速上手AzureAI服务，我们总结了一套包括语音识别、文本转语音、基于视觉、语言处理场景、文档分析场景等全面的预构建模型和演示，旨在解决各种用例。这些模型易于访问，可帮助企业无缝实施AI驱动的解决方案，如下是已整理并编录的AzureAI服务中提供的预构建演示，希望这可以帮助您将AI无缝融入您的产品和服务中。微软AzureAI服务可以合规、稳定地提供企业用户使用ChatGPT的可能
可对画面进行平台传输，实时查看监控的智慧交通开源了。 ai产品老杨人工智能音视频安全开源 vue.js
智慧交通视觉监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。用户只需在界面上进行简单的操作，就可以实现全视频的接入及布控。项目搭建地址项目开源地址：yihecode-server本项目基于ai场景而开发，提供算法模型管理、摄像头管理、告警管理、数
经纬恒润亮相第四届焉知汽车年会，功能安全赋能域控经纬恒润研发工具功能安全
8月初，第四届焉知汽车年会在上海举行。此次年会围绕当下智能电动汽车的热点和焦点，聚焦于智能汽车场景应用、车载通信、激光雷达、智能座舱、功能安全、电驱动系统等多个领域，汇聚了来自OEM、科技公司、零部件供应商、测试认证机构、政府院校以及金融资本等领域的千余名嘉宾，共同探讨汽车产业的未来趋势与发展路径。经纬恒润汽车电子产品事业部总监邵亮受邀参加并发表题为《域控制器功能安全设计及应用实践》主题演讲，从功
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持