KylinQAQ

[论文笔记]ORB-SLAM: a Versatile and Accurate Monocular SLAM System

ORB-SLAM

一、introduction

PTAM

缺少闭环检测
缺少对于闭塞（occlusion）的处理
重定位时对视角的不变性低
自启动(bootstrapping)时需要人工干涉

ORB SLAM

以PTAM为基础

contributions：

使用ORB features在tracking、mapping、relocalization、loop closing任务中，保证在视点和光照变化时的不变性。
使用covisibility graph，使得能在大规模环境中实时运行。
基于essential graph的实时闭环检测。
实时相机重定位
提出基于模型选择的自动地图初始化方法，能够在平面和非平面环境下创建初始地图。
使用~~宽进严出~~，”宽进严留“ (generous in the spawning but very restrictive in the culling)的survival of the fittest方法，选取关键帧和地图点。

二、system overview

总结一下就是，tracking、local mapping、loop closing三个线程并行，这三个部分都使用ORB特征。mapping部分的关键帧和地图点存储宽进快出，数据结构比较常规。loop closing部分使用DBoW2进行匹配以检测闭环。构造了两图一树，表示关键帧之间的临近关系，这个两图一树暂时不知道是用在哪儿的。

1. feature choice

特征的选择要求：

每张图片的提取时间小于33ms
具有旋转不变性

选取ORB特征。并在tracking、mapping、place recognition(用于重定位和闭环检测)中都使用ORB特征。

2. 线程

分为三个并行线程：tracking、local mapping、loop closing

2.1. tracking

功能：每一帧相机位姿的估计以及关键帧的检测。

步骤：

当前帧特征抽取，与上一帧特征匹配，得到当前位姿的初始估计。
若匹配失败（由于遮挡或两帧差距过大），则使用place recognition模块进行全局的重定位，得到初始位姿。
使用motion-only BA进行位姿估计的优化。
从局部地图模块得到当前视角的局部地图（由全局关键字的convisibility graph维护），根据重投影，搜索当前帧特征点和局部地图点的匹配。
根据得到的匹配结果，再次优化位姿估计。
决定当前帧是否作为关键帧插入。

2.2. local mapping

功能：处理新进入的关键帧，执行局部BA，以达到当前相机位姿附近的最优的局部重建。维护地图，加入新的点，去除低质量的点和关键帧。

步骤：

插入新的关键帧
使用exigent point culling policy去除低质量的点。
若当前帧的特征点和局部地图中的点不匹配，则covisibility graph的连接关键帧中搜索对应关系，三角化出新的点，插入。
执行局部BA。
去除低质量的局部关键帧。

2.3. loop closing

功能：在每个新关键帧执行闭环检测，若检测到闭环，则做调整。

步骤：

对新进入的关键帧执行闭环检测。
若检测到闭环，计算相似性转换，得到累积误差。
将闭环的两侧对齐，融合重复点。
在essential graph上，根据相似性限制，执行位姿图优化，以达到全局一致性。

3. 地图点、关键帧的描述及选取

3.1. 地图点 $p_i$

包含：

世界坐标系中的三维坐标 $X_{w,i}$
观测方向 $n_i$ 。是所有观测到这个点的关键帧的中心视角的平均单位向量。(是只有一个吗？？)
ORB描述子 $D_i$ 。是所有观测到它的关键帧的描述子中，汉明距离最小的一个。
$d_{max},d_{min}$ 。（不知道是啥的距离？？）

3.2. 关键帧 $K_i$

包含：

相机位姿 $T_{iw}$ ，从世界坐标系到相机坐标系。
相机内参，包含焦距和焦点。
此帧的所有ORB特征，无论是否与地图点关联。未扰动的。

3.3. 选取方式

宽容选取，紧急去除。去除冗余关键帧、误匹配地图点、漏匹配地图点。能够提高地图探索时的鲁棒性，外点少。

4. covisibility graph and essential graph

~~essential graph的权重阈值是多少？比spaaning tree小？~~
好像这不是三个图，而是两个图。
spanning tree指的就是essential graph，essential graph是covisibility graph的最小生成树（MST）。

4.1. covisibility graph

无向有权图。表示关键帧之间的相邻关系。

点：关键帧
边：若两个关键帧之间共同观测到的地图点大于15，则连一条边
权重：两个关键帧之间共同观测到的地图点数量

4.2. essential graph

保留covisibility graph中的全节点，保留很少量的边。

4.3. spanning tree

从最初关键帧开始持续维护的树，是covisibility graph的子图。

当新关键帧插入：此节点连接到与他有最多共同观测的节点上

当关键帧删除：更新受影响的其他节点的连接关系

essential graph包含spanning tree，这个树的权重阈值很高(100)。

5. bags of words place recognition

基于DBoW2的词袋模型，实现回环检测和重定位。词典由数据集抽取的ORB描述子离线制作。

维护一个数据集：包含单词到包含它的关键帧的索引。对于overlap的情况，将这些重叠的关键帧建成covisibility graph。（这儿不太懂，这个图是干嘛的，之前的方法是怎么做的）

trick：在对比两组ORB特征的相似性时，强制只匹配单词树特定等级的属于相同节点的特征，以加速。（？？？这节点是啥，单词树的等级是啥？是K叉树吗）

三、地图自动初始化

目标：计算相邻两帧之间的位姿，用于三角化匹配点，得到其深度，以初始化地图点。

方法：同时并行两个几何模型。

对于平面：使用单应矩阵
对于非平面：使用基础矩阵

使用启发式方法选择一个模型，并使用该模型的特定方法恢复其位姿。

算法流程：

总结一下是，先提取特征点并匹配，然后同时计算单应和基础两个模型，根据得分选则其中的一个，计算出来矩阵后，根据矩阵算出相机位姿，再三角化算出匹配点深度。最后用BA优化位姿和深度。

1. 匹配特征点

对当前帧 $F_c$ 抽取ORB特征，与参考帧 $F_r$ 进行匹配。若匹配到的数量不足，则重置参考帧(这个重置是什么意思？)

2. 并行计算两个模型

并行的计算单应矩阵 $H_{cr}$ 和基础矩阵 $F_{cr}$ 。

$X_c^{T} F_{cr}X_r=0$

$X_C=H_{cr}X_r$

在RANSAC迭代中，使用DLT和8点法分别计算单应矩阵和基础矩阵，二者的迭代次数固定且相同，每次迭代用的点分别是4和8。每次迭代，使用对称转换误差（symmetric transfer errors）计算模型分数 $S_M$ ，并维护最高得分。

3. 模型选择

选取标准：

$R_H=\frac {S_H}{S_H+S_F}$

平面、低视差，选择单应模型， $R_H>0.45$ 。

非平面、高视差，选择基础矩阵模型， $R_H<=0.45$ 。

4. 相机运动与结构恢复

选择相应模型并计算，可以得到矩阵。根据这个矩阵求出相机运动(R,t)，三角化得到点的深度。

对于单应矩阵模型：使用参考文献[23]的方法得到8种可能的假设，对其分别三角化，选取低视差、景深为正（点在相机前面）、低重投影误差的假设。

对于基础矩阵模型：使用内参矩阵 $K$ 将其转为本质矩阵。

$E_{rc}=K^{T}F_{rc}K$

使用奇异值分解得到4种可能的假设，对其分别三角化，选取景深为正的假设。

5. BA

使用BA优化初始位姿和深度。

四、tracking

此部分的整个系统始终运行的平行三线程之一，其作用是：对每一帧，估计其相机位姿，选择新的关键帧。

（这部分和初始化的关系是啥？初始化只用了前面一部分的帧，初始化了一部分的地图点吗？初始化部分是用单目2D-2D的方式，然后再通过tracking，使用3D-2D的方式，估计随后的每一帧位姿？）

（这里的提取ORB特征，和初始化部分的应该是不一样的，这里在八个尺度上进行，初始化部分只在一个尺度上，这里得到的ORB描述子，应该也没用于初始化？但是初始化用的是啥呢，初始化的“当前帧”和这里的“新帧”不是一个吗？）

基于前一帧的位姿初始化，是建立当前帧与上一帧之间的联系；基于全局重定位的位姿初始化，是建立当前帧与某一关键帧的联系；基于局部地图的位姿估计，是建立当前帧与局部关键帧地图的联系，也就是通过搜索更多的3D-2D的匹配点来对更精确的估计当前帧的位姿。

1. 提取ORB特征

先对图像提取固定量的FAST角点，尽量保证角点分布均匀。然后计算焦点的朝向和ORB描述子。

最终得到ORB描述子，用于所有模块的特征匹配。

2. 根据前一帧初始化相机位姿

如果前一帧的估计成功，则使用匀速运动模型（constant velocity motion model）估计当前帧的位姿，并使用guided search在当前帧中搜索上一帧的地图点。这个模型是认为相机处于匀速运动，根据匀速运动来估计当前帧位姿的初始值。

之后根据搜索到的点匹配关系（3D-2D），优化当前帧的相机位姿。若没有搜索到足够的匹配点，则在地图点的周围搜索，看有没有匹配。

3. 根据全局重定位初始化相机位姿

若前一帧丢失，则把当前帧转化为词袋向量，查询关键帧数据库实现全局重定位。

对于数据库中的每一个关键帧，使用RANSAC和PnP算法，估计相机初始位姿，若由足够多的内点，就优化这个位姿（咋优化的？？？），并根据这个关键帧，使用guided search，找到匹配的3D-2D点，再次优化相机位姿。若内点足够多，当前帧则被tracking到。

4. 基于局部地图的追踪

得到初始化的相机位姿和3D-2D匹配点集后，根据局部地图丰富匹配点集，对相机位姿再次优化。

局部地图的选取：与当前帧具有相同观测地图点的关键帧、以及这些关键帧在covisibility graph上的邻居关键帧。其中，与当前帧有最多共同观测地图点的关键帧，就是参考帧。

对这些关键帧观测到的每一个地图点：

计算地图点到当前帧上的投影，若超出边界，不要。
计算当前帧视角 $v$ 与地图点的平均视角方向 $n$ （是地图点数据结构中的一个成员）的夹角，若 $v·n<cos60^{°}$ ，不要。
计算地图点到当前帧相机中心的距离 $d$ ，若不在地图点的区间 $d_{min},d_{max}]$ 内（也是地图点数据结构的一个成员），不要。
计算尺度， $d/d_{min}$
笔记地图点的描述子 $D$ (还是它数据结构的一个成员)，和当前帧未匹配的ORB特征描述子，选择尺度因子和距离最近的作为最优匹配对(什么意思？？？)，把这组匹配加入当前帧的3D-2D匹配集。

遍历完成后，用丰富的3D-2D匹配集再次优化当前帧的位姿。

5. 选取新关键帧

用于决策当前帧是否作为关键帧加入，其条件是：

与上次全局重定位间隔20帧以上。目的是确保良好的重定位。
局部地图线程空闲，或与上一次关键帧插入间隔20帧以上。目的是不打扰局部地图线程，不太频繁的更新地图。
当前帧追踪了至少50个地图点。目的是确保良好的追踪，当前帧的质量要好。
当前帧追踪的地图点在其参考帧的90%以下。目的是确保最小的视角变化。（这不太懂，这样岂不是每一个关键帧的点都越来越少?）

五、local mapping

这部分的平行三线程之一，它的任务是：处理每一个新关键帧，在其插入的时候，管理地图点和关键帧的集合，进行局部BA优化。

1. 关键帧插入

关键帧插入的时候，要更新以下内容：

covisibility graph。新关键帧作为新节点插入，并与所有与其有共同观测的节点连边。
spanning tree。连接到与与其有最多共同观测的节点上。
词袋向量。计算其词袋向量。

2. 地图点剔除

地图点剔除策略是：在其创建后的前三个关键帧之内，对其稳定性测试。过了这段视时间后，进入稳定状态，不容易被剔除。

创建后前三帧内的稳定性条件：

追踪系统预测，在至少25%的帧中，这个点都能被观测到。（这个帧比关键帧要密集的多！）
该地图点创建后，至少有连续三个关键帧观测到它。

稳定状态后的剔除条件：

任意时间，观测到它的关键帧少于3。
关键帧被剔除。
局部BA把它当作外点而丢弃。

3. 地图点创建

$K_i$ ：当前关键帧

$K_c$ ：covisibility graph中与 $K_i$ 相连的关键帧

对于每一个 $K_i$ 中未匹配的ORB特征，在 $K_c$ 中寻找它的匹配点，并丢弃不满足堆积约束的ORB特征。找到匹配对后，对其三角化。

若其满足：

景深为正
视差条件
重投影误差条件
尺度一致性

则作为新地图点加入。

如果这个新创建的地图点还能被其他帧匹配到，就把它当作3D-2D对，用于优化那一帧的相机位姿[四-4]。

4. 局部BA

优化的目标有：

当前关键帧 $K_i$
与 $K_i$ 相连的关键帧 $K_c$
$K_i$ 和 $K_c$ 能观测到的所有地图点

同时，能观测到这些被优化的地图点的关键帧，也参与优化，但其值固定不变。

过程中会抛弃被判定为外点的地图点。

5. 关键帧剔除

若一个关键帧观测到的90%的地图点，能被其他三个关键帧观测到，则剔除这个关键帧。

六、loop closing

闭环检测部分对于当前最后一个被local mapping线程处理完的关键帧，进行回环的检测和优化。

这部分看不太懂啊。

大概是，先进行闭环检测，先检测候选帧，从候选帧中检测是不是闭环帧。

检测到闭环帧之后，消除累积误差。通过计算得到的相似性矩阵，调整当前帧局部的关键帧位姿、调整它们观测到的地图点、调整他们相关的covisibility graph、最后通过位姿图优化调整全局的关键帧位姿和地图点。

1. 闭环检测

首先检测闭环候选帧：

根据词袋向量，计算当前帧与其所有covisibility graph上相邻帧的相似性，得到最小值 $s_{min}$
查询关键帧数据库，所有所有相似性得分小于 $s_{min}$ 的关键帧都排除
排除与当前帧直接相连的关键帧
其他关键帧作为闭环候选帧

确定闭环帧：

若连续三个候选闭环帧是一致的（？？？），则作为闭环帧。

2. 计算相似变换

单目slam中有七个自由度可以累积漂移：三个平移、三个旋转、一个缩放。

计算当前帧和闭环帧的相似变换，可以得知闭环中的累积误差，也能用来验证闭环的有效性（确定闭环候选帧是不是闭环帧吗？）。

首先计算当前帧和闭环帧分别对应的地图点，其ORB特征的相似性。（闭环帧和当前帧虽然是同一个地方，但是却生成了不同的地图点，要找出来这些相同真实点的不同地图点的匹配对?）得到3D-3D点对，对于每一个闭环候选帧（为啥这里还是候选帧？？）使用RANSAC算法迭代，计算相似性矩阵。

若计算的相似性矩阵有足够的内点，就优化这个候选帧，然后使用guided search，得到更多的匹配点对，再次优化，若计算得到的相似性矩阵仍然有足够的内点，则选为闭环帧。

3. 闭环融合

检测到闭环，要用闭环帧纠正当前帧的错误。

调整关键帧位姿：

当前帧的位姿 $T_{iw}$ ，被相似性矩阵作用，调整其位姿估计。covisibility graph中与当前帧相连的关键帧，其位姿也会被调整。

调整地图点：

闭环帧和其邻居观测到的地图点，都被投影到当前帧和其邻居中，并寻找3D-3D匹配对。这些被匹配到的地图点，和相似性矩阵中的内点进行融合。

更新covisibility graph：

所有参与融合的关键帧，都更新其边的信息（？），并创建与回环帧相连的边（地图点融合了，这个帧就能看到地图点，就与回环帧有边了）。

4. essential graph优化

调整全局：

为了有效的闭合回环，在essential graph上进行位姿图优化。优化后，对每个地图点，根据其中一个观测到它的关键帧的校长，对其进行变换。

七、实验

进行了三组实验：

NewCollege Dataset，考察系统整体表现
TUM RGB-D，考察定位精度、重定位、生存期
KITTI，考察实时大尺度场景操作、定位精度、图优化效率

评测标准：

定位精度：ATE(absolute trajectory error)
轨迹精度：RMSE

1. NewCollege Dataset

20fps, 512*382, 存在闭环和视角的快速旋转。

2. TUM RGB-D Benchmark

有轨迹标签，适于评测定位精度。测试时，去除了弱纹理、纯旋转、无运动的部分。

3. KITTI

有高精度的轨迹标签，含有回环。

GS-SLAM论文阅读笔记-MGSO zenpluck GS论文阅读论文阅读笔记
前言MGSO首字母缩略词是直接稀疏里程计(DSO)，我们建立的光度SLAM系统和高斯飞溅(GS)的混合。这应该是第一个前端用DSO的高斯SLAM，不知道这个系统的组合能不能打得过ORB-SLAM3，以及对DSO会做出怎么样的改进以适应高斯地图，接下来就看一下吧！GishelloG^s_ihelloGishello我是红色文章目录前言1.背景介绍2.关键内容2.1SLAMmodule2.2Dense
论文笔记-Contrastive Learning for Unpaired Image-to-Image Translation kingsleyluoxin 计算机视觉论文笔记深度学习 python 计算机视觉机器学习人工智能深度学习
论文信息标题：ContrastiveLearningforUnpairedImage-to-ImageTranslation作者：TaesungPark,AlexeiA.Efros,RichardZhang,Jun-YanZhu机构：UniversityofCalifornia,Berkeley;AdobeResearch代码链接https://github.com/taesungp/contra
论文笔记：Deep Algorithm Unrolling for Blind Image Deblurring 爱学习的小菜鸡论文笔记去模糊图像处理神经网络
这是一篇CVPR2020的去模糊论文，主要是通过传统与深度相结合，将迭代次数变成神经网络的层数，使网络结构的网络结构更加具有解释性。主要贡献：DeepUnrollingforBlindImageDeblurring(DUBLID)：提出一种可解释的神经网络结构叫做DUBLID，首先提出一种迭代算法，该算法被认为是梯度域中传统的广义全变分正则方法(generalizedTV-regularizeda
探索未来架构：基于AWS的响应式微服务框架柏赢安Simona
探索未来架构：基于AWS的响应式微服务框架reactive-refarch-cloudformationReactiveMicroservicesArchitectureswithAmazonECS,AWSLambda,AmazonKinesisStreams,AmazonElastiCache,andAmazonDynamoDB项目地址:https://gitcode.com/gh_mirror
A survey on instance segmentation: state of the art——论文笔记栀子清茶 1024程序员节论文阅读计算机视觉人工智能笔记学习
摘要这篇论文综述了实例分割的研究进展，定义其为同时解决对象检测和语义分割的问题。论文讨论了实例分割的背景、面临的挑战、技术演变、常用数据集，并总结了相关领域的最新成果和未来研究方向。实例分割的发展从粗略的对象分类逐步演变为更精细的像素级别推理，广泛应用于自动驾驶、机器人等领域。论文为研究人员提供了对实例分割领域的全面了解和有价值的参考。一、简介第一部分“简介”主要介绍了实例分割的背景、定义和挑战。
ROS+YOLOV8+SLAM智能小车导航实战（三、Astra Pro深度相机节点+Astra Pro普通color颜色节点）智慧愚行 YOLO 机器人自动驾驶
一、开始创建ROS节点空间mkdiryolov8_ros/src-pcdyolov8_ros/srccd..catkin_make如果报以下错误是因为系统中存在多个python环境解决办法首先查看你本机有多少个python版本，然后你conda版本的python位置在那里找到后替换调/usr/bin/python：查看本机中的python版本位置都有那些which-apython3catkin_m
AIGC视频生成模型：ByteDance的PixelDance模型好评笔记 AIGC 音视频机器学习人工智能深度学习计算机视觉 transformer
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录热门专栏机器学习深度学习
云原生Serverless平台：无服务器计算的架构革命桂月二二云原生 serverless 架构
引言：从虚拟机到函数即服务(FaaS)AWSLambda每天处理数十万亿次请求，阿里巴巴函数计算支撑双十一亿级事件触发。KnativeServing实现秒级自动扩缩至零，Vercel边缘函数网络响应时间跌破50ms。CNCFOpenFaaS在GitHub斩获25k星，AzureFunctions支持毫秒级计费精度，GoogleCloudRun冷启动优化至200ms内。全球500强企业70%采用Se
LLM论文笔记 20: How to think step-by-step: A mechanistic understanding of chain-of-thought reasoning Zhouqi_Hua 大模型论文阅读人工智能 chatgpt 论文阅读机器学习深度学习语言模型
Arxiv日期：2024.5.16机构：IIT关键词CoT本质LLM推理本质核心结论1.CoT推理的功能组件尽管不同阶段的推理任务具有不同的推理需求，模型内部的功能组件几乎是相同的（共享而非独享）不同的神经算法实际上是由类似归纳头（inductionheads）等机制组合而成2.注意力机制中的信息流动attentionheads在不同的模型层之间传递信息，特别是当它们涉及到本体论相关（ontolo
AWS无服务器应用程序开发—第十一章API Gateway yunquantong AWS技术 aws serverless gateway
APIGateway是AWS提供的一种托管服务，用于创建、发布、维护、保护和监控RESTful和WebSocketAPI。它可以帮助开发者构建可扩展的微服务架构，并提供了丰富的功能来管理API的生命周期和流量。主要功能和特点：API创建和管理：可以使用APIGateway快速创建和定义API，包括定义资源、方法和参数。支持多种集成方式，如AWSLambda、AWSEC2、AWSS3等，还可以自定义
[论文笔记] LLaMA3.1与Qwen2与Apple 技术报告中预训练方案对比心心喵论文笔记论文阅读深度学习人工智能
https://arxiv.org/pdf/2407.21075https://arxiv.org/pdf/2407.10671https://arxiv.org/pdf/2407.21783LLaMA3.1LLaMA3.1技术报告：https://ai.meta.com/blog/meta-llama-3-1/
LLM时代的小模型思考：《What is the Role of Small Models in the LLM Era: A Survey》论文笔记 FrancisQiu learning nlp paper reading 论文阅读
论文：WhatistheRoleofSmallModelsintheLLMEra:ASurvey作者：LihuChenetal.单位：ImperialCollegeLondonAbstract问题：扩大模型大小会导致计算成本和能耗呈指数级增长，这使得这些模型对于学术研究人员和资源有限的企业来说不切实际小型模型（SMs）经常用于实际环境中，引发了关于小模型在LLM时代的作用的重要问题，且关注有限方法
从零开始学Java Lambda表达式：一篇让你彻底理解的通俗指南 z2637305611 学习 java 开发语言
引言想象你每天点外卖要写500字的订单备注，结果有一天发现点“快速套餐”按钮就能搞定——这就是Lambda表达式的魅力！它能让你用“快餐式”代码代替冗长的写法。本文会用大白话、生活案例和代码对比，帮你彻底搞懂JavaLambda的用法！一、Lambda是什么？一句话概括：“用更短的代码，实现一个方法”——专门用来简化匿名内部类的写法！场景对比：传统写法vsLambda写法假设你有一个“点击按钮触发
【论文笔记】3DGS压缩相关工作2篇 AndrewHZ 深度学习新浪潮论文阅读 3DGS 计算机图形学算法三维高斯飞溅压缩方法
1.背景介绍：NVS神经辐射场（NeRFs）引入了一种基于多层感知机（MLP）的新型隐式场景表示方法，它将体密度编码作为几何形状和方向辐射的代理量。渲染通过光线行进的方式来执行。这一解决方案为新视图合成（NVS）带来了前所未有的视觉质量，但代价是训练多层感知机的优化过程极为耗时，且渲染速度很慢。有几种方法加速了训练和渲染过程，通常是利用空间数据结构或者像哈希这样的编码方式，不过牺牲了视觉质量。近期
Ubuntu20.04安装LOCUS遇到的编译错误谁许谁地老天荒 SLAM-ROS ubuntu c++
1、编译错误：core_msgs/MapInfo.h:没有那个文件或目录具体报错如下/home/zys/catkin_ws/test/src/common_nebula_slam/point_cloud_mapper/include/point_cloud_mapper/PointCloudMapper.h:48:10:fatalerror:core_msgs/MapInfo.h:没有那个文件或目
Ubuntu20.04 ros-noetic下opencv多版本问题may conflict with libopencv_highgui.so.4.2 JANGHIGH 小技巧 OpenCV opencv 人工智能计算机视觉
Ubuntu20.04ros-noetic下opencv多版本问题问题解决情况1情况2方法当前终端生效将上述命令添加到~/.bashrc中，使其永久生效问题当编译某程序包时，出现如下警告，但是编译通过。/usr/bin/ld:warning:libopencv_highgui.so.406,neededby/lidar_slam_ws/devel/lib/libvikit_common.so,ma
VSLAM新方案之《在复杂环境中实现高精度与超强鲁棒性》 OAK中国_官方 SLAM 人工智能 rpab-map
OAKChina&苏州泛科特机器人联合推出OAK-DSeries&因子空间感知（FactorPerceptionKit）VSLAM解决方案01FactorPerceptionKit简介FactorPerceptionKit是一种真正基于深度学习技术的VSLAM方案，不同于许多厂商仅通过添加目标检测或语义分割模型来实现额外功能，我们直接在SLAM底层使用HF-Net模型，该模型同时进行局部特征点检测
案例分享：D2 Slam @xuhao3e8 OAK中国_官方无人机
视频来源：$D^2$SLAM:DecentralizedandDistributedCollaborativeVisual-inertialSLAM硬件新4P的介绍https://www.oakchina.cn/product/oak-ffc-4p-new/软件介绍：https://github.com/HKUST-Aerial-Robotics/D2SLAM~~~~~~~（分界线）~~~~~~~
OAK相机：纯视觉SLAM在夜晚的应用 OAK中国_官方人工智能机器学习 SLAM
哈喽，OAK的朋友们，大家好啊，今天这个视频主要想分享一下袁博士团队用我们的OAK相机产出的新成果在去年过山车SLAM的演示中，袁博士团队就展示了纯视觉SLAM在完全黑暗的环境中的极高鲁棒性。现在袁博士团队进一步挖掘了纯视觉的潜力，于是又专门录了一段夜间的演示给我们展示了在完全黑暗及光线变化的环境中可靠工作的VIO、回环检测及适用于大场景的内存管理技术。他们现在已将整套VSLAM方案包含在Fact
利用 AWS API Gateway 和 Lambda 节省成本的指南 fxrz12 aws gateway 云计算无服务器架构低代码
在现代云计算环境中，企业和开发人员不断寻求方法来优化成本，同时保持高性能和灵活性。AWSAPIGateway和Lambda组合提供了一种无服务器（Serverless）的解决方案，能够显著降低基础设施成本，简化管理，并提升应用的可扩展性。APIGateway和Lambda的成本效益1.无需服务器管理使用AWSLambda，您无需预置或管理服务器。这意味着不再需要为闲置的资源付费。Lambda采用按
[论文笔记] LLM大模型剪枝篇——2、剪枝总体方案心心喵论文笔记剪枝算法机器学习
https://github.com/sramshetty/ShortGPT/tree/mainMy剪枝方案（暂定）：剪枝目标：1.5B—>100～600M剪枝方法：层粒度剪枝1、基于BI分数选择P%的冗余层，P=60~802、对前N%冗余层，直接删除fulllayer。N=20（N：剪枝崩溃临界点，LLaMA2在45%，Mistral-7B在35%，Qwen在20%，Phi-2在25%）对后(P
Farm3D- Learning Articulated 3D Animals by Distilling 2D Diffusion论文笔记 Im Bug 3d 论文阅读
Farm3D:LearningArticulated3DAnimalsbyDistilling2DDiffusion1.Introduction最近的研究DreamFusion表明，可以通过text-imagegenerator提取高质量的三维模型，尽管该生成模型并未经过三维训练，但它仍然包含足够的信息以恢复三维形状。在本文中，展示了通过文本-图像生成模型可以获取更多信息，并获得关节模型化的三维对
视觉SLAM十四讲第7讲 (3) 相机运动估计 2D-2D/3D-2D/3D-3D LYF0816LYF slam learning 3d 计算机视觉算法 slam
相机运动估计2D-2D/3D-2D/3D-3D1.2D-2D：对极约束2.三角测量3.3D-2D：PnP3.1直接线性变换DLT3.2P3P3.3最小化投影误差求解PnP4.3D-3D：ICP4.1SVD方法4.2非线性优化方法5.总结若已经有匹配好的点对，要根据点对估计相机的运动，可以分为以下三种情况：2D-2D：即点对都是2D点，比如单目相机匹配到的点对。我们可以用对极几何来估计相机的运动。在
unable to launch什么意思_激光SLAM | IMLS-SLAM：基于scan-to-model方法的大场景3D激光SLAM... weixin_39559097 unable to launch什么意思
论文题目：IMLS-SLAM:scan-to-modelmatchingbasedon3DdataIMSL-SLAM和IMSL-SLAM++是kitti数据集上仅次于LOAM的激光SLAM系统，虽然它有一个最大的缺点，就是不实时，而且时间确实非常慢（1.3s），但是作者也给出了这种不实时的原因，是可以改进的。更重要的是，论文里以IMLS曲面为基础进行的scan-to-model匹配方法是值得借鉴的
SLAM文献之-IMLS-SLAM: scan-to-model matching based on 3D data 点云SLAM SLAM 3d 机器学习 SLAM IMLS ICP
IMLS-SLAM算法原理详解一、算法概述IMLS-SLAM（ImplicitMovingLeastSquaresSLAM）是一种基于3D激光雷达数据的低漂移SLAM算法，由Jean-EmmanuelDeschaud等人在2018年提出。其核心思想是通过隐式移动最小二乘（IMLS）曲面建模实现scan-to-model的匹配框架，显著提升了定位与建图的精度和鲁棒性。该算法在无闭环检测的情况下，4公
ORB_SLAM2编译build_ros.sh时报错([rosbuild] Error from directory check: /opt/ros/kinetic/share) Spider_man_ linux
参考:https://www.pianshen.com/article/8679352229/编译build_ros.sh时报错在ros上编译build_ros.sh时报错，出现如下信息：BuildingROSnodesmkdir:cannotcreatedirectory‘build’:Fileexists[rosbuild]BuildingpackageORB_SLAM2[rosbuild]E
3DGS（三维高斯散射）与SLAM技术结合的应用点云SLAM SLAM 3d 3DGS SLAM技术深度学习计算机视觉定位和建图渲染
3DGS（三维高斯散射）与SLAM（即时定位与地图构建）技术的结合，为动态环境感知、高效场景建模与实时渲染提供了新的可能性。以下从技术融合原理、应用场景、优势挑战及典型案例展开分析：一、核心融合原理1.3DGS在SLAM中的角色场景表示：替代传统点云或体素地图，通过高斯函数集合显式建模场景几何与外观。动态建模：通过时间参数化高斯（如位置、协方差随时间变化），实时跟踪运动物体。可微渲染：支持端到端优
论文笔记（七十二）Reward Centering（一）墨绿色的摆渡人文章论文阅读
RewardCentering（一）文章概括摘要1奖励中心化理论文章概括引用：@article{naik2024reward,title={RewardCentering},author={Naik,AbhishekandWan,YiandTomar,MananandSutton,RichardS},journal={arXivpreprintarXiv:2405.09999},year={202
论文笔记：Enhancing Sentence Embeddings in Generative Language Models UQI-LIUWJ 论文阅读语言模型人工智能
2024ICIC1INTRO对于文本嵌入，过去几年的相关研究主要集中在像BERT和RoBERTa这样的判别模型上。这些模型固有的语义空间各向异性，往往需要通过大量数据集进行微调，才能生成高质量的句子嵌入。——>需要较大的训练批次，这会消耗大量的计算资源一些前沿的工作将焦点转向了最近开发的生成模型，期望利用其先进的文本理解能力，直接对输入句子进行编码，而无需额外的反向传播由于句子表示和自回归语言建模
Serverless Framework 使用教程裘羿洲
ServerlessFramework使用教程serverless无服务器框架——使用AWSLambda、AzureFunctions、GoogleCloudFunctions等构建无服务器架构的Web、移动和物联网应用程序！项目地址:https://gitcode.com/gh_mirrors/se/serverless项目介绍ServerlessFramework是一个开源项目，旨在帮助开发者
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc