南苏月

ORB-SLAM3论文翻译

- - - 摘要
    - 引言
    - 相关工作
    - - 视觉SLAM
        
        视觉惯性SLAM
        
        多地图SLAM
    - 系统概览
    - 相机模型
    - - 重定位
        
        双目相机
    - 视觉惯性SLAM
    - - 基础
        
        IMU初始化
        
        跟踪和建图
        
        对于跟踪丢失
    - 地图合并和回环
    - - 位置识别（约等于重定位）
        
        视觉地图合并
        
        视觉惯性地图合并
        
        回环
    - 实验结果
    - - 单目SLAM在EuRoc数据集上
        
        视觉惯性SLAM在TUM-VI
    - 总结
    - 参考

摘要

ORB-SLAM3是第一个能够让单目、立体和RGB-D相机和针孔和鱼眼镜头模型解耦进行视觉、视觉惯性和多地图SLAM的系统。第一个主要的创新是一个基于特征的紧密集成视觉惯性SLAM系统，它完全依赖于最大后验概率（MAP）估计，甚至在IMU初始化阶段也是如此。第二个主要的创新是一个多地图系统，它依赖于一种新的位置识别方法和改进的召回。多亏了它，ORB-SLAM3能够在长时间的不良视觉信息下生存：当它丢失时，它会启动一个新的地图，当重新访问地图区域时，它将与以前的地图无缝地合并。与只使用最后几秒信息的视觉里程计系统相比，ORB-SLAM3也是第一个能够在所有算法阶段重用所有先前信息的系统。这允许在BA优化中使用历史的共视关键帧，即使这些关键帧来自很久以前的地图或者不同子图。该系统在小型和大型，室内和室外环境中都能稳定地运行，并且比以前的方法精确2到5倍。

引言

当视觉帧跟踪丢失以后，orbslam3会重新记录一个新的地图，如果再次进入之前的地图区域，会与之前的地图合并。

ORB-SLAM3是基于ORB-SLAM和ORBSLAM Visual-Inertial构建，支持抑制轨迹精度发散的短期，中期和长期的数据关联。ORB-SLAM3在次基础上，更进一步，支持历史地图的复用。从而，真正达到一个全局的slam系统：建立一个地图实现精确的定位。

单、双目的vo/vio slam系统，并支持鱼眼相机。
地图复用，拥有合并地图的功能。
高召回的地点识别（占用较低的计算资源换得高召回与精度）
不限制相机模型，只需提供投影、反投影和Jacobian函数（常用的针孔与鱼眼模型）

系统概览

Atlas（一个由一系列非连接的地图组成的多地图系统）
其中包含一个活动的地图与许多非活动地图。活动地图与用于当前帧tracking线程的定位，同时会增加关键帧。该系统建立了一个独特的DBow2关键帧数据库，用于重定位、回环、合并地图等操作。
跟踪线程
给活动的地图提供新的帧，最小化重投影误差（单帧），决定当前帧是否成为关键帧。VI模式中，通过IMU残差计算本体的速度与IMU bias。如果跟踪丢失，尝试在Atals所有地图中重定位，如果成功那个地图将成为活动的。如果几帧过后失败，则重新开始一个新的地图。
局部地图线程
添加新的关键帧与MapPoint到活动的地图中，删除冗余，利用滑动窗口通过BA更新地图。VI模式中IMU的参数在这个线程初始化与更新，使用的是作者提出的最大后验估计技术。
回环与地图融合线程
每添加一个关键帧，就探测活动的地图与其他地图的共有区域，如果检测到，执行回环矫正，如果不属于同一个地图，则将他们融合成一个。在矫正后另开一个线程进行整体的BA进一步更新地图且不影响实时性。检测回环的同时，完成有共视子图地图的合并等操作，这也是作者强调最终能生成一个全局一致地图的原因。

相机模型

以往的ORB-SLAM算法假定为针孔像机模型，现在希望通过提取与摄像机模型相关的所有属性和投影函数来解耦相机模型和slam算法，从而使得系统可以使用任何摄像机模型。在ORB-SLAM3中，除了针孔模型外，还提供了鱼眼模型。

重定位

ORB-SLAM通过设置基于EPNP算法的透视n点求解器来解决重新定位问题，本文采用最大似然的PNP算法(MLPNP)，可以独立于所使用的摄像机模型。相机模型只需要提供一个从像素的空间点的重投影函数，就可以使用重定位。

双目相机

大多数双目视觉SLAM系统都是假设左右两帧已经进行过极线校正，即这两幅图像都被转换为针孔投影，使用相同的焦距，图像平面共平面并与水平极线对齐，这样图像中的特征可以很容易地在另一个图像中的同一行附件来匹配，以降低特征搜索区域。然而，校正立体图像的包含了很多限制，很多情况下是不合适的，如鱼眼相机中图像会被过度裁剪，失去大视场的优点，降低了鲁棒性。
由于这个原因，我们的系统不依赖于图像恢复，考虑到立体声钻机作为两个单目摄像机，它们之间具有：
（1）恒定的相对 $S e (3)$ 变换，
（2）可选地，一个观察场景相同部分的公共图像区域，这些约束允许算法在对极约束和BA优化时有效地估计地图。

视觉惯性SLAM

基础

ORBSLAM-VI假设的是针孔模型，且初始化太慢，在一些有挑战性的传感器上会失败。而orbslam3里面基于上面的工作提出了一个快速准确的IMU初始化技术，可用于针孔/鱼眼的单双目惯性视觉slam。
ORBSLAM3需要计算优化的有body位姿 $T i$ ，速度 $v i$ ，加速度计与陀螺仪的偏置，假设他们由布朗运动演化的（无规则），他们组成了状态向量 $S i$ ：

对于VIslam需要对两帧之间做IMU预积分，获得角度变化、速度变化与位置变化，还有一个关于全部测量向量的一个信息矩阵，定义惯性残差：

重投影误差：

其中 $Π$ 表示相机的投影方程， $\oplus$ 表示李群 $S E (3)$ 在三维空间上的转换运算。
视觉惯性优化目标函数即最小化残差，同时也使用鲁棒的Huber核 $ρ_{Hub}$ 函数来减少虚假匹配的影响，这种优化在跟踪和映射过程中会降低效率，

IMU初始化

三个关键观点：
纯单目slam可以提供非常准确的初始化地图，主要问题是没有尺度。解决这个问题的方法是添加IMU初始化。
当尺度明确地表示为优化变量时，它收敛得更快，而不是使用BA的隐式表示。
在IMU初始化阶段忽略传感器的不确定性会产生大量的不可预兆的误差。
因此，考虑到传感器的不确定性，我们将IMU初始化描述为一个MAP（最大后验概率）估计问题，分为三个步骤：

视觉地图初始化
用2秒钟来进行单目初始化，以4HZ的频率添加关键帧。此时已经有了10个相机位姿及上百个MapPoint，使用纯视觉BA。这些位姿转成以body坐标系下，上标表示变量尺度未知
惯导地图初始化
这一步目的为了得到惯导参数的最佳估计，使用 $T_{0:k}$ 与这些关键帧间的惯导测量数据，惯导参数如下。

在只考虑惯性测量的情况下构建MAP估计问题表达如（6）。考虑到测量的独立性优化问题变为（7），再对（7）式中的IMU预积分和先验分布取负对数与假设高斯误差转换为（8），与上面不同的是没有加入视觉残差，但是先验残差 $r_p$ 应该接近于0，其协方差由IMU特征给出。

在流形中进行优化时会对尺度进行更新，以在优化过程中更新重力方向估计:（因为重力方向默认为向下的，绕着重力方向的旋转轴不管怎么转都不影响，这点在VIORB论文中也有介绍）
更新尺度方法如下：

一旦惯性优化完成，帧的姿态和速度以及三维地图点将按估计的比例缩放并旋转以使z轴与估计的重力方向对齐。修正偏差，重复IMU预积分，以减少后面的线性化误差。

视觉惯性联合初始化
一旦获得一个好的IMU与视觉参数估计，可以执行视觉IMU联合优化进一步更新。对于所有关键帧有共同的偏置，包含与仅imu阶段共同的先验信息。

跟踪和建图

跟踪阶段VI优化比较简单，只优化最近两帧的位姿，MapPoints固定。
Mapping，执行整体优化对于大地图比较难处理。使用滑动窗口对关键帧和对应的MapPoints，包含与这些关键帧共视的关键帧，但它们是固定的。
某些时候缓慢移动不能提供很好的惯导参数观测性，初始化在短短的15秒内可能不会收敛到准确结果。为了提高这种情况的鲁棒性，提出了一个新颖的尺度更新技术，基于一个改进的纯IMU优化，包含所有插入的关键帧，但只优化尺度与重力方向（如图2d）。注意，在这种情况下，假设恒定偏差是不正确的。相反，使用每个帧的估计值，并修复它们。这种优化在计算上非常高效，每10秒在LocalMapping线程中执行一次，直到地图有超过100个关键帧或自初始化以来已超过75秒。

对于跟踪丢失

在纯VSLAM或者VO系统中，由于相机快速运动或遮挡容易导致丢失。ORBSLAM里面首创了基于词袋位置识别的快速重定位技术，但是在EUROC的困难数据集上还有些不足。当跟踪到少于15个MapPoints点时，这篇中VI系统会丢失。主要分成两个阶段提高鲁棒性：
（1）短时丢失：目前的本体状态使用IMU的读取来估计，MapPoints在估计的相机位姿下被投影且在一个大的图像窗口中寻找匹配点。匹配结果被包含于VI优化中。在大多数情况下这样可以恢复视觉跟踪，否则5秒后进入下一阶段。
（2）长时丢失：重新开一个地图，且作为活动的地图。

地图合并和回环

为了防止假阳性结果导致地图混乱，DBoW2实施了时序与几何一致性检验，完成了百分百的精度，召回率30～40%。时序一致性检测需要至少三个关键帧。在ATLAS上使用了这种方法，这种延迟和低召回率经常导致相同或不同地图上的重复。
无论何时在Mapping线程中创造了一个关键帧，位置识别都会尝试去探测与ATLAS中的关键帧的匹配。如果检测到匹配的关键帧属于活动的地图，执行回环，否则执行地图融合。
作为这个方法的第二个新颖之处，一旦新的关键帧与地图确定了相对位姿，定义一个局部窗口，包含匹配的关键帧及其在covisibility graph中的临近帧。在这个窗口里密集地搜索中长度数据关联，提高回环与地图融合精度。与ORBSLAM2不同的细节如下：

位置识别（约等于重定位）

为了达到较高的召回率，在使用DBow2进行回环检测时，每个候选帧都会进行好几步的几何验证，具体如下：
DBoW2 candidate keyframes : 我们根据DBow2查询3个候选帧，但并不包括被查询帧的共视帧，将查询到的候选帧，以及候选帧的最佳共视帧作为一个局部的小地图（包括3D地图点），因此可以建立2D-2D以及2D-3D的匹配关系
3D aligning transformation : 使用Horn-algorithm结合RANSAC进行被查帧的位姿估计Guided matching refinement : 将Local window中构建的地图点全都投影到被查询帧上，寻找更多的匹配关系，从而进行重投影优化；本步骤可以多次进行，每次迭代收缩Local window的大小即可
Verification in three covisible keyframes ：连续三次检测到回环才可以认为Place Recognition成功。不过，一般认为Local window已经包含的全部的信息，因此不用每次重复进行DBow2检索。同时，不一定是新帧，被检索帧的相邻帧可以拿来检测，用于连续三次的计数。
VI Gravity direction verification：地图尺度成功恢复的情况下(VI模式)，pitch和roll角也可以设定阈值，进行Place Recognition

视觉地图合并

Place Recognition成功以后就可以进行地图合并了，如果候选帧和被检测帧分别数据不同的地图，建议将被检测帧的地图合入候选帧所在的地图。由于地图合并一般较为耗时，因此地图合并被为两个阶段，详细步骤如下：

1）Welding window assembly：将被检测帧以及其共视帧和候选帧以及其共视帧，再加上上述帧对应的地图点，组合一个局部的地图，成为Welding window。当前，由于属于不同的地图，因此需要根据Place Recognition的得到的旋转平移变换到候选帧所属的地图.
2) Merging maps：将重复点进行删除，但保留被删除点的共视关系，这样很好理解。
3) Welding bundle adjustment.：对Welding window中的关键帧和地图点进行BA，为了保证一致性，将有共视关系的帧进行fixed, 见下图
4) Pose-graph optimization. ：fixed Welding window中的关键帧，对整个地图中剩余关键帧进行pose-graph优化

视觉惯性地图合并

这里的合并和视觉地图合并基本相同，区别主要是第一步和第三步，改动如下：

两个待合并地图初始旋转和平移，根据地图是否优化成功决定是SE3还是SIM3
在Welding bundle中引入IMU预积分等约束信息，见下图，注意图中被框起来需要fixed的量
注意： 这里和Visual Map Merging在fixed 共视帧的时候有一处不同，就是Visual Map Merging只fixed 合入地图关键帧的共视关系，Visual-Inertial Map Merging则全都要

如果active的地图是mature的，一切照旧；如果不mature，说明尺度信息暂时不可靠，在缝合时，需要用相似变换Sim(3)变换而不是SE(3)将Ma中的点对齐到Mm。优化的变量和固定的变量如图所示，Easy。

回环

闭环校正算法类似于地图合并，但位置识别时仅匹配active地图。同样会根据匹配的关键帧构成Welding window，做去重，Welding window BA工作，然后是姿势图优化，将校正传播到地图的其余部分。
最后一步是在考虑环路闭合 long-term和 mid-term 匹配后，进行全局BA。在视觉惯性的情况下，仅在关键帧的数量低于阈值时才执行全局BA，以避免巨大的计算成本。

实验结果

单目SLAM在EuRoc数据集上

视觉惯性SLAM在TUM-VI

总结

参考

MLPnP思路
提出了一种从图像观测到方向向量的方差传播的通用方法，以避免协方差矩阵的奇异性，该方法具有实时的迭代性能，迭代最小化投影到球面切空间上的重投影误差。
MLPnP地图初始化可以分为三个步骤：
1)仅视觉地图估计：使用BA求解短时间内的单目初始化ORB-SLAM(~2s)，以获得一个只有视觉的上尺度地图估计。同时，计算关键帧之间的IMU预积分及其协方差。
2)只惯性地图估计：只惯性光学化，使IMU轨迹和ORB-SLAM轨迹对齐，找出尺度、关键帧速度、重力方向和IMU偏差。
3)视觉惯性图估计：使用上一步的解作为初始值，得到完整的视觉惯性BA求得最优解。

根据贝叶斯公式，最大后验等于最大似然乘以先验概率，所以我们目的是求取观测值是最大似然。假设IMU预积分值分布和参数的先验分布概率密度函数为高斯分布的密度函数，就可以对整个似然函数求对数并加负号，最后变成最小二乘过程。

UrbanS LeitloffJ HinzS. MLPnP arealＧtime maximum likelihood solutiontothe erspective-n-point problem （ISPRS-2016）

https://www.cnblogs.com/tweed/p/13384022.html

AI时代的人类增强：道德考虑与身体增强的未来发展机遇分析机遇挑战 AI天才研究院 AI人工智能与大数据 AI大模型企业级应用开发实战 Agentic AI 实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
AI时代的人类增强：道德考虑与身体增强的未来发展机遇分析机遇挑战关键词：人工智能、身体增强、道德考虑、未来发展、机遇挑战摘要：本文将探讨AI时代人类增强的各个方面，包括道德考虑和身体增强技术的未来发展机遇与挑战。通过详细分析AI技术基础、身体增强技术、道德哲学及社会影响，本文旨在为读者提供对这一前沿领域的深入理解和前瞻性思考。目录大纲AI时代的人类增强：道德考虑与身体增强的未来发展机遇分析机遇挑战
《Spring 中上下文传递的那些事儿》Part 5：分布式链路追踪——SkyWalking 实战指南大手你不懂 Spring 中上下文传递的那些事儿 Java项目实战 spring 分布式 skywalking
Part5：分布式链路追踪——SkyWalking实战指南随着微服务架构的广泛应用，分布式系统的链路追踪和性能监控变得尤为重要。在之前的文章中，我们探讨了如何使用Sleuth和Zipkin实现基本的链路追踪。今天，我们将介绍另一种强大的工具——ApacheSkyWalking，它不仅提供了全面的链路追踪功能，还支持JVM、数据库、消息队列等多方面的监控。本文将带你了解SkyWalking的核心概念
前端如何借助 Postman 进行接口性能调优前端视界前端艺匠馆前端 postman lua ai
前端如何借助Postman进行接口性能调优关键词：前端开发、Postman、接口性能调优、API测试、性能分析摘要：本文围绕前端开发中借助Postman进行接口性能调优展开。首先介绍了相关背景知识，包括目的、预期读者、文档结构和术语表。接着阐述了核心概念，如接口性能的相关概念及其联系，并给出了对应的文本示意图和Mermaid流程图。详细讲解了核心算法原理和具体操作步骤，结合Python代码示例进行
目标检测：从基础原理到前沿技术全面解析随机森林404 计算机视觉目标检测人工智能计算机视觉
引言在计算机视觉领域，目标检测是一项核心且极具挑战性的任务，它不仅要识别图像中有什么物体，还要确定这些物体在图像中的具体位置。随着人工智能技术的快速发展，目标检测已成为智能监控、自动驾驶、医疗影像分析等众多应用的基础技术。本文将全面介绍目标检测的基础概念、发展历程、关键技术、实践应用以及未来趋势，为读者提供系统性的知识框架。第一章目标检测概述1.1目标检测的定义与重要性目标检测（ObjectDet
喜讯 | Navicat 蝉联 2025 年 DBTA 100 强名单 Navicat中国 Navicat 17 焕新上市 navicat 数据库
Navicat在“DBTA1002025-数据领域最重要的公司”榜单中获得表彰。该奖项旨在表彰在数据管理与分析领域的领先创新者。数据库趋势与应用集团出版人TomHogan表示：“企业正寻求扩大人工智能的应用范围，采用新的技术与应用，增加数据分析/商业智能的使用，并对现有应用进行现代化改造”，“每年，《数据库趋势与应用》杂志都会推出DBTA100榜单，旨在表彰具有创新精神、能够为客户带来新产品新体验
SaaS 的订阅计费模型设计实战指南：按量、按用户、按功能的架构与实现全解析
SaaS的订阅计费模型设计实战指南：按量、按用户、按功能的架构与实现全解析关键词SaaS计费模型、按量计费、用户数计费、功能模块计费、订阅管理、计费系统架构、账单系统、分级定价、后付费、使用量追踪摘要在企业级SaaS系统架构中，计费模型不仅关系到产品商业化路径的可行性，还直接决定了系统架构、数据采集与账务合规的设计逻辑。本文将深入解析三种主流SaaS订阅计费模式：按量计费（Usage-based）
Github 2025-07-04 Java开源项目日报 Top10 老孙正经胡说 github java 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2025-07-04统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Java项目10Java实现的算法集合：使用Gitpod.io进行编辑和贡献创建周期：2883天开发语言：Java协议类型：MITLicenseStar数量：57266个Fork数量：18692次关注人数：57266人贡献人数：431人OpenIss
水下目标检测：突破与创新加油吧zkf 目标跟踪人工智能计算机视觉
水下目标检测技术背景水下环境带来独特挑战：光线衰减导致对比度降低，散射引发图像模糊，色偏使颜色失真。动态水流造成目标形变，小目标（如10×10像素海胆）检测困难。声呐与光学数据融合可提升精度，但多模态对齐仍是技术难点。核心算法实现要点图像预处理直方图均衡化与Retinex算法结合改善对比度和色偏：defsingle_scale_retinex(img,sigma):retinex=np.log10
策略梯度在网络安全中的应用：AI如何防御网络攻击 AI智能探索者 web安全人工智能安全 ai
策略梯度在网络安全中的应用：AI如何防御网络攻击关键词：策略梯度、网络安全、AI防御、强化学习、网络攻击、入侵检测、自适应防御摘要：本文将探讨策略梯度这一强化学习算法在网络安全领域的创新应用。我们将从基础概念出发，逐步揭示AI如何通过学习网络攻击模式来构建自适应防御系统，分析其核心算法原理，并通过实际代码示例展示实现过程。文章还将讨论当前应用场景、工具资源以及未来发展趋势，为读者提供对这一前沿技术
Midjourney：AI人工智能图像生成的新方向 AI智能探索者人工智能 midjourney 计算机视觉 ai
Midjourney：AI人工智能图像生成的新方向关键词：Midjourney、AI图像生成、扩散模型、提示词工程、多模态学习、生成式AI、创意工具摘要：本文将带您走进AI图像生成的前沿领域，以Midjourney为核心，从技术原理到实际应用，用通俗易懂的语言解析其背后的“魔法”。我们将通过生活案例、技术拆解和实战演示，揭示Midjourney如何通过扩散模型、提示词工程和多模态学习，重新定义“用
Mac 磁盘检测和监控工具 DriveDx jia123yoou macos mac 磁盘监控
DriveDxMac一款不监视驱动器的内置S.M.A.R.T.状态的先进驱动器运行状况诊断和监测工具而且还分析了所有驱动器健康密切相关的指标，SSD或硬盘驱动器故障（像SSD磨损/耐久性，坏扇区重新分配，离线坏道，未定扇形区，I/O错误以及更多）和要是出了差错立即警报用户。我们的驱动器运行状况诊断算法是基于最近在这一领域的研究。原文地址：DriveDx英文Mac磁盘检测和监控工具
物联网零售领域AI算力网络与通信的应用探索 AI算力网络与通信物联网零售人工智能 ai
物联网零售领域AI算力网络与通信的应用探索关键词：物联网、零售领域、AI算力网络、通信、应用探索摘要：本文聚焦于物联网零售领域，深入探讨了AI算力网络与通信的应用。首先介绍了相关背景，包括目的、预期读者等。接着对核心概念进行解释，阐述它们之间的关系并给出原理架构示意图和流程图。然后详细讲解核心算法原理、数学模型与公式，通过项目实战展示代码案例及解读。还介绍了实际应用场景、推荐相关工具资源，分析未来
剖析AI人工智能领域Whisper的性能指标 AI大模型应用实战人工智能 whisper xcode ai
剖析AI人工智能领域Whisper的性能指标关键词：Whisper、语音识别、性能指标、ASR、AI模型评估、基准测试、语音转文本摘要：本文深入剖析OpenAI开发的Whisper语音识别系统的性能指标。我们将从技术原理、架构设计、性能基准测试等多个维度，全面分析Whisper在不同场景下的表现。文章将详细讲解Whisper的评估方法、关键性能指标解读、实际应用中的性能表现，以及与其他主流语音识别
探索AI人工智能领域多智能体系统的技术原理 AI大模型应用之禅人工智能网络 ai
探索AI人工智能领域多智能体系统的技术原理关键词：AI人工智能、多智能体系统、技术原理、智能体交互、分布式计算摘要：本文深入探索了AI人工智能领域多智能体系统的技术原理。首先介绍了多智能体系统的背景，包括其目的、预期读者、文档结构和相关术语。接着阐述了多智能体系统的核心概念与联系，通过文本示意图和Mermaid流程图进行清晰展示。详细讲解了核心算法原理，结合Python源代码进行说明，并给出了相关
【华为od刷题（C++）】HJ30 字符串合并处理 m0_64866459 华为od c++链表
我的代码：#include//用于输入输出流#include//用于字符串处理#include//用于动态数组的处理#include//包含排序等常见算法#include//用于字符串流的处理，可以将数据从字符串流中提取#include//提供字符处理函数，如isdigit、isalpha等#include//提供位集处理，能够将数字转换为二进制表示usingnamespacestd;charbi
Python pip与Conda环境的兼容性问题
Pythonpip与Conda环境的兼容性问题关键词：Python环境管理、pip与conda冲突、依赖解析、虚拟环境、包管理、兼容性解决方案、依赖冲突摘要：本文深入探讨Python生态中pip和conda两种主流包管理工具的兼容性问题。我们将从底层机制分析冲突根源，通过具体案例展示常见问题场景，并提供多种解决方案和最佳实践。文章包含详细的依赖解析算法分析、环境隔离技术比较，以及通过实际代码演示如
挑战华为社招：7年老Java一次坑爹的面试经历 m0_57286571 程序员 java 后端面试
前言今天刚好有空，跟大家聊聊如何学好算法进大厂。前两天一个读者和我说，他坚持刷算法题2个月，薪资翻番去了他梦寐以求的大厂，期间面字节跳动还遇到了原题…其实据我所知目前国内的大厂和一些独角兽，已经越来越效仿硅谷公司的做法，通过编程定题面试，来考察数据结构和算法的扎实程度。以我的经验来说，**对于新手来说，扎实的掌握一门语言是其一，其二就是要有基本的算法能力，这个非常重要。对于进阶的用户，更多技术栈的
结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
冒泡和快速排序的区别郭尘帅666 算法数据结构
冒泡算法快速排序时间复杂度O（n^2）最坏/平均O（nlogn）平均，O（n^2）最坏空间复杂度O（1）O（logn）最好/O(n)最坏稳定性很稳定(元素顺序不变)不稳定(元素顺序可能改变)适用场景小规模数据或接近有序的数据大规模数据核心思想重复遍历，每轮都会把最大的元素移至末尾选择基准值，比基准值小的元素放左边，大的放右边代码实现对比1.冒泡排序publicstaticvoidbubbleSor
《剑指迷宫：破解矩阵路径之谜》一只咸鱼大王故事版本数据结构与算法 C++数据结构算法递归回溯
故事标题：《剑与路之书——矩阵迷宫的路径密钥》引子：迷宫之城的秘密在遥远的算法大陆，有一座神秘的城市——“迷宫之城”。在这座城市的中心，矗立着一座名为“命运之塔”的古老建筑。传说中，这里藏着一本神秘的典籍——《剑指天书》，书中记载着无数关于矩阵、路径和逻辑推理的奥秘。在这片土地上，有一种被称为“矩阵迷宫”的古老魔法阵。它由一个个字符格子组成，每一步只能向上下左右移动一格。而最神奇的是，如果一条路径
常见手撕项目C++ 氏族归来 c++开发语言
常见手撕项目C++设计模式单例模式饿汉模式懒汉模式策略模式策略接口实现具体的策略（虚函数重写）定义上下文用户调用代码最短路径算法使用函数模板写冒泡排序写一个类模板stringreplace详解方法概览参数介绍代码示例多线程信号量解释设计模式单例模式单例模式是一种常用的软件设计模式，其目的是确保一个类只有一个实例，并提供一个全局访问点来获取该实例。优点：资源控制：单例模式能够确保一个类只有一个实例存
【LangChain编程：从入门到实践】LangChain与其他框架的比较 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】LangChain与其他框架的比较1.背景介绍1.1人工智能发展现状在当今时代，人工智能(AI)已经成为科技领域中最热门和最具革命性的话题之一。随着计算能力的不断提升和算法的持续优化,AI系统正在不断扩展其应用范围,包括自然语言处理、计算机视觉、决策系统等各个领域。1.2LangChain概述在这种背景下,LangChain作为一个新兴的AI框架应运而生。L
重塑知识的圣殿：人工智能时代的教育革命与人文守护田园Coder 人工智能科普人工智能科普
教育，承载着文明火种传递的千年使命，其核心始终围绕两个永恒命题：如何让知识更有效地被获取？如何让个体潜能更充分地绽放？在信息爆炸、技能迭代加速的当代，传统教育模式——标准化课程、统一进度、有限师资、资源不均——正面临前所未有的压力。人工智能（AI）的崛起，如同一股强大的变革洪流，正以前所未有的深度和广度渗透教育生态的各个环节。从量身定制的学习路径到永不疲倦的智能导师，从虚拟现实的沉浸课堂到洞察学情
踏入真实：具身智能与物理世界的认知交响
当大型语言模型在文本的海洋中纵横捭阖，生成式AI在数字画布上挥洒创意时，人工智能仍有一个根本性的疆域尚未完全征服——真实的三维物理世界。理解一个苹果，不能仅靠词向量坐标；学会行走，无法通过阅读说明书达成；在拥挤的街道导航，远非处理符号逻辑那般简单。智能的进化，自生命诞生之初，便与具身性（Embodiment）和环境交互（Interaction）密不可分。我们的认知、学习、乃至意识的雏形，都源于身体
Python scikit-learn 【机器学习库】全面讲解
让AI成为我们的得力助手：《用Cursor玩转AI辅助编程——不写代码也能做软件开发》scikit-learn（简称sklearn）是Python最流行的机器学习库之一，提供简单高效的数据挖掘和数据分析工具。它基于NumPy、SciPy和Matplotlib构建，广泛应用于工业界和学术界。核心优势统一API设计：所有模型使用一致的接口（fit()、predict()、score()）丰富的算法：覆
Nystromformer：一种基于 Nyström 方法的自注意力近似算法 AI专题精讲 Paper阅读人工智能自然语言处理 AI
1.摘要Transformer已经成为广泛自然语言处理任务中的强大工具。推动Transformer展现出卓越性能的一个关键组件是self-attention机制，它对每个token编码了其他token的影响或依赖关系。虽然self-attention机制具有诸多优势，但其在输入序列长度上的二次复杂度限制了其在较长序列上的应用——这是当前社区积极研究的一个主题。为了解决这一限制，我们提出了Nystr
使用 C++/OpenCV 和 MFCC 构建双重认证智能门禁系统
使用C++/OpenCV和MFCC构建双重认证智能门禁系统引言随着物联网和人工智能技术的发展，智能门禁系统在安防领域的应用越来越广泛。相比于传统的钥匙、门禁卡或密码，生物识别技术（如人脸识别、指纹识别、虹膜识别等）提供了更高的安全性与便利性。然而，单一的生物识别方式在某些场景下可能存在安全隐患。例如，人脸识别可能被高清照片或视频欺骗（称为“欺骗攻击”），在光照、姿态变化剧烈时识别率也可能下降。为了
PHP接单涨薪系列（八）之AI内容工厂：用PHP批量生成SEO文章系统（2025接单秘籍）攻城狮凌霄 PHP PHP接单涨薪 AI 人工智能 php android
某SEO团队采用本方案后，内容产出效率提升10倍，网站流量3个月增长300%，单月通过内容外包获利超¥50,000。本文将揭秘如何用PHP+AI打造全自动SEO内容工厂，让你成为搜索引擎优化领域的抢手人才！一、SEO市场新机遇：AI内容生成的红利期1.12025年SEO行业巨变搜索引擎算法升级2025核心变革SGE体验优化EEAT权重提升多模态内容整合2025年SEO关键数据：指标20232025
可观测性终局：Pixie自动诊断K8s生产故障
可观测性终局：Pixie自动诊断K8s生产故障摘要针对Kubernetes生产环境“故障定位难、诊断效率低、依赖专家经验”的痛点（某电商平台因内存泄漏排查耗时4小时导致订单量下降30%），本文提出基于Pixie的无人值守诊断方案。通过eBPF技术实时追踪系统调用（如malloc()内存分配），结合BPF地图分析网络行为、LTTng捕获存储IO延迟，实现三大核心故障的自动定位：内存泄漏（定位准确率9
协同过滤算法：挖掘用户偏好，精准推荐商品 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
1.背景介绍协同过滤（CollaborativeFiltering，CF）作为推荐系统中的重要技术，其核心思想是利用用户和物品间的行为数据，挖掘用户隐性偏好，从而实现精准推荐。自20世纪90年代提出以来，协同过滤算法已经在电子商务、社交媒体、音乐视频等多个领域中广泛应用，取得了显著的推荐效果。协同过滤算法主要分为基于用户的协同过滤和基于物品的协同过滤两种。基于用户的协同过滤通过比较用户间的相似性，
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod

ORB-SLAM3论文翻译

目录

摘要

引言

相关工作

视觉SLAM

视觉惯性SLAM

多地图SLAM

系统概览

相机模型

重定位

双目相机

视觉惯性SLAM

基础

IMU初始化

跟踪和建图

对于跟踪丢失

地图合并和回环

位置识别（约等于重定位）

视觉地图合并

视觉惯性地图合并

回环

实验结果

单目SLAM在EuRoc数据集上

视觉惯性SLAM在TUM-VI

总结

参考

你可能感兴趣的:(运动追踪,计算机视觉,人工智能,算法)