GondorFu

视觉 SLAM 十四讲 —— 第十二讲回环检测

回环检测概述

回环检测的意义

前面我们已经介绍过了：前端提供特征点的提取和轨迹、地图的初值，而后端负责对这所有的数据进行优化。然而，如果像 VO 那样仅考虑相邻时间上的关联，那么，之前产生的误差将不可避免地累计到下一个时刻，使得整个 SLAM 会出现累积误差。长期估计的结果将不可靠，或者说，我们无法构建全局一致的轨迹和地图。
虽然后端能够估计最大后验误差，但所谓“好模型架不住烂数据”，只有相邻关键帧数据时，我们能做的事情并不很多，也无从消除累积误差。但是，回环检测模块，能够给出除了相邻帧之外的，一些时隔更加久远的约束：这是因为我们察觉到相机经过了同一个地方，采集到了相似的数据。而回环检测的关键，就是如何有效地检测出相机经过同一个地方这件事。如果我们能够成功地检测这件事，就可以为后端的 Pose Graph 提供更多的有效数据，使之得到更好的估计，特别是得到一个全局一致（Global Consistent）的估计。

回环检测对于 SLAM 系统意义重大。它关系到我们估计的轨迹和地图在长时间下的正确性。甚至在某些时候，我们把仅有前端和局部后端的系统称为VO，而把带有回环检测和全局后端的称为 SLAM。

方法

最简单的方式就是对任意两张图像都做一遍特征匹配，根据正确匹配的数量确定哪两个图像存在关联——这确实是一种朴素且有效的思想。缺点在于，我们盲目地假设了“任意两个图像都可能存在回环”，使得要检测的数量实在太大。

上面说的朴素思路都过于粗糙。尽管随机检测在有些实现中确实有用，但我们至少希望有一个“哪处可能出现回环”的预计，才好不那么盲目地去检测。这样的方式大体分为两种思路：基于里程计的几何关系（Odometry based），或基于外观（Appearance based）。

基于几何关系是说，当我们发现当前相机运动到了之前的某个位置附近时，检测它们有没有回环关系——这自然是一种直观的想法，但是由于累积误差的存在，我们往往没法正确地发现“运动到了之前的某个位置附近”这件事实，回环检测也无从谈起。因此，这
种做法在逻辑上存在一点问题，因为回环检测的目标在于发现“相机回到之前位置”的事实，从而消除累计误差。而基于几何关系的做法假设了“相机回到之前位置附近”，才能检测回环。这是有倒果为因的嫌疑的，因而也无法在累计误差较大时工作。

另一种方法是基于外观的。它和前端后端的估计都无关，仅根据两张图像的相似性确定回环检测关系。这种做法摆脱了累计误差，使回环检测模块成为 SLAM 系统中一个相对独立的模块（当然前端可以为它提供特征点）。自 21 世纪初被提出以来，基于外观的回环检测方式能够有效地在不同场景下工作，成为了视觉 SLAM 中主流的做法。在基于外观的回环检测算法中，核心问题是如何计算图像间的相似性。

同时由于以下两点的存在

首先，前面也说过，像素灰度是一种不稳定的测量值，它严重受环境光照和相机曝光的影响。
当相机视角发生少量变化时，即使每个物体的光度不变，它们的像素也会在图像中发生位移，造成一个很大的差异值。

由于这两种情况的存在，实际当中，即使对于非常相似的图像，也会经常得到一个（不符合实际的）很大的值。由此引出感知偏差（Perceptual Aliasing）和感知变异（Perceptual Variability）两个概念。

准确率和召回率

在 SLAM 中，我们对准确率要求更高，而对召回率则相对宽容一些。由于假阳性的（检测结果是而实际不是的）回环将在后端的 Pose Graph 中添加根本错误的边，有些时候会导致优化算法给出完全错误的结果。而相比之下，召回率低一些，则顶多有部
分的回环没有被检测到，地图可能受一些累积误差的影响——然而仅需一两次回环就可以完全消除它们了。所以说在选择回环检测算法时，我们更倾向于把参数设置地更严格一些，或者在检测之后再加上回环验证的步骤。

词袋模型

既然直接用两张图像相减的方式不够好，那么我们需要一种更加可靠的方式。结合前面几章的内容，一种直观的思路是：为何不像 VO 那样特征点来做回环检测呢？和 VO 一样，我们对两个图像的特征点进行匹配，只要匹配数量大于一定值，就认为出现了回环。

词袋，也就是 Bag-of-Words（BoW），目的是用“图像上有哪几种特征”来描述一个图像。

具体操作步骤如下：

确定“人、车、狗”等概念——对应于 BoW 中的“单词”（Word），许多单词放在一起，组成了“字典”（Dictionary）。
确定一张图像中，出现了哪些在字典中定义的概念——我们用单词出现的情况（或直方图）描述整张图像。这就把一个图像转换成了一个向量的描述。
比较上一步中的描述的相似程度。

通过字典和单词，只需一个向量就可以描述整张图像了。该向量描述的是“图像是否含有某类特征”的信息，比单纯的灰度值更加稳定。又因为描述向量说的是“是否出现”，而不管它们“在哪儿出现”，所以与物体的空间位置和排列顺序无关，因此在相机发生少量运动时，只要物体仍在视野中出现，我们就仍然保证描述向量不发生变化。基于这种特性，我们称它为Bag-of-Words 而不是什么 List-of-Words，强调的是 Words 的有无，而无关其顺序。因此，可以说字典类似于单词的一个集合。

接下来的问题就是构建字典和评价两张图片词袋的相似性。

字典

字典的结构

按照前面的介绍，字典由很多单词组成，而每一个单词代表了一个概念。一个单词与一个单独的特征点不同，它不是从单个图像上提取出来的，而是某一类特征的组合。所以，字典生成问题类似于一个聚类（Clustering）问题。

首先，假设我们对大量的图像提取了特征点，比如说有个。现在，我们想找一个有个单词的字典，每个单词可以看作局部相邻特征点的集合，应该怎么做呢？这可以用经典的 K-means（K 均值）算法解决。根据 K-means，我们可以把已经提取的大量特征点聚类成一个含有个单词的字典了。现在的问题，变为如何根据图像中某个特征点，查找字典中相应的单词？

仍然有朴素的思想：只要和每个单词进行比对，取最相似的那个就可以了嘛——这当然是简单有效的做法。然而，考虑到字典的通用性，我们通常会使用一个较大规模的字典，以保证当前使用环境中的图像特征都曾在字典里出现过，或至少有相近的表达。

这里有很多数据结构能够用来急速查找过程（Fabmap，Chou-Liu tree）。这里使用一种 k 叉树来表达字典。它的思路很简单，类似于层次聚类，是 k-means 的直接扩展。假定我们有个特征点，希望构建一个深度为，每次分叉为 k 的树。

实际上，最终我们仍在叶子层构建了单词，而树结构中的中间节点仅供快速查找时使用。这样一个 k 分支，深度为 d 的树，可以容纳个单词。另一方面，在查找某个给定特征对应的单词时，只需将它与每个中间结点的聚类中心比较（一共 d 次），即可找到最
后的单词，保证了对数级别的查找效率。

相似度计算

理论部分

在实际使用中，由于某些特性可能出现在几乎所有的图片中，这些图片本质上并没有提供太大的贡献。在文本检索中，存在存在类似问题。因此在文本检索中，常用的一种做法称为 TF-IDF（Term Frequency–Inverse Document Frequency）或译频率-逆文档频率。TF 部分的思想是，某单词在一个图像中经常出现，它的区分度就高。另一方面，IDF 的思想是，某单词在字典中出现的频率越低，则分类图像时区分度越高。

通过 TF-IDF 求得每个点的权重之后，就可以通过指定的方式计算两张图片词袋向量的距离了，这里例举 L1 范数的形式。

实验分析与评述

增加字典规模

当字典规模增加时，无关图像的相似性明显变小了。而相似的图像虽然分值也略微下降，但相对于其他图像的评分，却变得更为显著了。这说明增加字典训练样本是有益的。

相似性评分的处理

对任意两个图像，我们都能给出一个相似性评分，但是只利用这个分值的绝对大小，并不一定有很好的帮助。譬如说，有些环境的外观本来就很相似，像办公室往往有很多同款式的桌椅；另一些环境则各个地方都有很大的不同。考虑到这种情况，我们会取一个先验相似度，它表示某时刻关键帧图像与上一时刻的关键帧的相似性。然后，其他的分值都参照这个值进行归一化：

站在这个角度上，我们说：如果当前帧与之前某关键帧的相似度，超过当前帧与上一个关键帧相似度的 3 倍，就认为可能存在回环。这个步骤避免了引入绝对的相似性阈值，使得算法能够适应更多的环境。

关键帧的处理

在检测回环时，我们必须考虑到关键帧的选取。如果关键帧选得太近，那么导致两个关键帧之间的相似性过高，相比之下不容易检测出历史数据中的回环。所以从实践上说，用于回环检测的帧最好是稀疏一些，彼此之间不太相同，又能涵盖整个环境。
另一方面，如果成功检测到了回环，比如说出现在第 1 帧和第 n 帧。那么很可能第 n+1 帧， n+2 帧都会和第 1 帧构成回环。但是，确认第 1 帧和第 n 帧之间存在回环，对轨迹优化是有帮助的，但再接下去的第 n+1 帧， n+2 帧都会和第 1 帧构成回环，产生
的帮助就没那么大了，因为我们已经用之前的信息消除了累计误差，更多的回环并不会带来更多的信息。所以，我们会把“相近”的回环聚成一类，使算法不要反复地检测同一类的回环。

检测之后的验证

词袋的回环检测算法完全依赖于外观而没有利用任何的几何信息，这导致外观相似的图像容易被当成回环。并且，由于词袋不在乎单词顺序，只在意单词有无的表达方式，更容易引发感知偏差。所以，在回环检测之后，我们通常还会有一个验证步骤。

验证的方法有很多。其一是设立回环的缓存机制，认为单次检测到的回环并不足以构成良好的约束，而在一段时间中一直检测到的回环，才认为是正确的回环。这可以看成时间上的一致性检测。另一方法是空间上的一致性检测，即是对回环检测到的两个帧进行特
征匹配，估计相机的运动。然后，再把运动放到之前的 Pose Graph 中，检查与之前的估计是否有很大的出入。总之，验证部分通常是必须的，但如何实现却是见仁见智的问题。

与机器学习的关系

从词袋模型来说，它本身是一个非监督的机器学习过程——构建词典相当于对特征描述子进行聚类，而树只是对所聚的类的一个快速查找的数据结构而已。既然是聚类，结合机器学习里的知识，我们至少可以问：

是否能对机器学习的图像特征进行聚类，而不是 SURF、ORB 这样的人工设计特征进行聚类？
是否有更好的方式进行聚类，而不是用树结构加上 K-means 这些较朴素的方式？

结合目前机器学习的发展，二进制描述子的学习和无监督的聚类，都是很有望在深度学习框架中得以解决的问题。我们也陆续看到利用机器学习进行回环检测的工作。尽管目前词袋方法仍是主流，但我个人是相信未来深度学习方法很有希望打败这些人工设计特征
的，“传统”的机器学习方法。毕竟词袋方法在物体识别问题上已经明显不如神经网络了，而回环检测又是非常相似的一个问题。

3d系统误差分析 Ai智享结构光 3d 数码相机计算机视觉
系统标定重投影误差预估在计算机视觉和三维重建领域中，评估一个相机系统标定精度的重要指标。通过比较真实的三维点在图像中的投影位置与标定模型计算出的投影位置之间的差异，来衡量标定的准确性。以下是对这一概念的详细解析：什么是系统标定？系统标定(SystemCalibration)是指对一个视觉系统（例如单目相机、双目相机系统或结构光系统）进行参数标定的过程，包括：内参标定：相机的内部参数（如焦距、光心、
PCL点云处理算法汇总（C++长期更新低价精品版）点云侠' 点云学习算法 c++开发语言计算机视觉
可笑，我当然知道是抄袭的啊，还用你提醒？要不是你们审核不作为，我能抄这么明目张胆？？？目录一、点云滤波1、常用滤波器2、采样滤波3、裁剪滤波二、KD树与八叉树1、KD树2、八叉树三、点云配准粗配准精配准对应关系配准精度坐标转换刚体运动变换四、点云拟合分割1、RANSAC2、其他几何分割五、三维重建六、特征点与特征描述1、点云的属性2、关键点提取3、特征描述子七、基础函数1、common模块2、其他
深度学习特征提取魔改版太强了！发文香饽饽！深度之眼深度学习干货人工智能干货人工智能深度学习机器学习论文特征提取
要说CV领域经久不衰的研究热点，特征提取可以占一席，毕竟SLAM、三维重建等重要应用的底层都离不开它。再加上近几年深度学习兴起，用深度学习做特征提取逐渐成了主流，比传统算法无论是性能、准确性还是效率都更胜一筹。目前比较常见的深度学习特征提取方法有基于transformer、基于CNN、基于LSTM以及基于GAN，都发展的比较成熟。但为了追求更快速、准确、鲁棒的特征点提取，研究者们开始致力于改进深度
**深度融合未来——DI-Fusion：开启在线三维重建新篇章** 余靖年Veronica
深度融合未来——DI-Fusion：开启在线三维重建新篇章在三维世界探索的前沿，一项名为DI-Fusion的技术正悄然掀起一波科技浪潮。由清华大学的JiahuiHuang、Shi-ShengHuang等人共同研发，这项创新成果已在CVPR2021上大放异彩，它的出现标志着在线隐式三维重构领域的重大突破。项目介绍重塑三维视觉新纪元DI-Fusion，又称为深度融合，是一项基于RGB-D流数据的新型在
Unique3D：开启单张图片三维重建新篇章余靖年Veronica
Unique3D：开启单张图片三维重建新篇章Unique3DOfficialimplementationofUnique3D:High-QualityandEfficient3DMeshGenerationfromaSingleImage项目地址:https://gitcode.com/gh_mirrors/un/Unique3D在当今高速发展的科技领域中，三维重建技术正以惊人的速度改变着我们的视
unity3d 大地图接壤_多人紧密交互场景下的多视角人体动态三维重建方法与流程... weixin_39947908 unity3d 大地图接壤
本发明属于计算机视觉和图形学领域，具体讲，涉及人体关键点检测、追踪和人体三维模型重建方法。背景技术：在计算机视觉和计算机图形学中，无标记人体运动捕捉已经成为一个热门并且具有挑战性的热点问题，其主要任务是通过跟踪视频中移动对象的运动来恢复动态时间一致的3D形状。最近十年以来单人运动捕捉方法取得了巨大的进步，然而当前的方法需要对相机进行设置或处于一个受控的工作室环境中，并且依赖于良好的图像分割技术。在
通俗易懂学nerf——初识nerf 四个字通俗易懂学nerf 人工智能自动驾驶 python
nerf，听起来像是一个神秘的魔法词汇，但它其实是一种前沿且超酷的技术！它是能让你从二维世界“跃升”到三维空间的神奇技术。想象一下，你手里有一张平面的照片，上面的风景、建筑都是扁平的，仿佛缺少了生命力。但有了NERF三维重建，这一切都变得鲜活起来！它就像是个超级魔术师，轻轻一挥，那张平面的照片就变成了立体的三维模型，仿佛你可以走进去，感受那里的空气、触摸那里的物体。nerf是怎么做到的呢？其实它的
NeRF——基于神经辐射场的三维场景重建和理解知来者逆数字人 NeRF 3D重建 3d 计算机视觉人工智能
概述三维重建是一种将物理世界中的实体转换为数字模型的计算机技术。其基本概念是通过对物理世界中的物体或场景进行扫描或拍摄，并使用计算机算法将其转换为三维数字模型。抽象意义上的三维模型指的是：形状和外观的组合，并且可以渲染成不同视角下真实感强烈的RGB图像。三维重建技术可以应用于许多领域，如建筑设计、游戏开发、虚拟现实等。通过三维重建技术，可以快速、准确地获取物体的几何形状、纹理、颜色等信息，从而实现
【视觉三维重建】【论文笔记】Deblurring 3D Gaussian Splatting CS_Zero 论文阅读
去模糊的3D高斯泼溅，看Demo比3D高斯更加精细，对场景物体细节的还原度更高，[官网]（https://benhenryl.github.io/Deblurring-3D-Gaussian-Splatting/）背景技术Volumetricrendering-basednerualfields：NeRF.Rasterizationrendering:3D-GS.Rasterization比vol
如果对类似汽车这种单体进行建模，围绕一圈拍摄，普通的手机或者相机拍摄的照片有足够的重叠度就能建模吗？不需要专业的设备可以吗？大势智慧汽车 3d 一问一答实景三维三维建模三维重建
答：可以建模。提供了完备的单体照片，在不需专业设备的情况下也可实现建模。重建大师是一款专为超大规模实景三维数据生产而设计的集群并行处理软件，输入倾斜照片，激光点云，POS信息及像控点，输出高精度彩色网格模型，可一键完成空三、自动建模和LOD构建。下载地址：武汉大势智慧-实景三维-云端建模-新型基础设施#实景三维##三维重建##重建大师##三维模型##三维建模##一问一答#
草图三维模型生成论文阅读整理 fisherisfish 论文阅读
论文终于接收啦！给草图研究做个收尾就去投实习！仅为个人整理，如有错误，欢迎指出！因为想给论文找创新点，所以需要大量阅读论文，部分论文会精读到实现的步骤，部分论文就记录一下思路。目前基于大模型和深度学习的三维重建任务可以简单分类为text23D，也就是文本控制转三维模型，一般使用语言模型提取文本的特征，然后去噪概率扩散模型生成多视角图像，最后再用NeRF进行三维重建，例如Dreamfusion、Ma
基于激光点云操作可视化界面云杂项 python 3d 创业创新
基于激光点云操作可视化界面使用说明书第一章系统概述基于激光点云操作可视化界面是进行点云文件综合处理的GUI界面，包括计算点云文件中心点、点云文件体素化、点云文件的三维重建和点云文件网格化等模块。主要功能是快速的对点云文件进行读入，展示和处理，通过GUI界面对点云文件进行数据的提取和展示。该GUI界面可以对点云文件的加工和处理的各个环节进行快速计算、统一展示和有效保存，为之后对3D点云文件底层快速处
PyQt Python 使用 VTK ITK 进行分割三维重建医学图像可视化系统流程恋恋西风 Python pyqt python VTK ITK
效果：重建流程：1.输入可以读取DICOM，niinrrd等数据设置读取器以加载DICOM图像系列。使用itk::GDCMImageIO作为DICOM图像的输入输出接口。使用itk::GDCMSeriesFileNames获取指定路径下的所有DICOM文件名。使用itk::ImageSeriesReader读取DICOM图像序列，并将其作为3D图像存储。2.分割创建itk::ThresholdIm
三维重建阈值分割 3D可视化医学图像分割 CT图像分割及重建系统可视化编程技术及应用恋恋西风 VTK 毕业设计和论文 qt 三维重建 VTK ITK 图像分割
一、概述此系统实现了常见的VTK四视图，实现了很好的CT图像分割，可以用于骨骼，头部，肺部，脂肪等分割，，并且通过三维重建实现可视化。使用了第三方库VTK，ITK实现分割和生不重建。窗口分为（横断面）、冠状面、矢状面，和3D窗口；包含了体绘制和面绘制；效果：CT分割重建二、开发环境操作系统：Windows10:工具：Qt5.12.4+VisualStudio2017，使用开源库：VTK-8.1IT
Depth Anything放入MVS中？ cashap27149 算法
这是DepthAnything的深度值depth，这个depth通过depth=depth_anything(image)求得。但想要把这个深度值depth嵌入到三维重建算法框架中，并不是一件容易得事情，拿OpenMVS举例，下图是OpenMVS输出深度图的函数。OpenMVS的深度值保存在depthMap中，我们来看看depthMap的具体结构，可以看到OpenMVS使用TImage模板类实例化
3DCaricShop: A Dataset and A Baseline Method for Single-view 3D Caricature Face Reconstruction 理想很丰满，现实很骨感 #单视图三维人脸重建计算机视觉深度学习神经网络
目录1.文章概述2.相关工作2.1关于数据集2.2关于单视图三维重建3.本文核心方法3.13DCaricShop数据集3.2提出的baseline方法进行三维重建3.2.1概述3.2.2流程1.参数化建模（PCA）2.隐式三维重建3.3D关键点预测4.关键点引导的模型匹配3.2.3VC-GCN（视图协同图卷积网络）1.初始化2.图卷积4.最终效果1.文章概述3DCaricShop指的是文章提出的一
KinectFusion论文品读自信侠
KinectFusion:Real-timedensesurfacemappingandtracking论文链接：https://ieeexplore.ieee.org/document/6162880参考视频：KinectFusion和ElasticFusion三维重建方法-付兴银https://www.bilibili.com/video/av6060335/参考博文：https://www.
[图形学/三维重建]大白话推导-摄像机内参(Intrinsic)、外参、3D物体坐标变换成2D Bartender_Jill Graphics图形学笔记 3d 图形渲染算法游戏引擎 ue5 动画
文章目录前言一、基础知识了解1.13D场景to2D图像1.2矩阵运算表达1.3摄像机坐标系原点设置二、内参矩阵三、外参总结前言参考资料https://www.bilibili.com/video/BV1Ae41127Yf?p=2一、基础知识了解在日常生活中，光线与物体界面的交互，构成了我们眼里的图像。但是为什么只有眼睛有成像，而像墙壁/桌子等这些平面上不会成像呢？比如我举着一张纸在半空中，周围环境
图像处理入门：OpenCV的基础用法解析 kadog By GPT 图像处理 opencv 人工智能计算机视觉
图像处理入门：OpenCV的基础用法解析引言OpenCV的初步了解深入理解OpenCV：计算机视觉的开源解决方案什么是OpenCV？OpenCV的主要功能1.图像处理2.图像分析3.结构分析和形状描述4.动态分析5.三维重建6.机器学习7.目标检测OpenCV的应用场景OpenCV的安装基本图像操作图像的读取与显示图像的基本信息图像的保存图像处理技巧图像转换边缘检测特征检测与匹配引言OpenCV（
计算机视觉中的Homography单应矩阵应用小结 CS_Zero SLAM 计算机视觉CV 计算机视觉 slam 几何学
计算机视觉中的Homography（单应）矩阵应用小结Homography矩阵在StructurefromMotion(SfM)或三维重建、视觉SLAM的初始化过程有着重要应用，本文总结了单应矩阵出现场景与常见问题求解。文章目录计算机视觉中的Homography（单应）矩阵应用小结单应矩阵的推导单应矩阵的求解与分解位姿问题单应矩阵的推导一般地，单应模型出现的前提条件是空间点分布在同一个平面上，例外
三维重建衡量指标记录我宿孤栈人工智能 #视觉相关深度学习目标检测计算机视觉
1、完整性比率CompletenessRati(CR)完整性比率完整性比率是用于评估三维重建质量的指标之一，它衡量了重建结果中包含的真实物体表面或点云的百分比。完整性比率通常是通过比较重建结果中的点云或三维模型与真实或标准点云或模型之间的重叠来计算的。具体计算步骤可能如下：定义真实模型和重建模型：首先，需要有一个真实的或标准的三维模型或点云，以及一个重建的三维模型或点云（由三维重建技术生成）。计算
第十一篇【传奇开心果系列】Python的OpenCV技术点案例示例：三维重建传奇开心果编程 Python库OpenCV 技术点案例示例短博文 python 计算机视觉 opencv
传奇开心果短博文系列系列短博文目录Python的OpenCV技术点案例示例系列短博文目录一、前言二、OpenCV三维重建介绍三、基于区域的SGBM示例代码四、BM（BlockMatching）算法介绍和示例代码五、基于能量最小化的GC（GraphCut）算法介绍和示例代码六、相机标定介绍和示例代码七、特征提取与匹配介绍和示例代码八、三角测量介绍和示例代码九、通过特征匹配和RANSAC（Random
OpenCV学习记录——特征匹配 KAIs32 树莓派——OpenCV opencv 学习人工智能嵌入式硬件计算机视觉
文章目录前言一、暴力匹配步骤分析二、代码分析前言特征匹配是一种图像处理技术，用于在不同图像之间寻找相似的特征点，并将它们进行匹配。特征匹配在计算机视觉和图像处理领域中具有广泛的应用，包括目标识别、图像拼接、三维重建等。一、暴力匹配步骤分析暴力匹配是一种简单直接的匹配方法，它遍历所有特征点的描述符，并计算它们之间的距离。然后根据距离进行排序，选择距离最短的特征点作为匹配点。虽然暴力匹配方法简单，但在
科普类——进行基线设计、系统测试和优化的立体视觉软件与工具（七） JANGHIGH 科普类无人驾驶自动驾驶
科普类——进行基线设计、系统测试和优化的立体视觉软件与工具（七）在立体视觉领域，有许多立体视觉软件和工具可以帮助工程师进行基线设计、系统测试和优化。以下是一些常用的立体视觉软件和工具：Meshroom：这是一个基于AliceVision摄影测量计算机视觉框架的免费开源三维重建软件。Meshroom可以处理大规模的图像数据集，进行立体视觉重建。OpenMVG(OpenMultipleViewGeom
三维重建开源函数库或者工具冰清-小魔鱼遥感 GIS 计算机视觉目标检测人工智能
三维重建使用摄影测量、计算机视觉技术，利用立体视觉恢复真实相机姿态，获取现实物体的三维信息，并进行虚拟三维场景重现。1、OpenDroneMapODM是一个基于航空影像的三维重建集成工具箱，利用多幅航空影像恢复相机姿态和3D场景，可以生产点云、三维贴图模型、正射影像、数字表面模型、数字高程模型等，提供Web接口，支持CUDA加速，基础函数库使用OpenSfM,OpenMVS,PDAL,Entwin
三维重建方法3D gaussian splatting与NeRF的区别和异同 Soumes 3d 计算机视觉人工智能深度学习机器学习
最近学习了一些三维重建相关的内容，目前比较主要的重建流派就是3DGS以及NeRF，NeRF作为2020年发布的文章轰动一时，影响深远，有很多NeRFbased的相关工作在这些年涌现。3DGS作为2023年的newtalkofthetown，其在保证合成质量的情况下能够以数倍乃至数十倍的速度碾压许多NeRFbased的方法，因此得到了广泛关注。这篇文章从几个角度比较了NeRF（最初的版本）和3Dga
【3DGS】从新视角合成到3D Gaussian Splatting UnderTurrets 图形渲染计算机视觉 3d
文章目录引言：什么是新视角合成任务定义一般步骤NeRF的做法NeRF的三维重建NeRF的渲染3DGS的三维重建从一组图片估计点云高斯点云模型球谐函数参数优化损失函数和协方差矩阵的优化高斯点的数量控制(AdaptiveDensityControl)新的问题3DGS的渲染：快速可微光栅化3DGS的限制引言：什么是新视角合成任务定义新视角合成(NovelViewSynthesis)，属于计算机视觉领域，
三维重建经典论文合集汇总深蓝学院人工智能三维重建视觉
三维重建涉及计算机视觉、图形学等多门知识，是一套非常复杂的系统。经典三维重建系统包括整个pipeline从相机标定、基础矩阵与本质矩阵估计、特征匹配到运动恢复结构（SFM），从SFM到稠密点云重建、表面重建、纹理贴图。其中，熟悉SFM的工程师已经是行业内的佼佼者，能掌握稠密点云重建与表面重建的工程师更是凤毛麟角。图1经典三维重建系统pipeline三维重建是当下计算机视觉的一个研究热点，虽然从业者
【三维重建】双目立体视觉 Patrick star` 人工智能
通过极几何可以求得极线，现在我们需要将左边的图变成右边的平行视图。所有的极线都经过极点(e/e')，如果极点位于无穷远处，那所有的极线都平行。(极几何的基础知识可以参考这篇文章：【三维重建】对极几何-CSDN博客)平行视图中，可以利用视差就得深度，视差越小深度越深。如何得到平行视图呢？
【三维重建】三角化 Patrick star` 数码相机
三角化要解决的问题是：已知两个相机的内参K、K'、相机之间的旋转平移矩阵R、t以及匹配点p、p'，如何求得P点的三维坐标？线性解法C++代码实现:https://github.com/ldx-star/Triangulation.git
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL

视觉 SLAM 十四讲 —— 第十二讲 回环检测

视觉 SLAM 十四讲 —— 第十二讲 回环检测

回环检测概述

回环检测的意义

方法

准确率和召回率

词袋模型

字典

字典的结构

相似度计算

理论部分

实验分析与评述

增加字典规模

相似性评分的处理

关键帧的处理

检测之后的验证

与机器学习的关系

你可能感兴趣的:(三维重建)

视觉 SLAM 十四讲 —— 第十二讲回环检测

视觉 SLAM 十四讲 —— 第十二讲回环检测