生活因你而火热

[IROS 2018]移动机器人同时估计自身位姿和物体位姿

Semantic Mapping with Simultaneous Object Detection and Localization

论文地址：https://arxiv.org/abs/1810.11525
论文视频：https://www.youtube.com/watch?v=W-6ViSlrrZg

简介

作者提出同时进行目标检测和位姿估计，利用一段连续的图像帧，这个图像帧和slam不同之处在于它是对一个场景的扫描，运动的幅度可能很小，就在一个场景附近各个角度扫的一段图形序列，然后在机器人运动的时候通过ORBSLAM定位机器人自己的位置，利用faster-rcnn对物体进行目标检测，通过粒子滤波进行物体的位姿估计，使用提出的CT-Map方法来对检测结果进行纠正，得到更准确的检测结果和物体的位姿。

目标

使机器人能够在物体层面上对世界进行语义映射，其中世界的表示是对物体类别和位姿的置信度。随着神经网络物体检测的不断进步，作者为语义映射提供了更强大的构建模块。然而，由于训练数据集的偏差和多样性不足，这种物体检测在野外经常是嘈杂的。并且对来自此类网络的错误检测保持鲁棒性。作者将物体类别建模为生成推理的隐藏状态的一部分，而不是对检测器给出的类标签做出选择。
考虑到运动式RGB-D观测，作者的目标是推断解释观测结果的物体类别和位姿，同时考虑物体之间的上下文关系和物体位姿的时间一致性。在语义映射期间显式地建模物体-物体上下文关系，而不是假设每个物体在环境中是独立的。简单来说就是相同类别的物体比不同类别的物体更容易共同出现。此外，应加强物理合理性，以防止物体相互交叉，以及漂浮在空中。
物体位姿的时间一致性在语义映射中也起着重要作用。物体可以保留在过去观察的位置，或者随着时间的推移逐渐改变它们的语义位置。在遮挡的情况下，建模时间一致性可能有助于部分观察物体的定位。通过时间一致性建模，机器人可以获得物体永久性的概念，例如，即使没有直接观察物体，也相信物体仍然存在。

图1 每列显示环境的RGB图像，以及由检测和定位物体组成的相应语义映射。

创新点

考虑到语义映射中的环境和时间因素，作者提出了环境时间映射（CT-MAP）方法来同时检测物体并通过运动的RGB-D相机观测定位它们的6D位姿。将语义映射问题利用概率表示为物体类别和位姿的置信度估计问题。使用条件随机场（CRF）来建模物体之间的上下文关系和物体位姿的时间一致性。 CRF模型中的依赖性包括以下方面：
1）潜在语义映射变量和观测结果之间的兼容性，
2）物体之间的上下文关系
3）物体位姿的时间一致性。
作者提出了一种基于粒子滤波的算法，在CT-MAP中进行生成推理。

核心思想

使用一个个向量（物体的位置和概率）来代表场景中的物体。针对每个物体向量存在的概率，作者用粒子滤波和CRF来更新。基本的思想是利用不同帧之间的同一物体在空间位置的一致性来更新物体存在的置信度。用概率来表示物体存在的置信度的好处就是，即使机器人即使一段时间内没有识别出这个物体，这个物体还是一定概率和粒子的形式再场景中存在的。

方法

作者提出CT-Map的方法。 CT-Map方法保持了对观察场景中物体类别和位姿的置信度。假设机器人通过外部定位程序（例如ORB-SLAM）在环境中定位。该语义地图由一组N个物体组成 $O$ = { $o^{1}$ ， $o^{2}$ ，···， $o^{N}$ }。每个物体 $o^{i}$ = { $o^{c}$ ， $o^{g}$ ， $o^{ψ}$ }包含物体类别 $o^{c}∈C$ ，物体几何结构 $o^{g}$ 和物体位姿 $o^{ψ}$ ，其中 $C$ 是物体类别的集合 $C$ = { $c_{1}$ ， $c_{2}$ ，…， $c_{n}$ }。
在t时刻，机器人的位置为 $x_{t}$ 。机器人的观测值为 $z_{t}$ = { $I_{t}$ ， $S_{t}$ }，其中 $I_{t}$ 是观察到的RGB-D图像， $S_{t}$ 是语义测量值。语义测量值 $s_{k}$ = { $s^{s}_{k}$ ， $s^{b}_{k}$ } ∈ $S_{t}$ ，由物体探测器得到，其中包含：
1）物体检测记录矢量 $s^{s}_{k}$ ， $s^{s}_{k}$ 中的每个元素表示每个物体类别的检测置信度，
2）二维边界框 $s^{b}_{k}$
机器人位置 $x_{t}$ 和观测值 $z_{t}$ 是已知的。物体集合 $O$ 是未知变量。作者对物体之间的环境依赖关系以及每个独立物体随时间变换的时间一致性建模。说白了就是在不同时刻，不同的位置对相同的物体进行观测。

图2 语义映射问题的模型

作者是如何建模的？

语义映射的后验概率表示为：

其中Z是归一化常数，并且在t时刻应用于物体 $o^{i}$ 的动作由 $u^{i}_{t}$ 表示。 $Φ_{p}$ 是预测势能（建模物体姿态的时间一致性）。 $Φ_{m}$ 是测量势能（给定物体的三维网格的观察模型）。 $Φ_{c}$ 是环境势能（捕获物体之间的上下文关系）。

如何建模时间一致性？

具体取决于物体是否在视野中。如果物体在视野中，将动作 $u$ 建模为连续随机变量，其遵循具有零均值和小方差Σ的高斯分布。该假设将三维中的小物体移动预测建模为：

所以预测势能表达为：

当物体 $o^{i}$ 很长一段时间内不在视野中时，它可以位于相同位置或移动到不同位置。物体 $o^{i}$ 仍然处于最后一次观测到的位置的概率是时间的函数。为了考虑物体 $o^{i}$ 可以移动到其他位置的事实，作者用离散随机变量{ $u_{stay}$ ; $u_{move}$ }对时间动作 $u^{i}$ 进行建模。具体来说， $u_{stay}$ 表示没有操作，物体停留在同一位置， $u_{move}$ 表示使用移动操作，物体被移动到其他位置。而这些高层次的动作遵循一定的分布 $p(u^{i}，Δt）$ 。

其中 $r_{1}，r_{2}$ 是常数， $Δ t$ 是没有观察到物体 $o^{i}$ 的持续时间。随着Δt的增加， $u_{stay}$ 的概率衰减，最终 $p（u_{stay}; Δt）= r_{1}$ ，当 $Δ t$ 趋于无穷大时。对于不同的物体 $o^{i}$ ，控制衰减速度的系数 $μ^{i}$ 是不同的。作者在实验中为不同的物体提供了探索式 $μ^{i}$ ，而这些系数也可以使用Toris等人的介绍的方法来学习。

如何给定物体三维网格的观察模型？

物体的测量势能表示为：

作者使用非零常数δ来说明物体不在视野中的情况。 $g(o^{i}_{t};x_{t} ;z_{t} )$ 测量观测值 $z_{t}$ 和 $o^{i}_{t}$ ， $x_{t}$ 之间的兼容性。

其中 $h（o^{i}_{t}; s^{s}_{k}）$ 是检测置信度向量 $s^{s}_{k}$ 对类别 $o^{c}_{t}$ 置信度的打分。函数 $I$ 评估两个边界框的最小面积上的交集。 $b（o^{i}_{t}; x_{t}）$ 是基于 $x_{t}$ 的图像空间中投影 $o^{i}_{t}$ 的最小封闭边界框。
假设已知物体的三维网格模型。函数 $f（o^{i}_{t}; x_{t};I_{t}）$ 计算投影的 $o^{i}_{t}$ 和 $I_{t}$ 在边界框 $b（o^{i}_{t}; x_{t}）$ 内的相似性。如果机器人之前观测过物体 $o^{i}$ ，对 $o^{i}$ 的置信度表明它处于机器人当前的视野范围内。如果机器人无法检测到物体 $o^{i}$ ，则该物体可能被遮挡，在这种情况下，使用 $g（o^{i}_{t};x_{t}; z_{t}）= f（o^{i}_{t}; x_{t}; I_{t}）$ 来估计物体潜在的位置。

如何捕获物体之间的上下文关系？

所有环境中的物体类别之间存在共同的上下文关系。例如，杯子出现在桌子上会比出现在地板上更频繁，鼠标在键盘旁边会比在咖啡机旁边出现得更频繁。作者将这些共同的上下文关系称为类别级的上下文关系。在特定环境中，某些物体实例之间存在上下文关系。例如，电视总是放在某个桌子上，麦片盒通常存储在特定的柜子中。作者将特定环境中的这些上下文关系称为实例级上下文关系。
作者手动将类别级上下文关系编码为模型的先验知识，也可以从公共场景数据集中学习。由于实例级上下文关系在不同环境中是变化的，因此必须随着时间的推移学习特定环境的关系。环境势能由类别级势能 $Φ_{cat}$ 和实例级势能 $Φ_{ins}$ 组成。

将 $Φ_{c}$ （ $o^{i}_{t}$ ; $o^{j}_{t}$ ）建模为混合高斯模型， $Φ_{cat}$ （ $o^{i}_{t}$ ; $o^{j}_{t}$ ）和 $Φ_{ins}$ （ $o^{i}_{t}$ ; $o^{j}_{t}$ ）各自为高斯分量。在实验中，手动设计 $Φ_{cat}$ 作为先验知识，并通过贝叶斯更新 $Φ_{ins}$ 。设计 $Φ_{cat}$ 时应遵循两个原则：
1）简单的物理约束，例如不允许物体交叉，物体不应该悬浮在空中，
2）属于同一类别的物体对，比不同类别的物体对更经常同时出现。

粒子滤波的算法

实验和效果

使用Faster R-CNN 作为物体探测器。给定RGB-D观测的RGB通道，应用物体检测器并从区域提出网络中获取边界框，以及相应的类别得分向量。然后对这些边界框使用非最大抑制，并合并具有大于0.5的交叉联合（IoU）的边界框。
在所有实验中，作者使用等式5中的 $w_{1} = w_{2} = 0.5$ 来同等地处理类别级和实例级的势能。如果一个物体在无限长时间内没有被观察到，假设物体在相同的位置或不同位置的概率是相同。因此，在等式3中使用 $r_{1}= r_{2} = 0.5$ 。

物体检测

作者使用Faster R-CNN物体探测器的噪声物体探测，而CT-Map可以通过将物体类别建模隐藏状态的一部分来纠正一些错误探测。为了评估CT-Map的物体检测性能，在数据集中的每个RGB-D序列的末尾处，对场景中所有物体进行六自由度位姿估计，并将它们投射回该序列中的每个相机帧上，以生成带有类别标签的边界框。通过考虑不同的势能集合来进行两个语义映射过程：
1）时间映射（T-Map）：考虑CRF模型中的预测势能;
2）环境时间映射（CT-Map）：考虑CRF模型中的预测和环境势能。
在观测中，T-Map和CT-Map均包括测量势能。
作者使用mAP作为物体检测指标。如下表所示，T-Map通过结合预测和观察势能改进了Faster R-CNN，并且CT-Map通过另外结合环境势能进一步改善了性能。Faster R-CNN在测试场景中表现不佳，因为训练数据不一定涵盖测试时遇到的差别。虽然通过提供更多的训练数据可以进一步提高Faster R-CNN的性能，但是CT-Map在训练受限的情况下提供了更具有鲁棒性的目标检测
作者场景数据集上的mAP:

在某些情况下，由于遮挡，Faster R-CNN检测到的物体不可靠。如果之前在环境中观测过一个物体，通过对物体的时间一致性进行建模，来预测物体可以去的位置。因此，即使由于遮挡而未触发对物体的检测，该方法仍然可以定位物体并声明检测。但是，如果物体存在很严重的遮挡且深度观测缺少物体足够的几何信息，无法对物体进行定位。

位姿估计

对于数据集中的每个RGB-D序列，定位最后看到每个物体的帧，并使用已知的相机矩阵将深度帧投影回3D点云。然后，手动标记物体的ground truth六自由度位姿。之后将每个RGB-D序列末尾估计出的物体位姿与ground truth进行比较。
位姿估计精度由 $accuracy=N_{correct}/N_{total}$ 测量，其中 $N_{correct}$ 是正确定位的物体数量， $N_{total}$ 是数据集中存在的物体总数。如果物体位姿估计误差小于在某个位置误差阈值 $Δ t$ 和旋转误差阈值 $Δ θ$ ，则称该物体被正确地定位。 $Δ t$ 是欧几里德距离的平移误差， $Δ θ$ 是方向上的绝对角度差。对于对称物体，忽略关于对称轴的旋转误差。
作者应用迭代最近点（ICP）和快点特征直方图（FPFH）算法作为六自由度物体位姿估计的基准。对于数据集中的每个RGB-D序列，作者采用标记帧的3D点云，并根据ground truth边界框裁剪它们。这些裁剪点云作为观察结果与物体3D网格模型一起被提供给基准。 ICP和FPFH用于将物体模型登记到裁剪的观测点云。允许最大迭代次数为50000次。

图3 CT-Map的物体位姿估计

CT-Map显着优于ICP和FPFH。由于生成推断反复地对物体位姿假设进行采样并根据观察结果对其进行评估，因此CT-Map不会像ICP和FPFH这样的判别方法受到局部最小值的影响。

作者提供的视频，机器人带动RGBD相机移动的过程，采集到多帧数据（RGBD序列），粒子在不断运动，在数据末尾，粒子收敛到物体的范围内。

本文作者：耗子
github：https://github.com/lh641446825
知乎：https://www.zhihu.com/people/hao-zi-meng-jian-mao/activities
博客园：https://www.cnblogs.com/lh641446825/

欢迎关注和转载！

相机位姿估计：基于四个特征点的精准姿态解算童嘉航Denley
相机位姿估计：基于四个特征点的精准姿态解算【下载地址】相机位姿估计1根据四个特征点估计相机姿态随文Demo本资源文件提供了一个基于OpenCV的相机位姿估计Demo，主要功能是根据四个特征点来估计相机的姿态。通过该Demo，您可以学习如何使用OpenCV库中的相关函数来实现相机位姿的估计项目地址:https://gitcode.com/open-source-toolkit/df72a项目介绍在计
Cartographer源码阅读---MapBuilder的声明与构造虾眠不觉晓, cartographer Cartographer SLAM
前面已经谈到了Cartographer中添加轨迹的方法和传感器的数据流动走向。我们注意到，在添加轨迹的时候，除了添加位姿估计器还有采样器，订阅回调函数之外，最重要的是通过map_builder_bridge添加了一条轨迹，其他的都是为它服务的。咱们这节详细看看MapBuilder这个Cartographer的核心。开始一条轨迹添加轨迹是开启Cartographer的大门.顾名思义,添加轨迹就是Ad
python 实现一个完整的基于Python的多视角三维重建系统，包含特征提取与匹配、相机位姿估计、三维重建、优化和可视化等功能 pk_xz123456 仿真模型 python 数码相机开发语言
多视角三维重建系统下面我将实现一个完整的基于Python的多视角三维重建系统，包含特征提取与匹配、相机位姿估计、三维重建、优化和可视化等功能。1.环境准备与数据加载首先安装必要的库：pipinstallopencv-pythonopencv-contrib-pythonnumpymatplotlibplotlyscipyimportcv2importnumpyasnpimportmatplotli
毫米波雷达点云SLAM系统小彭律师 python
毫米波雷达点云SLAM系统基于毫米波雷达点云数据的三维SLAM(同步定位与建图)系统，用于狭窄环境如室内和地下隧道的三维建图。项目概述本项目实现了一个完整的SLAM系统，利用毫米波雷达采集的点云数据进行实时定位和环境三维重建。系统特别针对狭窄空间环境进行了优化，适用于GPS信号不可用的室内和地下场景。主要功能毫米波雷达点云数据预处理与滤波特征提取与匹配点云配准与位姿估计回环检测全局优化三维环境重建
高翔《视觉SLAM十四讲》第七章视觉里程计3d-2d位姿估计代码详解与理论解析 xMathematics 3d 视觉slam 机器人无人驾驶无人机人工智能
高翔《视觉SLAM十四讲》第七章代码详解与理论解析一、三维空间位姿估计核心算法实现在视觉SLAM领域，3D-2D位姿估计是确定相机在三维空间中位置和姿态的关键技术。本部分将详细解析其工程实现框架，同时说明代码模块的划分逻辑。代码整体结构清晰，各模块分工明确，主要包含特征匹配、3D点构建、PnP问题求解以及位姿优化等部分。算法流程从读取两幅图像和对应的深度图开始，通过特征匹配模块找出两幅图像中的匹配
相机-IMU联合标定：IMU标定吃水果不削皮视觉组合导航 ROS VIO
文章目录简介标定工具安装IMU标定工具code_utilsIMU标定工具imu_utils：标定数据录制IMU标定简介在VINS（Visual-InertialNavigationSystem，视觉惯性导航系统）中，IMU标定是确保系统高精度运行的关键环节。IMU（惯性测量单元）本身存在多种误差，如果不进行标定，会直接影响VINS的位姿估计精度，甚至导致系统失效。以下是IMU标定的核心作用及其影响
【Gen6D位姿估计】在Linux环境下的复现日志辰尘_星启机器学习--深度学习位姿估计 linux 运维人工智能感知 pytorch
写在前面算法和代码框架均来自港大的课题组gen6d介绍页面我只是拿来做一个毕设，答辩结束后会遵循GPL协议开放所有代码这篇博客仅作为开发日志，记录一下部署过程中的各种问题和解决方法，仅供学习讨论此外，不得不说，这项工作的识别估计的效果不错，但是效率有点太低了，在GTX1650上处理一帧数据需要1.07秒笔者环境模块版本号Ubuntu22.04CUDA11.8,python3.8pytorch2.4
KISS-ICP核心代码解析大山同学代码解析前端算法 javascript SLAM 机器人感知定位
文章目录1.核心函数1.GetCorrespondences函数2.BuildLinearSystem函数ICP的高斯牛顿解法公式推导3.高斯牛顿法求解1.核心函数该RegisterFrame函数的主要功能是对输入的点云帧进行配准。它将输入的点云帧与体素哈希图进行匹配，以初始位姿估计为起点，通过迭代最近点（ICP）算法来计算从初始位姿到最终配准位姿的变换矩阵。若体素哈希图为空，则直接返回初始位姿估
yolo位姿估计实验 jarreyer YOLO
目录介绍实验过程2.1数据集下载2.2模型和数据配置文件修改2.3模型训练参考链接1.介绍1.1简介YOLOv8-Pose是基于YOLOv4算法的姿势估计模型，旨在实现实时高效的人体姿势估计。姿势估计在计算机视觉领域具有重要意义，可广泛应用于视频监控、运动分析、健康管理等领域。1.2背景传统的姿势估计方法常需复杂网络架构和大量计算资源，导致实时性不佳。YOLOv8-Pose通过对YOLOv4算法进
25/2/16 ＜算法笔记＞ DirectPose 青椒大仙KI11 视觉计算机视觉
DirectPose是一种直接从图像中预测物体的6DoF（位姿：6DegreesofFreedom）姿态的方法，包括平移和平面旋转。它在目标检测、机器人视觉、增强现实（AR）和自动驾驶等领域中具有广泛应用。相比于传统的位姿估计方法，DirectPose试图简化复杂的处理流程，采用端到端的方式直接从图像中输出位姿参数。1.DirectPose是什么？DirectPose是一种端到端的神经网络方法，旨
【ORB-SLAM2：三、地图初始化】 KeyPan ORB-SLAM2 数码相机计算机视觉人工智能机器学习深度学习算法
地图初始化是视觉SLAM系统的关键步骤之一，它是整个系统运行的起点。初始化的主要任务是从输入图像数据中构建一个初始地图，为后续的相机位姿估计和场景重建提供基础。无论是单目、双目还是RGB-D相机，地图初始化的结果直接决定了系统的鲁棒性和精度。3.1为什么需要地图初始化3.1.1地图初始化的重要性定义初始参考坐标系地图初始化为SLAM系统提供了一个全局参考坐标系，使后续的位姿估计和地图扩展能够在一致
激光SLAM--(8) LeGO-LOAM论文笔记 lonely-stone slam 激光SLAM 论文阅读
论文标题：LeGO-LOAM：LightweightandGround-OptimizedLidarOdometryandMappingonVariableTerrain应用在可变地形场景的轻量级的、并利用地面优化的LOAMABSTRACT轻量级的、基于地面优化的LOAM实时进行六自由度位姿估计，应用在地面的车辆上。强调应用在地面车辆上是因为在这里面要求雷达必须水平安装，而像LOAM和LIO-SA
论文解读《Zero-Shot Category-Level Object Pose Estimation》类别级6D位姿估计 ZYLer_ 6D位姿估计人工智能计算机视觉
论文：《Zero-ShotCategory-LevelObjectPoseEstimation》该文整体感觉不难，处理流程比较新颖，可以重点参考。Code：https://github.com/applied-ai-lab/zero-shot-pose（48star）摘要：解决问题：实例级姿态估计的问题。=>**零样本（也就是预测未见过的物体（没有该实例的数据标记和CAD模型），类别级）**预测来
论文解读《Gen6D: Generalizable Model-Free 6-DoF Object Pose Estimation from RGB Images》小样本6D位姿估计 ZYLer_ 6D位姿估计机器学习人工智能计算机视觉 3d 深度学习
论文：《Gen6D:GeneralizableModel-Free6-DoFObjectPoseEstimationfromRGBImages》Code：https://github.com/liuyuan-pal/gen6d（469star）摘要：现有的可推广姿态估计器要么需要高质量的对象模型，要么在测试时需要额外的深度图或对象掩码，这大大限制了其应用范围。为了满足实际应用中的需求，我们认为姿态
《LIO-SAM阅读笔记》IMU作用总结 Jiqiang_z LOAM系列阅读笔记 SLAM学习笔记机器人 linux 算法人工智能笔记
LIO-SAM作为一个Lidar和IMU为主的紧耦合框架，两者缺一不可，这里总结一下LIO-SAM中IMU起到的作用：1.利用当前帧Lidar里程计作为起点，结合IMU预积分，得到IMU里程计信息。此处IMU里程计是以IMU的频率向外发送位姿估计，提高了SLAM系统里程计的发送频率。2.利用IMU预积分对Lidar每帧点云进行运动去畸变。3.利用IMU里程计信息对Lidar每帧点云的位姿作初始化（
点云从入门到精通技术详解100篇-基于点云配准的无纹理堆叠物体 6D 位姿估计（下）格图素书算法人工智能
目录4.3点云精配准4.3.1ICP算法原理4.3.2ICP加速方法4.4堆叠物体位姿估计
实现scan-to-map匹配，使用ICP的C++代码实现（1）稻壳特筑 C++激光SLAM c++算法开发语言
目录加载当前激光扫描数据和地图点云。初始化位姿估计。执行ICP匹配。判断是否收敛获取最优位姿。计算匹配误差。输出匹配结果。实现的主要步骤如下：加载当前激光扫描数据和地图点云。初始化位姿估计。执行ICP匹配。判断是否收敛获取最优位姿。计算匹配误差。输出匹配结果。具体实现细节如下：加载当前激光扫描数据和地图点云使用PCL的pcl::io::loadPCDFile()函数。初始化位姿估计使用pcl::P
【研究】聚焦型光场相机等效多相机模型及其运动恢复结构应用光场视觉数码相机 3d 光场
摘要:聚焦型光场相机在运动恢复结构(SFM)和场景重建等领域中的作用日益显现。但是传统SFM算法因聚焦型光场相机具有特殊的结构而难以直接应用。针对这一问题提出一种完整的聚焦型光场相机等效多目相机模型。在此基础上，利用传统多目相机的SFM算法，给出了适用于聚焦型光场相机的位姿估计算法示例和点云三角化算法示例。最后，通过仿真实验和真实场景重建实验验证了本文等效多目相机模型和SFM算法的正确性，进而表明
《LIO-SAM阅读笔记》-为何要引入增量式里程计？ Jiqiang_z LOAM系列阅读笔记笔记机器人算法
前言：LIO-SAM在后端中同时维护着两个里程计，一个是增量式里程计，一个是优化后的里程计，其中优化后的里程计是经过imu、回环、gps因子图联合优化后的结果，是整个系统中最准确的位姿估计，那么为什么还需要维护增量式里程计呢？以下是我的理解，不一定正确，如有错误，或者不一样的见解欢迎在评论区留言讨论。我认为最主要的原因（或者是最大的用途）是需要用增量式里程计信息结合imu预积分信息进行联合的因子图
ParticleSfM：Exploiting Dense Point Trajectories for Localizing Moving Cameras in the Wild——论文笔记 m_buddy #3D Reconstruction 论文阅读计算机视觉人工智能
参考代码：particle-sfm1.概述介绍：基于运动恢复的重建算法其前提假设是所处的是静态场景，但在实际过程中该假设可能是不成立的，这就会导致位姿估计不准确和场景重建出错。为了处理动态场景问题，文章引入视频帧间光流信息作为输入，通过帧间光流信息构建多帧之间初始逐像素传导路径，并由这些路径通过网络推理得到场景中众多路径是否为属于运动物体，同时可以根据路径分类信息得到场景中运动目标的“分割mask
六.卡尔曼滤波器开发实践之六: 无损卡尔曼滤波器(UKF)进阶-白话讲解篇 okgwf 滤波器卡尔曼滤波器多传感器数据融合人工智能
本系列文章主要介绍如何在工程实践中使用卡尔曼滤波器,分七个小节介绍:一.卡尔曼滤波器开发实践之一:五大公式二.卡尔曼滤波器开发实践之二:一个简单的位置估计卡尔曼滤波器三.卡尔曼滤波器(EKF)开发实践之三:基于三个传感器的海拔高度数据融合四.卡尔曼滤波器(EKF)开发实践之四:ROS系统位姿估计包robot_pose_ekf详解五.卡尔曼滤波器(EKF)开发实践之五:编写自己的EKF替换robot
视觉SLAM十四讲——第四讲李群与李代数 chenying66 SLAM 李群和李代数
@《视觉SLAM十四讲》知识点与习题《视觉SLAM十四讲》第四讲知识点整理+习题正在学习SLAM相关知识，将一些关键点及时记录下来。知识点整理本讲主要解决**什么样的相机位姿最符合当前观测数据**问题。一种典型的方法是把它构建成一个优化问题，求解最优的R，t，使得误差最小化。通过李群-李代数间的转换关系，可以将位姿估计变成无约束的优化问题，简化求解方式群：一种集合加上一种运算的代数结构。满足以下条
利用pvnet训练自制数据集童鸢计算机视觉深度学习机器人
对6D位姿估计感兴趣的小伙伴可以加我，拉到位姿估计交流群，群里会不定期组织文献、代码和技术的视频交流分享传送门1.利用ODT方法生成数据集2.在pvnet的data文件夹下新建一个文件夹，名为custom3.调整custom文件格式（1）将1中的JPEGImage、mask、transforms、Gold6.ply、intrinsics.json复制到custom文件夹下；（2）将JPEGImag
6d位姿估计---制作自己的LINEMOD数据集过程记录（labelfusion）童鸢 6DoF 6自由度位姿估计自动驾驶人工智能
经过对很多方法的测试，终于搞出来一个有效的方法，见以下连接：有效的方法对6D位姿估计感兴趣的小伙伴可以加我，拉到位姿估计交流群传送门--------------分割线---------------0.环境配置按照连接中的方法进行配置即可。遇到的问题问题1在安装ros的时候注意ubuntu操作系统版本，librealsense2与驱动和realsense-ros包版本，有可能会出现realsense
单目slam--尺度漂移书慕遮
单目slam单目slam的基本流程为：初始化---pnp---pnp其中初始化是为了统一尺度，由于通过2d-2d对极几何约束求解相机位姿时会产生尺度问题，即无法确定真实尺度（1.每两帧计算的位姿采用的尺度可能都不一致2.与真实世界的尺度比例无法获得）。所以解决1问题，将前两帧采用的尺度统一为后续位姿估计的尺度。通过三角法得到对应点的世界坐标。然后通过pnp即3d-2d的方法，由世界坐标和图像坐标计
自动驾驶：传感器初始标定 dueen1123 学习
手眼标定机器人手眼标定Ax=xB（eyetohand和eyeinhand）及平面九点法标定Ax=xB问题求解，旋转和平移分步求解法手眼标定AX=XB求解方法（文献总结）基于靶的方法相机标定(1)ApriTag(2)棋盘格：cv::findChessboardCorners(3)品字格激光雷达标定(1)激光雷达反射板在线标定这里面的在线标定指相对路面的位姿估计1.广角前视相机(1)基于LK稀疏光流求
Robot Grasp[Code with paper] cocapop 机器人机器人
题目/摘要重点DeepObjectPoseEstimationforSemanticRoboticGraspingofHouseholdObjects使用合成数据为机器人训练深度神经网络操纵有望获得几乎无限数量的预标记训练数据。合成数据一直在弥合所谓的现实差距，因此在合成数据上训练的网络在暴露于现实世界时可以正常运行数据。我们在6-DoF位姿估计的背景下探讨了现实差距单个RGB图像中的已知对象。我
论文阅读：Estimating Odometry Scale and UWB Anchor Location Based on Semidefinite ProgrammingOptimization 独孤西论文阅读论文阅读
前言2022年发表在RAL上的一篇论文，研究了里程计系统的未知度量尺度估计问题和超宽带(Ultra-wideband，UWB)锚点在环境中的三维定位问题。这篇文章的作者ThienHoangNguyen是UWB-VIO领域的主要研究人员，从最近一年的成果来看，他的研究方向从之前的注重UWB-VIO融合定位转变到现在的对UWB-VIO中更加精细问题的处理，以及UWB-VIO传感器融合在其他位姿估计场景
px4+vins+ego单机鲁棒飞行二（外部位姿估计篇) Nankel Li 路径规划深度学习计算机视觉自动驾驶
px4+vins+ego单机鲁棒飞行二（外部位姿估计篇）一、使用px4的EKF2（扩展卡尔曼）估计测试过程及结果：二、使用px4的LPE估计测试过程及结果：三、用EKF2还是LPE？官网这么解释的3.1EKF缺点3.2优点3.3总结四、更改源码五、2021年12月2日更新参考：px4官方WIKI一、使用px4的EKF2（扩展卡尔曼）估计EKF2使用扩展卡尔曼滤波器进行三维的姿态，位置/速度以及风的
计算机视觉基础（9）——相机标定与对极几何猪猪的超超计算机视觉基础计算机视觉图像处理相机标定对极几何
前言本节我们将学习相机标定和对极几何两部分的内容。在相机标定部分，我们将学习直接线性变换（DirectLinearTransform,DL）,张正友标定法（Zhang’sMethod）和Perspective-n-Point(PnP)这三种方法。在对极几何部分，我们将了解极平面、基线、极点和极线等概念，以及相机相对位姿估计和对极约束。一、相机标定1.1相机内外参内参：描述相机本身的属性，同一相机，
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后