[论文笔记]Probabilistic data association for semantic slam

1. introduction

读完总结，感觉这篇文章的主要思想是，提出数据关联，并根据语义的类别结果计算数据关联的概率，然后在优化过程中，根据之前的数据关联作为概率权重，引入与目标检测位置有关的误差项，从而让目标检测来辅助位姿估计。

数据关联和识别问题是不同类别之间离散的，而传统SLAM是连续优化的。

本文的目标是利用目标检测，整合尺度(metric)信息和语义(semantic)信息，用于传感器位姿估计和地图点位置估计。具有语义标签的路标点能够用于解决传统几何SLAM的两个问题：一是数据关联问题，即匹配传感器的观测与路标。二是回环检测，即用于识别之前已经去过的地方。

传统基于位姿图的非线性优化方法，依赖于运动模型和观测模型的线性化，而对于离散的目标检测结果，这就成为了一个问题。

本文的贡献如下：

紧密结合了惯性传感器、几何信息、语义观测，于一个单独的优化框架之中。
对于联合的尺度-语义SLAM问题，将其分解为两个子问题：连续的位姿优化问题，离散的数据关联和语义标签优化问题。

2. probabilistic data association in SLAM

文章给了一个SLAM问题的定义：

拥有一组地图点： $L=\{l_m\}_{m=1}^{M}$

一组传感器观测： $Z=\{z_k\}_{k=1}^{K}$

一组相机位姿： $X=\{x_t\}_{t=1}^{T}$

一组数据关联： $D=\{(\alpha_k,\beta_k)\}_{k=1}^{K}$

这里数据关联表示，在第k个观测下，从位姿 $x_{\alpha _k}$ 观测到路标点 $l_{\beta_k}$ 。正常情况下这个从哪能观测到什么是不知道的，比如我从某个观测k的位姿上观测，可能观测到椅子的一个点，也可能观测到杯子的一个点。感觉这里把位姿和观测联想在一起会容易理解一点，观测是在不同位姿下进行的，而它所能观测到的物体是不确定的。这里数据关联和地图点坐标、相机位姿一样，也是待优化的随机变量。

传统SLAM是估计地图点的位姿和相机位姿，但没有考虑数据关联。引入数据关联后，SLAM问题就变成：

$x,l,d=argmax_{x,l,d}logp(z|x,l,d)$

文章提出了三种求解方法:

第一种是分为两步：

$D'=argmax_D p(D|X^{0},L^{0},z)$

$X',L'=argmax_{X,L} logp(Z|X,L,D')$

即先根据初始的位姿和路标以及观测，求出数据关联的最优值，再把这个求出的数据关联当作已知条件，求出路标和位姿的最优值。

比如，先根据初始的位姿和路标，确定观测到的是椅子的点还是桌子的点，从而根据椅子或桌子在地图种的位置，来估计相机位姿。

这种方法存在的问题是，如果估计错了数据关联，则对后续的位姿和路标点估计影响很大。同时，模糊的观测会被舍去，以避免错误的数据关联估计，那这些信息就完全无法发挥作用了。

第二种方法解决了第一个问题，它采用迭代的坐标下降法：

$D^{i+1}=argmax_D p(D|x^{i},L^{i},Z)$

$x^{i+1},L^{i+1}=argmax_{X,L}logp(Z|X,L,D^{i+1})$

这种方法使用上一次得到的位姿和路标点估计，来估计当前的数据关联，再用数据关联值估计当前的位姿和路标点。在位姿和路标点的估计改善后，可以重新优化数据关联。但模糊数据的问题没有解决。

第三种方法解决了以上两个问题，它使用所有数据关联的整体分布：

$x^{i+1},L^{i+1}=argmax_{X,L}E_D(logp(Z|X,L,D)|x^{i},L^{i},Z)=argmax_{X,L}\sum_{D}p(D|X^{i},L^{i},Z)logp(Z|X,L,D)$

这里使用了期望测量似然，计算了数据关联项的期望。要优化的变量是当前位姿 $x^{i+1}$ 和路标点 $L^{i+1}$ ，因变量是 $l o g p (Z ∣ X, L, D)$ ，即优化位姿和路标使这个log似然最大。

第二个等式表示的是，在上一帧位姿和路标的估测条件下，求数据关联期望下的最大似然。

第三个等式是其展开， $p(D|X^{i},L^{i},Z)$ 是求得这种数据关联D的概率，在这个概率下，乘以用这个D求得的似然概率，再对所有D的情况求和。

因为是平均意义下的，所以可以克服之前的问题，不需要只决定一种数据关联，而抛弃其他可能性。

这个方法还可以写成：

$argmax_{X,L}\sum _{D} \sum_{k=1}^{K} p(D|X^{i},L^{i},Z) logp(z_k|x_{\alpha_k,l_{\beta_k}})=argmax_{X,L} \sum_{k=1}^{K} \sum_{j=1}^{M} w_{kj}^{i}log p(z_k|x_{\alpha_k},l_{j})$

$w_{kj}^{i}=\sum_{D\in D(k,j)} p(D|X^{i},L^{i},Z)$

第二个等式是把每一个可能的数据关联种，所有观测拆开计算。第三个等式，则是对于所有观测，每一个观测所有数据关联求和计算，其中j表示的是这个观测看到的路标的可能值。即，对于第k个观测，从这个位姿看到的路标点存在M个可能性，这个可能性就是权重w。

这个公式还可以转换成矩阵写法，以便于在算法中实现。

也可以用EM算法来对其进行求解：

E步：计算 $w_{kj}^{i}$ ，即数据关联的概率分布
M步：根据E步的权重，求最大期望似然log的位姿和路标估计

3. semantic SLAM

设定路标点 $l\in L$ 包含以下信息：

位置（3*1），三维点坐标
类别（1*1），类别集合中的一个离散值

为了估计路标点和相机位姿，使用了以下三种信息：

惯性测量
几何特征点
物体的语义观测

3.1. inertial information

假定传感器包含：一个单目摄像头、一个IMU。

每个关键帧内，传感器的信息包括：

传感器的6自由度位姿
速度
IMU偏差值

在关键帧的间隔之间，传感器收集了一个IMU测量集合 $I_t$ ，包括线性加速度和旋转角速度。

3.2. geometric information

使用ORB特征估计关键帧之间的转换矩阵。

假定特征点的数据关联已知。(什么意思？)

3.3. semantic information

对于每一关键帧，语义检测结果为 $S_t$ ，包含多个目标检测结果 $s_k$ ，每隔目标检测结果包含：

$s_k^{c}$ ：目标检测类别
$s_k^{s}$ ：置信度
$s_k^{b}：$ bounding box

对于已知的数据关联，测量的似然为：

$p(s_k|x_{\alpha _k},l_{\beta_k})=p(s_k^{c}|l_{\beta_k}^{c})p(s_k^{s}|l_{\beta_k}^{c},s_k^{c})p(s_k^{b}|x_{\alpha _k},l_{\beta_k}^{p})$

其中：

$p(s_k|x_{\alpha _k},l_{\beta_k})$ : 是在当前数据关联下，得到k检测结果的概率
$p(s_k^{c}|l_{\beta_k}^{c})$ ：是路标点类别为 $c_1$ 条件下，检测结果为 $c_2$ 的概率。（这里两个类别相等吗？）
$p(s_k^{s}|l_{\beta_k}^{c},s_k^{c})$ ：是在路标点和观测的类别下，得到当前置信度的概率
$p(s_k^{b}|x_{\alpha _k},l_{\beta_k}^{p})$ ：是在当前数据关联下，路标点位姿为p，检测出当前bounding的概率。

4. semantic SLAM using EM

优化过程中，潜变量还有：数据关联、离散的路标类别标签。文中将连续变量和离散变量分开优化。

数据关联中，几何的数据关联（在某个位置看到哪个空间点？）根据特征点跟踪算法得到，即传统VO；语义的数据关联（在某个位置看到哪个类别的点），作为潜变量一起优化。

假设：数据关联在所有关键帧之间是相互独立，并服从均匀分布的。

优化的目标是：

这里，优化的变量是 $x^{i+1}$ 、 $l_{1:M}^{i+1}$ ，就是第i+1帧的位姿和路标位置。

看这个式子几层求和的含义，最内的 $j$ 是对所有路标点（几何下），中间层是对于t帧里每一个目标检测结果，最外层是对于所有关键帧。

即，对所有关键帧中，每一帧的所有目标检测，的所有地图点下的概率求和。

再看w，w是权重。先看求和部分，内层是对所有的数据关联，外层是这个路标点j所有的类别，即某个坐标点类别下，得到这一组数据关联。求和里面的K，其分子是对于，上一个位姿和路标，及某一个数据关联下，得到这一组语义结果的概率。分母对所有的数据关联和坐标点类别求和，即归一化系数。

整体来看，优化的公式是看了所有关键帧，对于某一个关键帧st，看其中的所有检测结果。在一个检测结果下，看所有的地图点。对于某一个地图点，可以确定一个<位姿-地图点>数据关联。对于这个数据关联的所有可能情况，以及所有可能的这个路标点的类别，计算权重。

接下来用EM算法求解：

4.1. E步，Object class and data association

这一步是计算上面的权重 $w_{k,j}^{t}$ 。计算对于每一个迭代i的权重，需要求和所有的数据关联（k,j）。包括每一个测量k和路标j，再对所有关键帧t求和。然后，用求得的第i时的权重，去帮助优化M步中的i+1时的路标和位姿。

同时，可以更新路标点的类别预测结果，这里是用SLAM的结果改善深度网络的语义结果（这里先不看了… 不是很重点的感觉）：

4.2. M步，Pose graph optimization

得到了权重，可以开始优化i+1时的位姿和路标点。可以解读上面那个argmin的公式了。

优化部分使用了位姿图。

节点：待优化的变量 $x^{i}$ ， $l^{i}$
边：一些因子，与单个代价函数的成分相关联。（就是公式里的减号分开的三个部分）

每一个因子都与一个代价函数相关联，然后整体优化，它们都有这样的形式：

$v'=argmin_v \sum_{f\in F}f(V)$

这里的v是与代价函数有关的一组变量，这个代价函数是这个因子相对应的。就是分开每条边优化变量。

这里用来三种因子：

4.2.1. semantic factors

定义语义相关的factor: $f_{k,j}^{s}(X_{i},l_j)$ ，表示测量k中，在相机位姿i下，观测地图点j，得到的语义结果s。

其loss定义为：

$f_{k,j}^{s}(X_{i},l_j)=-w_{kj}^{t,i}logp(s_k|x_t,l_j)$

在语义部分我们知道：

$p(s_k|x_{\alpha _k},l_{\beta_k})=p(s_k^{c}|l_{\beta_k}^{c})p(s_k^{s}|l_{\beta_k}^{c},s_k^{c})p(s_k^{b}|x_{\alpha _k},l_{\beta_k}^{p})$

因为 $l_c$ 也就是路标点的类别是固定的，因此，关于置信度 $s^{s}$ 和类别 $s^{c}$ 的部分是常量，可以省略。

$f_{k,j}^{s}(X_{i},l_j)=-w_{kj}^{t,i}logp(s_k^{b}|x_t,l_j)=||s_k^{b}-h_{\pi}(x_t,l_j)||^{2}_{R/W}$

中间等式是只保留关于bounding box的部分，后面一项中，h是把可见地图点重投影到当前帧，然后和bounding box求距离差，根据它的均值和协方差计算的范数。

就是说，语义相关的loss，是地图中重投影回来和当前帧检测结果的距离loss。所以这里，目标检测结果辅助了相机位姿估计？

4.2.2. geometric factors

这个因子是：

这里计算的是对于追踪的特征点的误差，第二个公式计算的是，三维地图点投影到当前帧，和当前帧追踪的特征点的距离差，就是重投影误差吧…。

后面还线性化了一哈。

4.2.3. inertial factors

这里是引入了IMU的测量结果，包括旋转速度位置，得到了一个因子。

至此，就得到全部图优化模型，是由上面辣个优化的argmin公式逐项转化来的。变成了一个最小二乘问题。（其实就是按照每个传感器的实际情况化简了一下?）

你可能感兴趣的:(SLAM,论文笔记)

【视觉三维重建】【论文笔记】Deblurring 3D Gaussian Splatting CS_Zero 论文阅读
去模糊的3D高斯泼溅，看Demo比3D高斯更加精细，对场景物体细节的还原度更高，[官网]（https://benhenryl.github.io/Deblurring-3D-Gaussian-Splatting/）背景技术Volumetricrendering-basednerualfields：NeRF.Rasterizationrendering:3D-GS.Rasterization比vol
[论文笔记] Transformer-XL 心心喵论文笔记 transformer 深度学习人工智能
这篇论文提出的Transformer-XL主要是针对Transformer在解决长依赖问题中受到固定长度上下文的限制，如Bert采用的Transformer最大上下文为512（其中是因为计算资源的限制，不是因为位置编码，因为使用的是绝对位置编码正余弦编码）。Transformer-XL能学习超过固定长度的依赖性，而不破坏时间一致性。它由段级递归机制和一种新的位置编码方案组成。该方法不仅能够捕获长期
【自动驾驶】自动驾驶地图构建方法与工具小结 CS_Zero 自动驾驶人工智能
自动驾驶地图构建小结概述制作流程主要利用定位与建图算法（组合导航，视觉、激光SLAM等），融合多种传感器数据，构建高精度、高分辨率的三维语义地图，将要素矢量化，构建要素间的关联关系，通过质检确保质量可靠，形成地图引擎（服务、API）以满足自动驾驶系统的需求。底图构建底图构建存在两大类方法，点云建图与视觉建图。点云建图一般面向高精度采集设备，采用高线束激光雷达，硬件成本高。一般使用高精度组合导航进行
Android D8 编译器和 R8 工具，【一篇文章搞懂】安卓开发top Android android java eclipse 移动开发
android.enableIncrementalDesugaring=false.android.enableDesugar=false2.1Lambda表达式Java8中一个重大变更是引入Lambda表达式。publicclassLambda{publicstaticvoidmain(String[]args){logDebug(msg->System.out.println(msg),"He
SimpleShot: Revisiting Nearest-Neighbor Classification for Few-Shot Learning 论文笔记头柱碳只狼小样本学习
前言目前大多数小样本学习器首先使用一个卷积网络提取图像特征，然后将元学习方法与最近邻分类器结合起来，以进行图像识别。本文探讨了这样一种可能性，即在不使用元学习方法，而仅使用最近邻分类器的情况下，能否很好地处理小样本学习问题。本文发现，对图像特征进行简单的特征转换，然后再进行最近邻分类，也可以产生很好的小样本学习结果。比如，使用DenseNet特征的最近邻分类器，在结合均值相减（meansubtra
多模态相关论文笔记靖待大模型人工智能论文阅读
(cilp)LearningTransferableVisualModelsFromNaturalLanguageSupervision从自然语言监督中学习可迁移的视觉模型openAI2021年2月48页PDFCODECLIP(ContrastiveLanguage-ImagePre-Training)对比语言图像预训练模型引言它比ImageNet模型效果更好，计算效率更高。尤其是zero-sho
特斯拉神器TeslaMate一键安装，终于来了 oakley0 car tesla 云服务器腾讯云
之前分享了teslamate的功能和简单安装方法，很多喜欢尝鲜的车友尝试了，但安装过程对不熟悉linux服务器的非码农来说还是有点小艰辛。趁这回双十一腾讯云重磅优惠，我也重新屯了服务器重装了一遍，现在把简化后安装过程、一键安装方法包括加密登录的方式分享一下。目录1.购买服务器2.登录服务器3.安装TeslaMate3.1切换管理员用户3.2一键安装TeslaMate-【简单模式】3.3一键安装Te
特斯拉神器TeslaMate一键安装，来了 oakley04 腾讯云阿里云云计算
之前分享了teslamate的功能和简单安装方法，很多喜欢尝鲜的车友尝试了，但安装过程对不熟悉linux服务器的非码农来说还是有点小艰辛。趁这回双十一腾讯云重磅优惠，我也重新屯了服务器重装了一遍，现在把简化后安装过程或一键安装方法分享一下。1.购买服务器以下三款服务器都可以，其中最推荐中间的2核4G8M带宽的三年198，还没入手请点击下面的入口链接：腾讯云运营活动-腾讯云https://curl.
TeslaMate特斯拉神器本地Docker部署实现无公网远程访问 nagiY てんさい docker 容器运维 sql
文章目录1.Docker部署TeslaMate2.本地访问TeslaMate3.Linux安装Cpolar4.配置TeslaMate公网地址5.远程访问TeslaMate6.固定TeslaMate公网地址7.固定地址访问TeslaMateTeslaMate是一个开源软件，可以通过连接特斯拉账号，记录行驶历史，统计能耗、里程、充电次数等数据。用户可以通过web界面查看车辆状态、行程报告、充电记录等信
Ubuntu环境搭建TeslaMate，特斯拉车友必备，可视化数据仪表！使用极空间Z4虚拟机喵不是白养的 ubuntu linux
能点进来的大概率都是特斯拉车友~~本篇记录一下使用极空间Z4家庭NAS搭建TeslaMate的全过程，使用极空间最近更新的虚拟机功能，在虚拟机中安装Ubuntu部署Docker。当然大家用PC虚拟机搭建也可以啦！至于为什么不用极空间自带的Docker功能，emmm并不好用。要是想要使用自带的docker来搭建，可以参照这个https://post.smzdm.com/p/az59px95/本人自学
使用Docker部署TeslaMate并结合内网穿透软件实现远程访问车辆数据比奥利奥还傲. docker 容器运维服务器 linux
文章目录1.Docker部署TeslaMate2.本地访问TeslaMate3.Linux安装Cpolar4.配置TeslaMate公网地址5.远程访问TeslaMate6.固定TeslaMate公网地址7.固定地址访问TeslaMateTeslaMate是一个开源软件，可以通过连接特斯拉账号，记录行驶历史，统计能耗、里程、充电次数等数据。用户可以通过web界面查看车辆状态、行程报告、充电记录等信
如何在本地服务器部署TeslaMate并远程查看特斯拉汽车数据无需公网ip 日出等日落内网穿透服务器汽车 tcp/ip
文章目录1.Docker部署TeslaMate2.本地访问TeslaMate3.Linux安装Cpolar4.配置TeslaMate公网地址5.远程访问TeslaMate6.固定TeslaMate公网地址7.固定地址访问TeslaMateTeslaMate是一个开源软件，可以通过连接特斯拉账号，记录行驶历史，统计能耗、里程、充电次数等数据。用户可以通过web界面查看车辆状态、行程报告、充电记录等信
伊朗藏红花前五个月出口增长33% 西域竹君斋
Iran’ssaffronexportsincreased33percentduringthefirstfivemonthsofthecurrentIraniancalendaryear(March21-August22)comparedtothesameperiodoftimeinthepastyear,accordingtothelatestdatareleasedbytheIslamicRe
如何实现基于图像与激光雷达的 3d 场景重建? 大势智慧 3d 人工智能计算机视觉三维建模激光点云
智影S100是一款基于图像和激光点云融合建模技术的高精度轻巧手持SLAM三维激光扫描仪。设备机身小巧、手持轻便，可快速采集点云数据；支持实时解算、实时预览点云成果，大幅提高内外业工作效率；同时支持一键生成实景三维Mesh模型，实现城市建筑、堆体、室内空间等场景的高逼真3d重建。以下是智影S100在国家游泳中心“水立方”进行实地采集的点云与模型成果展示：智影S100：水立方立面点云与模型成果分享，实
【论文笔记 · PFM】Lag-Llama: Towards Foundation Models for Time Series Forecasting lokol. 论文笔记论文阅读 llama
Lag-Llama:TowardsFoundationModelsforTimeSeriesForecasting摘要本文提出Lag-Llama，在大量时间序列数据上训练的通用单变量概率时间序列预测模型。模型在分布外泛化能力上取得较好效果。模型使用平滑破坏幂律（smoothlybrokenpower-laws）。介绍目前任务主要集中于在相同域的数据上训练模型。当前已有的大规模通用模型在大规模不同数
ROS目标跟随（路径规划、雷达、slam、定位）海风- ROS 小车跟随目标跟随雷达路径规划定位
ROS目标跟随（路径规划、雷达、地图、定位）最终效果展示一、总体launch文件1、打开已有地图2、组合小车的各个部分2.1惯性矩阵设置2.2小车底盘2.3摄像头2.4雷达2.5为机器人模型添加传动装置以及控制器2.6为机器人模型添加雷达配置2.7为机器人模型添加摄像头配置2.8为机器人模型添加kinect摄像头配置3、定位系统（amcl）4、路径规划（move_base）4.1全局路径规划与本地
ROS小车跟随海风- ROS 小车跟随目标跟随雷达
这篇的目的是方便自己复习总体流程1、gazebo仿真世界2、机器人模型3、slam建图4、定位5、路径规划6、小车跟随7、总体launch文件第一篇博客给出了总体代码：https://blog.csdn.net/m0_71523511/article/details/135610191第二篇博客改善了跟随的效果：https://blog.csdn.net/m0_71523511/article/d
【论文笔记】Unsupervised Learning of Video Representations using LSTMs 奶茶不加糖え lstm 深度学习自然语言处理
摘要翻译我们使用长短时记忆（LongShortTermMemory,LSTM）网络来学习视频序列的表征。我们的模型使用LSTM编码器将输入序列映射到一个固定长度的表征向量。之后我们用一个或多个LSTM解码器解码这个表征向量来实现不同的任务，比如重建输入序列、预测未来序列。我们对两种输入序列——原始的图像小块和预训练卷积网络提取的高层表征向量——都做了实验。我们探索不同的设计选择，例如解码器的LST
MOSSE算法论文笔记以及代码解释 five days 计算机视觉深度学习机器学习
论文《VisualObjectTrackingusingAdaptiveCorrelationFilters》代码github1.论文idea提出以滤波器求相关的形式，找到最大响应处的位置，也就是我们所跟踪的目标的中心，进而不断的更新跟踪目标框和滤波器。2.跟踪策略如图，根据初始帧圈出的目标框训练滤波器，最大响应处为目标框的中心点，当移动到下一帧时，根据滤波器求相关的算法获得最大响应值，进而得出下
【激光SLAM】激光的前端配准算法趴抖激光SLAM 激光SLAM SLAM 前端
文章目录ICP匹配方法（PointtoPoint）PL-ICP匹配方法（PointtoLine）基于优化的匹配方法（Optimization-basedMethod）优化方法的求解地图双线性插值拉格朗日插值法——一维线性插值相关方法（Correlation-basedMethod）帧间匹配似然场算法流程位姿搜索分枝定界算法引用在激光SLAM中，前端配准（FrontendRegistration）是
【Java万花筒】跨越云平台的无服务器开发：使用Java构建弹性、高效的应用 friklogff Java万花筒 serverless java python
无服务器计算平台的Java集成指南：AWSLambda、GoogleCloudFunctions、腾讯云函数和IBMCloudFunctions前言无服务器计算平台提供了一种方便、弹性和成本效益高的方式来运行代码，而无需关心底层基础设施的管理。在这篇文章中，我们将探讨如何使用Java语言与一些主要的无服务器计算平台集成，包括AWSLambda、GoogleCloudFunctions、腾讯云函数和
基于ORB-SLAM2与YOLOv8剔除动态特征点笨小古 SLAM学习 SLAM YOLO YOLOv8
基于ORB-SLAM2与YOLOv8剔除动态特征点以下方法以https://cvg.cit.tum.de/data/datasets/rgbd-dataset/download#freiburg3_walking_xyz数据集进行实验测试APE首先在不剔除动态特征点的情况下进行测试：方法1:segment坐标点集合逐一排查剔除利用YOLOv8的segment获取动态对象（这里指人person）所在
周三 2020-03-11 06:40 - 24:00 晴 05h34m 么得感情的日更机器
白天干事，晚上玩和总结，早睡早起概述早上6：40醒，然后开始日常任务：单词+口语+听力+学习强国。7:00到7:30躺床上看哔哩哔哩，发现一些好的SLAM视频。7:40下楼吃饭，8:30上楼练字。上午8:40到9:40看论文，9:45到10:00运动时间，10:00到11:15看论文。11:15到11:50玩哔哩哔哩。下午12:00吃午饭，12:30到13:00学习摄影技能。14:13-14:
Attention Is All Your Need论文笔记 xiaoyan_lu 论文笔记论文阅读
论文解决了什么问题？提出了一个新的简单网络架构——transformer，仅仅是基于注意力机制，完全免去递推和卷积，使得神经网络训练地速度极大地提高。Weproposeanewsimplenetworkarchitecture,theTransformer,basedsolelyonattentionmechanisms,dispensingwithrecurrenceandconvolution
视觉slam十四讲学习笔记（六）视觉里程计 1 苦瓜汤补钙视觉SLAM十四讲笔记机器学习 ubuntu
本文关注基于特征点方式的视觉里程计算法。将介绍什么是特征点，如何提取和匹配特征点，以及如何根据配对的特征点估计相机运动。目录前言一、特征点法1特征点2ORB特征FAST关键点BRIEF描述子3特征匹配二、实践：特征提取和匹配三、2D-2D:对极几何1对极约束2本质矩阵3单应矩阵四、实践：对极约束求解相机运动五、三角测量总结前言1.理解图像特征点的意义,并掌握在单幅图像中提取出特征点，及多幅图像中匹
相机—特点及区别 Dirschs 摄像头数码相机
1.相机种类RGB，RGB-D，单目，双目，sterro相机，实例相机2.相机特点2.1单目只使用一个摄像头进行SLAM，结构简单，成本低三维空间的二维投影必须移动相机，才能估计场景中物体的远近和大小单目SLAM估计的轨迹和地图与真实的相差一个因子2.2双目由两个单目相机组成，两个相机之间的距离(基线)是已知的根据基线估计每个像素的空间位置，距离估计：比较左右眼的图像室内+室外缺点：配置与标定较为
视觉SLAM十四讲学习笔记——第五讲相机与图像晒月光12138 视觉SLAM十四讲学习笔记自动驾驶计算机视觉人工智能
这一讲主要内容就是了解摄像机的成像模型以及OpenCV的使用。1.四种坐标系坐标系基本描述世界坐标系因为摄像机和物体可以随便摆放在空间中的任何位置，所以我们必须用一个固定的坐标系来描述空间中任何物体的位置和摄像机的位置和朝向，这个基准坐标系我们称之为世界坐标系。在计算机视觉中，我们通常把世界坐标系定义为摄像机坐标系或者所观测的物体的中心。摄像机坐标系摄像机坐标系的原点是摄像机的光心，X、Y轴分别平
视觉slam十四讲学习笔记（四）相机与图像苦瓜汤补钙视觉SLAM十四讲笔记相机机器学习
理解理解针孔相机的模型、内参与径向畸变参数。理解一个空间点是如何投影到相机成像平面的。掌握OpenCV的图像存储与表达方式。学会基本的摄像头标定方法。目录前言一、相机模型1针孔相机模型2畸变单目相机的成像过程3双目相机模型4RGB-D相机模型二、图像计算机中图像的表示三、图像的存取与访问1安装OpenCV2存取与访问总结前言前面介绍了“机器人如何表示自身位姿”的问题，部分地解释了SLAM经典模型中
移动机器人激光SLAM导航（五）：Cartographer SLAM 篇 Robot_Yue 自主探索导航学习 SLAM Cartographer 工程化调参
参考Cartographer官方文档Cartographer从入门到精通1.Cartographer安装1.1前置条件推荐在刚装好的Ubuntu16.04或Ubuntu18.04上进行编译ROS安装：ROS学习1：ROS概述与环境搭建1.2依赖库安装资源下载完解压并执行以下指令https://pan.baidu.com/s/1LWqZ4SOKn2sZecQUDDXXEw?pwd=j6cf$sudo
Serverless里FaaS与BaaS 久绊A 阿里云阿里云
目录什么是FaaS？什么是BaaS？什么是FaaS？FaaS即FunctionsasaService，函数即服务，是Serverless架构的一种形态，面向函数编程，基于事件驱动提供云服务之间端到端的解决方案。借助FaaS，开发人员可以快速构建任何类型的应用和服务，并且只需为任务实际消耗的资源付费。FaaS是Serverless模型中代码的托管计算服务。阿里云的函数计算、AWSLambda都是Fa
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他