冬瓜大侠

ORB-SLAM: A Versatile and Accurate Monocular SLAM System

[1] Mur-Artal R, Montiel J M M, Tardós J D. ORB-SLAM: A Versatile and Accurate Monocular SLAM System[J]. IEEE Transactions on Robotics, 2015, 31(5): 1147-1163.

为了方便阅读转自【泡泡机器人翻译专栏】ORB-SLAM：精确多功能单目SLAM系统(一) 同时做了一些小修改。

摘要

I. 引言

II. 相关工作

A、位置识别

B、地图初始化

C、单目SLAM

III. 系统架构

A、特征选择

B、三个线程：追踪、局部地图构建和闭环检测

C、地图点、关键帧及其选择标准

D、Covisibility Graph和Essential Graph

E、基于图像词袋模型的位置识别

IV. 地图自动初始化

V.跟踪

A、ORB特征提取

B、通过前一帧图像估计相机初始位姿

C、通过全局重定位来初始化位姿

D、跟踪局部地图

E、新关键帧筛选策略

VI. 局部地图构建

A、关键帧插入

B、地图点云筛选

C、新地图点云创建

D、局部BA

E、局部关键帧筛选

VII. 闭环检测

A、候选关键帧

B、计算相似变换

C、回环融合

D、Essential Graph优化

VIII. 实验

A、基于Newcollege数据集测试系统性能

B、基于TUM RGB-D标准库的定位精度

C、基于TUM RGB-D标准数据库的重定位

D、基于TUM RGB-D标准数据集测试算法的运行生命

E、基于KITTI数据集测试算法在大场景大回环下的性能

IX. 结论和讨论

A、结论

B、离散/特征SLAM方法与稠密/直接SLAM方法对比

C、未来的工作

附录：非线性优化

摘要

本文提出的ORB-SLAM算法是一个基于特征点的单目SLAM系统，可以实时运行在狭小的室内环境和宽阔的室外环境中。该系统对剧烈运动具有鲁棒性，支持宽基线的闭环检测和重定位，以及全自动初始化。该系统是我们基于近年来的优秀算法重新设计的一个全新算法，其中SLAM的所有环节：跟踪，构图、重定位和回环检测都采用了相同的特征，并选用合适的特征点和关键帧选取策略，使系统具有很好的鲁棒性，生成精简、可追踪的地图。只有当场景内容改变时，地图大小才会增加，因此可以支持在同一个场景下的持续定位。在文章最后，我们选择公共数据集中的27个图像序列进行了测试。相比目前最新的单目SLAM算法，本文提出的ORB-SLAM性能优势明显。为了使更多人获益，公布了源码。

I. 引言

众所周知，光束平差法（Bundle Adjustment，BA）能够用于相机定位和稀疏几何重建[1-2]，只要给定一个强大的匹配网络和好的初始估计，BA就能够给出精确的结果。但在很长的时间里，BA都被认为不适合于VSLAM之类的实时应用。VSLAM系统的目标是在重建环境的同时估计相机轨迹。目前，为了以较低的计算代价得到较精确的结果，实时SLAM系统必须为BA模块提供以下信息：

关键帧中场景特征（地图点云）的观测信息。
由于算法复杂度随关键帧数量的增加而增长，因此需要选择合适的关键帧以避免冗余。
强大的关键帧与特征点配置网络可以获得精确的定位结果，即关键帧的特征点要有显著的视差和大量的闭环匹配。
为关键帧位姿估计与特征点位置计算的非线性优化算法提供初值。
在构建局部地图的过程中，优化的关键是获得良好的可扩展性。
快速执行全局优化以实现实时闭环的能力。

BA第一次实时应用是在Mouragon等人[3]提出的视觉里程计算法中，其次是在Klein和Murray的突破性工作——以并行线程分别处理tracking和mapping的PTAM[4]算法中。尽管受制于小场景的应用，PTAM算法对关键帧的选择，特征匹配，点的三角化，相机位姿估计，追踪失败后的重定位非常有效。然而，由于缺少闭环检测和对遮挡场景的处理，再加上其视图不变性差，在地图初始化时需要人工干预等多个因素，使得PTAM算法的应用受到了严重的限制。

在本文中，我们基于PTAM算法的主要框架，采用 Gálvez-López 和 Tardós [5]提出的 place recognition（场景/位置识别）算法，Strasdat 等人[6]提出的 scale-aware loop closing（具备尺度感知的闭环检测）算法以及文献[7-8]中的大尺度操作中 Covisibility 信息的使用，重新设计了一种新的单目SLAM系统ORB-SLAM，本文的贡献主要包括：

对所有的任务采用相同的特征：追踪、地图构建、重定位和闭环检测。这使得我们的系统更有效率、简单可靠。采用的ORB特征[9]在没有GPU的情况下也有很好的实时性，且具有旋转不变性和光照不变性。
算法支持在宽阔环境中实时操作。covisibility graph 的使用使得特征点的跟踪与建图主要集中在局部共视区域，而与全局地图的大小无关。
使用Essential Graph来优化位姿实现回环检测。构建生成树，并由系统、闭环检测链接和 covisibility graph 的强边缘进行维护。
算法的实时相机重定位具有明显的旋转不变特性和光照不变性。这就使得点跟踪丢失后可以恢复，增强了地图的重用性。
提出了一种新的基于模型选择的自动初始化方法，可以对平面和非平面场景创建初始化地图。
提出了一种合适的方法来选择地图点云和关键帧，通过严格删选关键帧和地图点，剔除冗余信息，使得特征点的跟踪具备了更好的稳定性，从而增强算法的可持续操作性。这种选取策略增强了追踪的鲁棒性，同时舍弃了多余的关键帧加强了系统长时间操作性。

我们在公共数据集上对算法在室内和室外环境下的性能进行了详细的评估，包括手持设备、车辆和机器人。值得一提的是，与目前最新的直接法[10]相比——直接SLAM方法通过直接对像素点的灰度进行优化而不是最小化特征重投影误差，我们的方法能够实现更精确的摄像头定位精度。我们在文章的第IX-B部分讨论了基于特征的SLAM方法定位比直接法更准确的原因。

闭环检测和重定位的方法基于我们之前的论文[11]。系统最初的版本是论文[12]。本文中我们添加了初始化方法，Essential graph ，并完善了其他模块。我们详细了描述了系统的各个模块，并且开展了详细的实验验证。

据我们所知，这是目前最完整最可靠的单目SLAM系统，为了使更多人获益，我们将源码开放。视频演示和源码放在我们的项目网站上。

II. 相关工作

A、位置识别

Williams等人在综述[13]中比较了几种基于场景的位置识别方法，即图像到图像的匹配，这种方法在大环境下比地图到地图或图像到地图的方法更准确。在场景匹配方法中，基于bags of words（词袋）[14]技术的方法以其高效率脱颖而出，比如概率方法FAB-MAP[15]。DBoW2[5]则首次使用了BRIEF描述子[16]生成的二进制词袋和非常高效的FAST特征检测算法[17]。与我们目前在词袋算法中使用的SURF和SIFT特征相比，FAST算法的运算时间减小了至少一个数量级。尽管FAST系统运行效率高、鲁棒性好，但是采用BRIEF描述子不具有旋转不变性和尺度不变性，因而限制了系统只能运行在同一平面内（否则会造成尺度变化），闭环检测也只能从相似的视角中进行。在我们之前的工作[11]中，我们提出了一个使用ORB特征检测子的DBoW2词袋位置识别器。ORB特征是一种具有旋转不变性和尺度不变性的二进制特征，因此，用它生成的快速识别器具有较好的视角不变性。我们在4组不同的数据集上证实了该位置识别器的high recall和鲁棒性，从10K图像数据库中提取一个候选闭合回路（包括特征提取）的运算时间少于39ms。在本文中，我们提出了一种改进版本的位置识别方法，在查询数据库时采用covisibility信息，返回多个假设，而不仅仅是最佳匹配结果。

B、地图初始化

单目SLAM系统需要设计专门的策略来生成初始化地图，因为单幅图像不具备深度信息。解决这个问题的一种方法是一开始跟踪一个已知结构的对象[20]。在滤波方法中，可以使用逆深度参数化[21]来初始化深度高度不确定的点，理想情况下，该参数会在后期逐渐收敛到真值。最近Engel提出的半稠密方法[10]中就采用类似的方法将像素的深度信息初始化为一个高方差的随机值。

如果从两个视角来初始化特征，就可以采用以下两种方法：一种是假设局部场景在同一平面内[4]，[22]，然后利用Faugeras等[23]提出的方法用单应性矩阵来重构摄像头相对位姿。第二种是将场景建模为通用情况（不一定为平面），通过Nister提出的五点法[26]来计算本质矩阵[24],[25]，但该方法存在多解的问题。这两种摄像头位姿重构方法在低视差下都没有很好的约束，如果平面场景内的所有点都靠近摄像机的中心，则结果会出现双重歧义[27]。另一方面，非平面场景可以通过线性8点法[2]来计算基础矩阵，相机的相对位姿就可以无歧义地重构出来。

针对这一问题，我们在本文的第四部分提出了一个新的基于模型选择的自动初始化方法，对平面场景算法选择单应性矩阵，而对于非平面场景，选择基础矩阵。模型选择的方法可参考综述论文[28]。基于类似的理论，我们设计了一种启发式初始化算法，考虑到在接近退化情况（比如：平面，近平面，或是低视差）下选择基础矩阵进行位姿估计可能存在的问题，算法选择单应性计算。在平面的情况下，为了保险起见，如果解决方案存在双重歧义，算法将避免初始化，因为可能会因为选择错误而导致算法崩溃。因此，我们会延迟初始化过程，直到所选的模型在明显的视差下产生唯一解。

C、单目SLAM

单目SLAM最初采用滤波框架[20],[21],[29],[30]来建模。在滤波法中，每一帧都通过滤波器联合估计地图特征位置和相机位姿。这样做带来的问题是在处理连续帧图像上会导致计算资源浪费和线性误差累积。另一种是基于关键帧的SLAM框架，即采用少数筛选过的图像（关键帧）来构建地图，因为构图不再与帧率相关联，基于关键帧的SLAM方法可以进行消耗计算资源但是精度更高的BA优化。Strasdar等人[31]证明了在相同的计算资源消耗下，基于关键帧的SLAM方法比滤波器方法定位精度更高。

最具代表性的基于关键帧的SLAM系统可能是由Klein和Murray等人提出的PTAM算法[4]。PTAM第一次将相机追踪和地图构建拆分成两个并行的线程运行，并成功应用于小环境的实时增强现实中。文献[32]对PTAM算法进行了改进，增加了边缘特征、在跟踪过程中增加了旋转估计步骤，以及更好的重定位方法。PTAM中的地图点通过图像块与FAST角点匹配，因此这些点仅适合于特征跟踪，并不适合用于后期的位置识别。而实际上，PTAM算法并没有进行大闭环检测，其重定位也仅仅是基于关键帧低分辨率缩略图的相关性进行的，因此视角不变性较差。

Strasdat等人在文献[6]中提出了一个基于GPU实现的大尺度单目SLAM系统，该系统前端采用光流法，其次用FAST特征匹配和运动BA；后端是基于滑动窗口的BA。闭环检测通过具有相似性约束的（7自由度）位姿图优化来进行，该方法可以矫正在单目SLAM系统中出现的尺度偏移问题。在本文中，我们也将采用这种7自由度位姿图优化方法，并将其应用到我们的Essential Graph中，更多细节将在第三部分D节里面描述。

Strasdat等人在文献[7]中采用了PTAM的前端，但其跟踪部分仅在一个从covisibility graph提取的局部地图中进行。他们提出了一个双窗口优化后端，在内部窗口中连续进行BA，在有限大小的外部窗口中构建位姿图。然而，只有当外部窗口尺寸足够大到可以包含整个闭环回路的情况下，闭环检测才能起作用。在我们的算法中，吸收了Strasdat等人提出的基于covisibility的局部地图，并且通过covisibility map来构建位姿图的优势，重新设计前端和后端。另一个区别是，我们并没有使用特定的特征提取方法做闭环检测（SURF），而是基于相同的追踪和建图特征进行位置识别，获得具有鲁棒性的重定位和闭环检测。

Pirker等[33]提出了CD-SLAM方法，一个非常复杂的系统，包括闭环检测，重定位，大尺度操作以及对算法在动态环境运行所做的改进。但文中并没有提及地图初始化。无法复现导致我们无法对其精度、鲁棒性和大场景下的表现进行测试对比。

Song等[34]提出了使用ORB特征做追踪和滑窗BA作为后端的视觉里程计方法。相比之下，我们的方法更加全面，因为他们的算法中没有涉及全局重定位，闭环回路检测，而且地图也不能重用。他们还使用了相机到地面的真实距离来限制单目尺度漂移。

Lim等人在我们提交本文最初的版本[12]之后发表了论文[25]，他们也采用相同的特征进行跟踪、建图和闭环检测。但是，由于Lim等人的算法选择的BRIEF描述子不具备尺度不变性，因此其算法运行受限在平面轨迹上。他们的算法仅从上一帧关键帧开始跟踪特征点，因此访问过的地图不能重用（这样的处理方式与视觉里程计很像），存在系统无限增长的问题。我们在第三部分E小节里面与该算法进行了定性比较。

Engel等[10]提出了LSD-SLAM算法，该算法可以构建大场景半稠密地图，选择了直接法（优化也是直接通过图像像素灰度进行）而不是基于特征的BA。算法的结果让人印象深刻，其在没有GPU加速的情况下实时构建了一个半稠密地图，相比基于特征的稀疏SLAM系统而言，LSD-SLAM方法在机器人领域有更大的应用潜力。然而，该算法的运行仍然需要基于特征做闭环检测，且相机定位的精度也明显低于PTAM和我们的算法，相关实验结果我们将在第8部分的B小节中展示，对该结果的讨论在文章IX部分B小节进行。

Forster等[22]提出了介于直接法和特征法之间的半直接视觉里程计SVO方法。该方法不需要对每帧图像都提取特征点，能够以很高的帧率运行，在四轴飞行器上取得了令人惊叹的定位效果。然而，SVO算法没有闭环检测，且目前主要基于下视摄像头运行。

最后，我们想讨论一下目前的关键帧选择方法。视觉SLAM算法不可能选择所有的云点和图像帧运行BA。因此，Strasdat等[31]证明最合理的选择是在只保留非冗余关键帧的时候尽可能多地保留点。PTAM非常谨慎地插入关键帧以避免运算量增长过大。然而，这种限制性的关键帧插入策略在算法运行困难的情况下可能会导致追踪失败。在本文中，我们选择一种更为合适的关键帧插入策略，当算法运行困难的时候选择尽快地插入关键帧，然后在后期将冗余的关键帧删除以避免额外的计算成本。

III. 系统架构

A、特征选择

我们系统设计的中心思想是对SLAM系统的建图、跟踪、帧速率重定位以及闭环检测等模块都采用相同的特征，这将使得我们的系统更有效率，避免了像以往文章[6],[7]一样还需要额外插入一些识别性强的特征以用于后期的闭环检测。我们每张图像的特征提取远少于33毫秒，远小于目前的SIFT算法（~300ms）,SURF算法(~300ms)，或最近提出的A-KAZE算法（~100ms）。为了使算法的位置识别能力能更加通用化，我们需要提取的特征具备旋转不变性，而BRIEF和LDB不具备这样的特性。

为此，我们选择了ORB[9]特征，具有256位描述符的带方向的多尺度FAST角点。它们的计算和匹配速度非常快，同时具有视角旋转不变性。这样可以在更宽的基准线上匹配他们，增强了BA的精度。我们已经在[11]中演示了基于ORB特征的位置识别方法的良好性能。需要申明的是，虽然本文的方案中采用ORB算法，但所提出的技术并不仅限于该特征。

B、三个线程：追踪、局部地图构建和闭环检测

ORB-SLAM: A Versatile and Accurate Monocular SLAM System_第1张图片

图1 ORB-SLAM系统框架，图中显示了算法的三个线程——跟踪、局部构图与闭环检测的所有步骤。&场景识别和地图的主要组成部分。

系统框架如图1所示，包括三个并行的线程：跟踪、局部地图构建和闭环回路检测。跟踪线程负责对每帧图像的相机位置进行定位，并决定什么时候插入新的关键帧。首先通过与前一帧图像进行匹配得到初始特征点，然后采用运动BA优化摄像头位姿。如果特征跟丢（比如由于遮挡或是突然运动），则由位置识别模块进行全局重定位。一旦获得最初的相机位姿估计和特征匹配，则使用由系统维护的关键帧的covisibility graph提取一个局部可视化地图，如图2(a)、(b)所示。然后通过重投影方法搜索当前帧与局部地图点对应的匹配点，并利用所有的匹配点优化当前相机位姿。最后，跟踪线程决定是否插入新的关键帧。所有的跟踪步骤将在第5部分详细阐述。创建初始化地图的新方法将在第4部分进行说明。

局部地图构建模块负责处理新的关键帧，对周围的相机位姿进行局部BA以优化重构。在covisibility graph已连接的关键帧中搜索新的关键帧中ORB特征的匹配点，然后三角化新的地图点。有时尽管已经创建了新的点云，但基于跟踪线程过程中新收集的信息，为了保证点云的高质量，可能会根据点云筛选策略临时删除一些点。局部地图构建模块也负责删除冗余的关键帧。我们将在第6部分详细说明局部地图构建的步骤。

对每个新的关键帧都要进行闭环搜索，以确认是否形成闭环。如果闭环被检测到，就计算相似变换来查看闭环的累积误差。这样闭环的两端就可以对齐，重复的云点就可以被融合。最后，为了确保全局地图的一致性，利用相似性约束[6]对位姿图进行优化。主要的创新之处在于，本文对Essential Graph进行优化，它是一个covisibility graph中的一个更稀疏的子图，更多细节将在第3部分D小节描述。闭环检测和校验步骤将在第7部分详细描述。

我们使用g2o[37]库中的Levenverg-Marquardt算法执行所有的优化。附录中描述了每次优化的误差，代价函数和变量。

C、地图点、关键帧及其选择标准

对每个地图点pi保存以下信息：

它在世界坐标系中的3D坐标X_w,i 。
视图方向n_i，即所有视图方向的平均单位向量（该方向是指连接该点云和其对应观测关键帧光心的射线方向）。
ORB特征描述子D_i，与其他所有能观测到该点云的关键帧中ORB描述子相比，该描述子的汉明距离最小。
根据ORB特征尺度不变性约束，可观测的点云的最大距离dmax和最小距离dmin。

对每个关键帧K_i保存以下信息：

相机位姿T_(i,w)，从世界坐标系转换到相机坐标系下的变换矩阵。
相机内参，包括主点和焦距。
从图像帧提取的所有ORB特征，不管其是否已经关联了地图云点，这些ORB特征点都经过畸变模型矫正过。

一开始，地图点和关键帧的创建条件较为宽松，但是之后则会通过一个非常严格苛刻的筛选机制进行挑选，该机制会检测出冗余的关键帧和匹配错误的或不可跟踪的地图点进行删除。这样做的好处在于地图在构建过程中具有一定的灵活性，在外界条件比较困难的情况下（比如：旋转，相机快速运动），算法仍然可以实现鲁棒的跟踪，与此同时，当相机重访问同一个环境时，地图的尺度大小是可控的，有利于系统长期工作。与PTAM算法相比，我们构建的地图中基本不包含局外点，因为秉持的原则是很苛刻的，宁缺毋滥。地图云点和关键帧的筛选过程将在第6部分B节和E节分别说明。

ORB-SLAM: A Versatile and Accurate Monocular SLAM System_第2张图片

图2 对TUM RGB-D标准库[38]中fr3_long_office_household图像序列进行重构以及本文用到的各种姿态图的例子。

D、Covisibility Graph和Essential Graph

关键帧之间的Covisibility信息在本系统中的几个模块上都非常有用，像论文[7]一样，我们将其表示成一个间接的权重图。图中每个节点代表一个关键帧，如果两个关键帧都能同时观测到地图云点中至少15个点，则这两个关键帧之间用一条边相连，我们用权重θ表示两个关键帧能共同观测到的云点数量。

为了校正闭环回路，我们像论文[6]一样做位姿图优化，沿着位姿图将闭环回路的误差进行分散。为了不包括由covisibility graph提供的可能非常密集的边，我们提出构建一个Essential Graph，该图保留了covisibility graph的所有节点（关键帧），但是边缘更少，仍旧保持一个强大的网络以获得精确的结果。系统从初始关键帧开始增量式地构建一个生成树，它是一个边缘数量最少的covisibility graph的子图像。当插入新的关键帧时，它被包含在链接到共享最多观测点的关键帧的树中，当一个关键帧被筛选策略剔除时，系统会更新受其影响的链接。Essential Graph包含了一个生成树，一个高可见性（θ_min=100）的covisibility graph边缘子集，以及闭环边，这样的组合共同构建了一个强大的相机网络。图2展示了一个covisibility graph，生成树和相关的essential graph的例子。在本文第8部分第E节的实验里，当算法运行位姿图优化时，可以达到即便是全局BA优化都很难达到的高精度的结果。essential graph的效果和θ_min对算法的影响将在第8部分E节讨论。

E、基于图像词袋模型的位置识别

系统嵌入了基于DBoW2[5]的位置识别算法来执行闭环检测和重定位。视觉词汇（Visual words）是一个离散化的特征描述子空间，被称为视觉词典。这部视觉词典是通过从大量图像中提取ORB描述子离线创建的。如果图像的通用性足够强，那么同一部视觉词典在不同的环境下也能获得很好的性能，正如我们之前的论文[11]那样。SLAM系统增量式地构建一个数据库，该数据库中包含了一个反向指针，用于存储在关键帧中可以看到的视觉词典里的每个视觉单词，从而实现高效检索。当筛选机制剔除关键帧时，数据库也会更新。

由于关键帧之间存在视觉重叠，因此检索数据库时，可能返回的结果不止一个高分值的关键帧。原版的DBoW2考虑了这种重叠，将时间上接近的图像的分值相加。但这并没有包括在不同时间观测同一地点插入的关键帧。为了解决这一问题，我们将这些与covisibility graph相连的关键帧进行分类。另外，我们的数据库返回的是分值高于最佳分值75%的所有关键帧。

用词袋模型来表示特征匹配的另一个优势在论文[5]里有详细介绍。如果我们想计算两组ORB特征的对应关系，我们可以强制匹配在视觉字典树上某一层（我们在6层里面选第2层）的相同节点（关键帧）里的特征，加快搜索速度。在本文中，我们就利用这个小技巧来搜索匹配的特征点，用于三角化新的点云，闭环检测和重定位。我们还引入一个方向一致性测试来改进匹配点（具体如论文[11]），该测试丢弃无效数据来保证所有对应匹配点的旋转方向一致。

IV. 地图自动初始化

地图初始化的目的是计算两帧图像之间的相对位姿来三角化一组初始的地图云点。这个方法与场景无关（平面的或一般的）并且不需要人工干预选择良好的双视图配置，比如两幅图具有明显的视差。本文算法提出并行计算两个几何模型，一个是面向平面视图的单应性矩阵，另一个是面向非平面视图的基础矩阵。然后，采用启发式的方法选择模型，并使用所选的模型从两图像的相对位姿中对地图点云进行重构。本文算法只有当两个视图之间的视差达到安全阈值时，才进行地图初始化。如果检测到低视差的情况或已知两视图模糊的情况（如论文[27]所示），则为了避免生成一个有缺陷的地图而推迟初始化。算法的步骤是：

step1: 查找初始的匹配点对：

从当前帧 F_c 中提取ORB特征（只在最好的尺度上），与参考帧 F_r 搜索匹配点对 X_c——X_r。如果找不到足够的匹配点对，就重置参考帧。

step2: 并行计算两个模型：

在两个线程上分别采用归一化DLT算法和八点法并行计算单应性矩阵 H_cr 和基础矩阵 F_cr：

正如文献[2]中基于RANSAC的方案一样。为了使两个模型的计算流程尽量一致，将两个模型的迭代循环次数预先设置成一样，每次迭代的特征点数目也预先设置好：基础矩阵是8个特征点对，单应矩阵是4个特征点对。每次迭代中，我们给每个模型 M（H表示单应，F表示基础）计算一个分值S_M：

其中，dcr2和drc2是帧到帧之间的对称传递误差[2]。TM是无效数据的排除阈值，它的依据是X2测试的95%（TH=5.99, TF=3.84，假设在测量误差上有1个像素的标准偏差）。 Γ 等于TH，这样两个模型在有效数据上对于同一误差d的分值相同，同样使得运算流程保持一致。

我们从单映射矩阵和基础矩阵的计算中选择分值最高的，但如果两个模型分值都不高（没有足够的内点），则算法流程重启，从step1开始重新计算。

step3: 模型选择：

如果场景是平面，近平面或存在低视差的情况，则可以通过单应矩阵来求解。同样地，我们也可以找到一个基础矩阵，但问题是基础矩阵不能够很好的约束该问题[2]，而且从基础矩阵中计算得到的运动结果是错误的。在这种情况下，我们应该选择单应矩阵才能保证地图初始的正确性，或者因为检测到低视差情况而拒绝初始化。另一方面，对于有足够视差的非平面场景则可以通过基础矩阵来计算，而单应矩阵只有基于平面点或者低视差的匹配点才能找到。因此，在这种情况下我们应该选择基础矩阵。我们利用如下强壮的启发式进行计算：

如果RH>0.45 , 这表示二维平面和低视差的情况，我们将选择计算单应矩阵。其他情况选择基础矩阵。

Step 4: 运动和从运动到结构的重构

一旦选择好模型，我们就可以获得相应的运动状态。如果选择单应矩阵，我们按照Faugeras方法[23]提取8种运动假设。该方法提出用cheriality测试来选择有效解。然而，如果在低视差的情况下，这些测试就会失效，因为云点很容易在相机前或后移动，导致选解错误。我们提出的方法是直接按这8种解将二维点三角化，然后检查是否有一种解可以使得所有的云点都位于两个相机的前面，其视差最大且重投影误差较小。如果没有得到一个明确的解，就不执行初始化，重新从第一步开始。这种方法使初始化程序在低视差和两个交叉的视图情况下更具鲁棒性，这也是我们整个算法体现鲁棒性的关键所在。

在基础矩阵的情况下，我们使用标定矩阵K用下式将其转换为本质矩阵：

然后用文献[2]中的奇异值分解方法计算4个运动解。然后如上文所述，将四个解用于三角化特征点，选择单应性重建。

Step 5: Bundle adjustment

最后我们执行一个全局BA，详细优化过程见附录，以优化初始重构得到的点云地图。

ORB-SLAM: A Versatile and Accurate Monocular SLAM System_第4张图片

图3 基于NewCollege图像序列[39]进行地图初始化，第一行：PTAM，中间：LSD-SLAM，下面：ORB-SLAM。
PTAM和LSD-SLAM初始化了一个错误的平面地图，而我们的方法自动选择在两帧图像存在足够视差的情况下再利用基础矩阵初始化。
如果人工选择关键帧，PTAM算法也能够初始化得很好。

图3所示是论文[39]中室外NewCollege机器人图像序列进行地图初始化的一次具有挑战性的演示。从图中可以看出，PTAM算法和LSD-SLAM算法对位于同一平面上的所有点都进行了初始化，而我们的方法是当两幅图像有足够视差之后才进行初始化，并基于基础矩阵得到了正确的结果。

V.跟踪

这一部分详细介绍了跟踪线程在每帧图像上执行的步骤。在运动BA等几个步骤中都提到了相机位姿优化，详见附录。

A、ORB特征提取

我们在8层图像金字塔上提取FAST角点，金字塔图像尺度因子为1.2。我们发现如果图像分辨率在512*384到752*480，提取1000个角点比较合适，如果是KITTI数据集[40]等分别率较高的图像，则提取2000个角点。为了确保特征点均匀分布，我们将每层图像分成网格，每格提取至少5个角点。然后检测每格角点，如果角点数量不够，就调整阈值。如果某些单元格内检测不出角点（无纹理或者低对比度），则其对应提取的角点数量也相应减少。最后，根据保留的FAST角点计算方向和ORB特征描述子。ORB特征描述子将用于算法后续所有的特征匹配，而不是像PTAM算法中那样根据图像块的相关性进行搜索。

B、通过前一帧图像估计相机初始位姿

如果上一帧图像跟踪成功，就用匀速运动模型来预测相机当前位置（即认为摄像头处于匀速运动），然后搜索上一帧图像中的特征点在地图中的对应云点与当前帧图像的匹配点，最后利用搜索到的匹配点对当前相机的位姿进一步优化（我是真的看不明白这个语法）。如果没有找到足够的匹配点对（比如运动模型失效，非匀速运动），我们就加大搜索范围，搜索地图云点附近的点在当前帧图像中是否有匹配点。然后通过寻找到的对应匹配点对优化当前时刻的相机位姿。

C、通过全局重定位来初始化位姿

如果扩大了搜索范围还跟踪不到特征点（那么运动模型已经失效），则计算当前帧图像的词袋向量，并利用BoW词典选取若干关键帧作为备选匹配帧（这样可以加快匹配速度）；然后，在每个备选关键帧中计算与地图云点相对应的ORB特征，如第三部分E节所述。接着，对每个备选关键帧轮流执行RANSAC迭代求解尝试用PnP算法[41]计算当前帧位姿。如果能找到一个涵盖足够多有效点的姿态，就对该姿态进行优化，搜索该关键帧对应的更多匹配云点。最后，基于所有找到的匹配点对相机位置进行进一步优化，如果有效数据足够多，跟踪程序将继续执行。

D、跟踪局部地图

一旦获得了相机初始位姿和一组初始特征匹配点，就可以将更多的地图云点投影到图像上以寻找更多的匹配点。为了降低大地图的复杂性，只投影局部地图。该局部地图包含一组关键帧K1，它们和当前关键帧有共同的地图云点，还包括在covisibility graph中与关键帧K1相邻的一组关键帧K2。这个局部地图中还有一个参考关键帧Kref∈K1，它与当前帧具有最多的共享地图云点。在当前帧中对K1, K2中均可见的每个地图云点进行搜索：

计算地图云点在当前帧图像中的投影点x。如果投影位置超出图像边界，就将该地图云点丢弃。
计算当前视图射线v和地图云点平均视图方向n的夹角。如果n
计算地图云点到相机中心的距离d。如果它不在地图云点的尺度不变区间内，即d∉[dmin,dmax]，就丢弃。
计算每帧图像的尺度 d/dmin。
对比地图云点的特征描述子D和当前帧中还未匹配的ORB特征，在预测的尺度层和靠近x的云点作最优匹配。

最后通过当前帧中获得的所有地图云点对相机位姿进行优化。（这个环节的目的是在当前帧和局部地图之间找到更多的匹配点对，来优化当前帧的位姿）。

E、新关键帧筛选策略

最后一步是决定当前帧是否可以作为关键帧。由于局部地图构建过程中存在筛选剔除冗余关键帧机制，所以需要尽快地插入新关键帧，以保证跟踪线程对相机运动的鲁棒性，尤其是旋转运动。根据以下要求插入新的关键帧：

距离上一次全局重定位后超过20帧图像。
局部地图构建处于空闲状态，或距上一个关键帧插入后，已经有超过20帧图像。
当前帧跟踪少于50个地图云点。
当前帧跟踪少于参考关键帧K_ref云点的90%。

与PTAM中用关键帧之间的距离作为判断标准不同，我们加入一个最小的视图变换（条件4）。条件1确保一个好的重定位，条件3保证好的跟踪。如果在局部地图构建处于忙状态（条件2的后半部分）的时候插入关键帧，就会发信号去暂停局部BA，这样就可以尽可能快地去处理新的关键帧。

VI. 局部地图构建

这部分主要描述根据每个新的关键帧Ki构建局部地图的步骤。

A、关键帧插入

首先更新covisibility graph，具体包括：添加一个关键帧节点Ki，检查与Ki有共同云点的其他关键帧，用边线连接。然后，更新生成树上与Ki有最多共享点的其他关键帧的链接。计算表示该关键帧的词袋，并利用三角法生成新的地图云点。

B、地图点云筛选

三角化的云点要保留在地图中，必须在其创建后的前三个关键帧中通过一个严格的测试，确保留下的云点都是可跟踪的，不是由于错误的数据而被三角化的。一个云点必须满足如下条件：

跟踪线程必须在超过25%的图像中找到该特征点。
如果经过多个关键帧才创建了地图云点，那么它必须至少能够被其他3个关键帧观测到。

一旦一个地图云点通过测试，只有在被少于3个关键帧观测到的情况下才能移除它。这样的情况在关键帧被删除以及局部BA排除异值点的情况下发生。这个策略使得我们的地图包含很少的无效数据。

C、新地图点云创建

通过对covisibility graph中相连的关键帧Кc中的ORB特征点进行三角化来创建新的地图云点。对Ki中每个未匹配的ORB特征，我们在其他关键帧的未匹配云点中进行查找，看是否有匹配上的特征点。匹配过程详见第三部分第E节，然后将那些不满足对级约束的匹配点删除。ORB特征点对三角化后，需要对其在摄像头坐标系中的深度信息，视差，重投影误差和尺度一致性进行审查，通过后则将其作为新点插入地图。起初，一个地图云点被2个关键帧观测到，但它可以被其他关键帧中的点匹配到，所以它可以映射到其他相连的关键帧中，搜索算法详见第5部分D节。

D、局部BA

局部BA主要对当前处理的关键帧Ki，所有在covisibility graph中与Ki连接的其他关键帧Kc，以及这些关键帧观测到的地图云点进行优化。所有其他能够观测到这些云点、但不与当前处理帧Ki相连的关键帧会被保留在优化线程中，但保持不变。优化期间以及优化后，所有被标记为无效的观测数据会被丢弃，优化细节详见附录。

E、局部关键帧筛选

为了使重构保持简洁，局部地图构建尽量检测和丢弃冗余的关键帧。这是有益的，因为BA的复杂度随着关键帧数量的增加而增加，当算法在同一场景下运行时，关键帧的数量不会无限增长，除非场景内容改变，这也增强了系统的可持续性。如果关键帧Kc中90%的点都可以被其他至少三个相同或者尺度更小的关键帧同时观测到，那认为Kc的存在是冗余的，丢弃。尺度条件确保地图点维护可以最精确测量出它们的关键帧。这个策略受[24]启发，作者经过一系列变化检测后将关键帧删除。

VII. 闭环检测

闭环检测线程抽取Ki——最后一帧局部地图关键帧，用于检测和闭合回环。具体步骤如下：

A、候选关键帧

首先，计算Ki的词袋向量和它在covisibility graph中相邻图像（θmin=30）的相似度，保留最低分值Smin。然后，我们检索图像识别数据库，丢弃分值低于Smin的关键帧。这是和DBoW2中均值化分值类似的可以获得好的鲁棒性的操作，DBoW2中计算的是前一帧图像，而本文使用的是covisibility信息。此外，所有连接到Ki的关键帧都会从结果中删除。为了获得候选回环，我们必须连续检测3个一致的候选回环（covisibility graph中相连的关键帧）。如果有多个与Ki相似的地方，就可能有多个候选回环。

B、计算相似变换

单目SLAM系统有7个自由度：3个平移，3个旋转，1个尺度因子[6]。为了闭合回环，需要计算从当前关键帧Ki到回环关键帧KL的相似变换，以获得回环的累积误差。计算相似变换也可以作为回环的几何验证。

首先，计算当前关键帧中地图点对应的ORB特征与候选回环关键帧的对应关系，详见第3部分E节。此时，我们有了每个候选回环关键帧的3D-3D对应关系。对每个候选回环执行RANSAC迭代，用Horn方法[42]寻找相似变换。如果用足够多的有效数据找到了相似变换Sil，就优化它（见附录），并搜索更多的对应关系。然后再次优化。如果Sil有足够的有效数据，就接受KL回环。

C、回环融合

回环矫正的第一步是融合重复的地图云点，并在covisibility graph中插入与回环相关的的新边缘。首先，通过相似变换Sil矫正当前关键帧位姿Tiw，这种矫正方法应用于所有与Ki相邻的关键帧，连接变换，这样回环两端就可以对齐。然后，回环关键帧及其邻居能观测到的所有地图云点都投影到Ki 及其近邻中，并在映射的区域附近小范围内搜索它的对应匹配点，如第5部分D节所述。将所有匹配的地图云点和计算Sil过程中的有效数据进行融合。融合过程中更新所有的关键帧在covisibility graph中的边缘，创建的新边缘将用于回环检测。

D、Essential Graph优化

为了有效地闭合回环，我们通过Essential Graph优化位姿图，如第三部分D节所示，这样可以将回环闭合的误差分散到图像中去。优化程序通过相似变换校正尺度漂移[6]。误差和成本计算见附录。优化过后，每一个地图云点都根据其中一个观测到它的关键帧的校正进行变换。

VIII. 实验

我们采用NewCollege[39]的大场景机器人图像序列对本文提出的系统进行了较全面的实验评估，首先采用TUM的16个室内手持RGB-D数据集[38]对系统总体性能进行评估，包括算法的定位精度，重定位和程序长时间运行能力；然后，用KITTI的10个汽车户外图像数据集[40]，评估算法在大场景下的实时性能、定位精度和位姿图优化效率。

算法运行在Intel Core i7-4700MQ （4核 2.40GHz）和8GB RAM的实验平台上，运算速率可达到实时，且以帧率对图像进行准确处理。ORB-SLAM有3个主线程，它们和其他ROS线程并行运行，由于引入了ROS操作系统，因此算法结果具有一定的随机性，针对这个原因，我们在一些实验中公布了算法运行的中间结果。

A、基于Newcollege数据集测试系统性能

NewCollege数据集[39]包含一个穿越校园和邻近公园的2.2km机器人图像序列。该图像序列由双目相机拍摄，帧率为20fps，分辨率512x382。图像序列中包含多个对单目视觉定位具有挑战性的回环和快速旋转。据我们所知，目前没有单目系统可以处理这一整个图像序列。尽管[7]可以实现回环检测，也可以应用于大场景环境，但只能显示小部分序列图像的单目结果。

ORB-SLAM: A Versatile and Accurate Monocular SLAM System_第5张图片

图4 NewCollege数据集下的回环检测。绘制出了支持相似性变换的内点对应关系。

如图4显示的是我们的算法检测到的闭环，从图中可以看出，我们选择的有效数据点都支持相似性变换。

ORB-SLAM: A Versatile and Accurate Monocular SLAM System_第6张图片

图5 序列中回环闭合前后的地图。闭环匹配用蓝色表示，轨迹绿色，局部地图红色。局部地图在关闭后沿闭环两侧扩张。

图5则对比了回环闭合前后的环境地图重构状况。其中，红色标注的是局部地图，回环检测后可以看到其两端扩展到连接整个运行轨迹。

ORB-SLAM: A Versatile and Accurate Monocular SLAM System_第7张图片

图6 实时帧率的完整序列全局重建地图。右边的大回环从相反的方向穿过，位置识别程序没有发现可视的闭环，因此它们并没有对齐。

ORB-SLAM: A Versatile and Accurate Monocular SLAM System_第8张图片

表1 跟踪和局部建图所用时间

我们统计了ORB_SLAM算法每个线程所用的时间。表1显示了算法跟踪和局部构图的时间。可以看出，跟踪的帧率大概在25-30Hz，这是跟踪局部地图所需的最多时间。如果需要，可以通过减少局部地图中所包含的关键帧数量即可减少这一部分所用的时间。局部地图构建线程中耗时最多的是局部BA优化。局部BA的时间根据机器人探索环境的状态变动，即在未探索环境下所需时间多，在已经探索过的环境下运行所需时间少，因为在未知环境中如果跟踪线程插入一个新的关键帧，BA优化会被中断，如第5部分E节所示。如果不需要插入新的关键帧，局部BA优化则会执行大量已经设置的迭代程序。

ORB-SLAM: A Versatile and Accurate Monocular SLAM System_第9张图片

表2 在NewCollege序列下跟踪和建图线程所耗时间

表2显示了6个闭合回路的结果。可以看出回环检测是如何随关键帧数量的增多而提前增加。这主要是由于高效的数据库检索，表2中只比较了具有相同图像单词的图像子集，由此可见用于位置识别词袋模型的潜力。我们的Essential Graoh中包含的边缘是关键帧数量的5倍，它是一个稀疏图。

B、基于TUM RGB-D标准库的定位精度

TUM RGB-D数据集[38]是一个用于估计摄像头定位精度的优秀数据库，它提供了许多包括外部运动捕捉系统提供的对应轨迹真值的图像序列。我们去掉了那些　包含强烈的旋转、没有纹理或没有运动的不适合纯单目SLAM系统的图像序列。

为了验证算法性能，我们选择了直接法半稠密LSD-SLAM[10]和PTAM[4]作为对比。除此之外，我们还比较了RGBD-SLAM[43]的轨迹。为了将ORB-SLAM，LSD-SLAM和PTAM的轨迹与地面真值进行比较，我们使用相似变换对齐关键帧轨迹，在尺度未知的情况下，检测轨迹的绝对误差[38]。对RGBD-SLAM，通过相机坐标变换来对齐轨迹，也采用同样的方法检测尺度是否重构良好。LSD-SLAM从随机深度值开始初始化，需要时间收敛，因此与基准对比的时候，我们丢掉了前10个关键帧。对于PTAM，我们手动选择了两个关键帧获得了良好的初始化。表3 是对我们选择的16个图像序列运行5次的中间结果。

从表中可以看出，ORB-SLAM可以处理除　fr3_nostructure_texture_far (fr3_nstr_tex_far)以外所有的图像序列。这是一个平面的场景，相机的轨迹在这种情况下有两种可能，正如[27]所述。我们的初始化方法检测到这种模棱两可的情况，为保证算法安全运行而拒绝初始化。PTAM初始化有时会选择对的方案，有些可能会选择错的方案，且导致的错误可能不能接受。我们没有发现LSD-SLAM的2种不同重构方案，但在这个图像序列中出现非常多的错误。针对其他的图像序列，PTAM和LSD-SLAM的鲁棒性都比我们的方法差，且分别有八组序列和三组序列中地图点容易跟踪丢失。

关于精度问题，没有回环检测时，ORB-SLAM和PTAM的定位精度相当，但回环检测成功后，ORB-SLAM在图像序列fr3_nostructure_texture_near_withloop (fr3_nstr_tex_near)中表现出了更高的定位精度。非常意外的一个结果是PTAM和ORB-SLAM表现出的精度都非常明显地高于LSD-SLAM和RGBD-SLAM。很可能是它们将地图的优化过程简化为一个丢弃传感器测量信息的单纯的姿态图优化过程，但在我们的算法中，采用BA优化，同时通过传感器测量联合优化相机的姿态和地图的云点位置，这是解决运动到结构[2]的经典标准算法。结果讨论详见第9部分B节。另一个有趣的结果是在　fr2_desk_with_person 和 fr3_walking_xyz　图像序列中，LSD-SLAM对动态物体的鲁棒性相比ORB-SLAM差一些。

我们注意到RGBD-SLAM在图像序列fr2上有一个尺度偏差，用7自由度对齐轨迹则误差明显降低。Engle等[10]提出在f2_xyz　上PTAM的精度比LSD-SLAM低，RMSE是24.28cm。但是论文没有给出足够的细节说明这些结果是如何获得的，因此我们无法复现。

C、基于TUM RGB-D标准数据库的重定位

我们在TUM RGB-D数据集上进行了两组重定位实验。在第一个实验中，我们选择fr2_xyz图像序列的前30秒构建了一个地图，然后对后来的每一帧图像都进行全局重定位，并评估重构出来的相机位姿精度。对PTAM进行了相同实验。图7所示是用来创建初始地图的关键帧、重定位的图像帧位姿　和这些帧对应的地面真值。从图中可以看出PTAM只能够对关键帧附近的图像帧进行重定位，这是因为其重定位方法的不变性较小。表4显示了PTAM和ORB_SLAM相对地面真值的误差。可以看出，相比PTAM，ORB-SLAM可以更精准地定位2倍以上的图像帧。在第2个实验中，我们采用fr3_sitting_xyz图像序列来初始化地图，然后用fr3_walking_xyz图像序列重定位所有的图像帧。这是一个颇具挑战性的实验，由于图像中有人移动，会造成图像局部区域的遮挡。在该试验中，PTAM没有实现重定位，而ORB-SLAM重定位了78%的图像帧，如表4所示。图8显示了ORB-SLAM重定位的一些实验图例。

D、基于TUM RGB-D标准数据集测试算法的运行生命

之前的重定位实验表明我们的系统可以从不同的视角定位地图，在中等动态环境中的鲁棒性也较好。这个特性和关键帧筛选过程相结合，使得算法能相同环境中的不同视角以及局部动态环境中长期运行。

在全静态场景下，即使相机从不同视角观测场景，ORB-SLAM也可以使关键帧数量保持在一个有限的水平内。我们在一个自定义的图像序列中验证了这一点：手持相机在93秒内拍摄同一张桌子，但视角一直变换，形成一个轨迹。对比我们地图的关键帧数量和PTAM生成的关键帧，如图9所示。可以看到PTAM一直都在插入关键帧，而ORB-SLAM会删除冗余的关键帧，将其总数保持在一个稳定的范围内。

ORB-SLAM: A Versatile and Accurate Monocular SLAM System_第11张图片

图９　静态环境下的长期实验

能在静态环境下长期运行是任何SLAM系统的基本要求，更引人关注的是动态环境下的情况。我们分析了ORB-SLAM在几个fr3图像序列（sitting_xyz, sitting_halfsphere, sitting_rpy,walking_xyz, walking_halfspehere, walking_rpy）下的表现。所有视频中的相机都对着桌子，但运动轨迹不同，拍摄场景人为移动椅子等物体。图10（a）所示是ORB_SLAM生成的地图中关键帧总数量的变化，图10（b）所示为从图像帧中创建或删除关键帧，从中可以看出关键帧的存在时间。可以看出，前2个图像序列中，地图的大小随着场景中的内容第一次被观测到。图10（b）是在整个试验中，这两个图像序列为了维持地图所创建的关键帧。在sitting_rpy和walking_xyz中，地图通过已有场景创建，大小没有增长。相反，在最后两个视频中，有更多的关键帧插入，这表明可能由于场景的动态变化有一些之前没有发现的东西显现出来了。图10（ｃ）是关键帧的柱状图，根据它们的存在时相对于序列创建时的剩余时间。可以看出，大量的关键帧都被删除了，只有一小部分能够存活到实验结束。一方面，这说明ORB-SLAM有一个通用的关键帧生成策略，这在未知环境下非常有用。另一方面，系统最终会生成一个小的子集来代表这些关键帧。

在这些长期实验中，系统的地图随着场景内容增加而增加，而不是随着时间增长，它能够存储场景动态变化，对场景的理解非常有用。

E、基于KITTI数据集测试算法在大场景大回环下的性能

KITTI里程计数据集包括11个序列，通过一辆在住宅区行驶的汽车用一个GPS和一个Velodyne Laser Scanner采集，精度非常高。这个数据集对单目系统非常有挑战性，因为视频中有快速旋转，区域内有大量树叶，使得数据关联难度更大，而且车速相对较快，视频记录的频率为10fps。ORB-SLAM能够以实际帧率处理　除01外其它所有的视频，因为序列01是一条高速公路，几乎没有可跟踪的近距离物体。视频00,02,05,06,07,09，有闭环回路，系统可以检测到，并使它闭合。其中视频09包含一个只能在视频的最后几个图像帧里检测到的闭环，并不是每次都能成功检测到（结果显示的是针对其被检测到的运行情况）。

ORB-SLAM: A Versatile and Accurate Monocular SLAM System_第12张图片

图11

ORB-SLAM: A Versatile and Accurate Monocular SLAM System_第13张图片

图12

对于轨迹与地面真值的定性比较如图11和图12所示。在TUM RGB-D数据集中，我们通过相似变换对齐轨迹的关键帧和地面真值。图11是定性比较的结果，图12是[25]中的最新单目SLAM在序列00,05,06,07和08上的执行结果。除了08有一些偏移以外，ORB-SLAM在这些视频上的轨迹都很精准。

ORB-SLAM: A Versatile and Accurate Monocular SLAM System_第14张图片

表5每个序列中执行５次以上的关键帧轨迹的RMSE中值误差　表6 闭环关闭策略的比较

表5显示了在每个序列中执行５次以上的关键帧轨迹的RMSE中值误差。我们基于地图尺寸提供了轨迹的误差。结果表明我们的轨迹误差是地图尺寸的1%左右，最低的是视频03的0.3%，最高的是视频08的5%。视频08没有闭环，无法校正漂移，这说明需要闭环才能获得更精确的重构。

在本次实验中，我们还测试了20次迭代的全局BA可以在多大程度上优化地图重构，详见附录。我们还注意到全局BA优化可以稍微增加闭环轨迹的精度，但在开环轨迹中作用很小，这意味着我们的系统已经非常精确了。如果有些应用需要非常精确的结果，我们的算法会提供一组匹配，定义一个比较强的相机网络，一个初始估计，这样可以减少全局BA优化的迭代次数。

最后讲一下我们算法的闭环检测的效率和用于essential graph边缘的θmin的影响。我们选择视频09（一段非常长的图像序列，在最后有一个闭环），然后评估不同的闭环检测算法。表6是关键帧轨迹RMSE和不同情况下优化所用的时间，包括：没有闭环检测、直接采用全局BA优化（20层或100层迭代）、只用位姿图优化（不同数量边缘的10层迭代）、先用位姿图优化再执行全局BA优化。图13展示了不同方案的输出轨迹。结果表明，在闭环检测之前，RMSE误差较大，BA优化无法收敛。即便是迭代100次之后误差依然很大。另一方面，essential graph优化收敛速度很快，而且结果也更精确。θmin对精度影响并不大，减少边缘的数量会明显减少时间。位姿图优化后再执行一个BA优化则可以增加精度，但耗时也随之增加。

ORB-SLAM: A Versatile and Accurate Monocular SLAM System_第15张图片

图13 不同算法闭环策略的比较。分别是 a无闭环、bBA（20）、cEG（100）、dEG（100）+BA（20）

IX. 结论和讨论

A、结论

本文中，我们提出了一个新的单目SLAM系统，并详细介绍了其组成模块，并使用公共数据集对其性能进行了全方位的测试。实验结果显示，我们的系统可以处理室内与室外的图像序列，能够用于汽车、机器人和手持设备上。其定位精度在室内小场景中约为1厘米，室外大场景的应用是几米（前提是尺度与真实轨迹对齐）。

PTAM[4]被认为是目前最精准的单目实时SLAM。PTAM后端是BA优化，这是离线SFM（从运动到结构）问题[2]的经典解法。PTAM和Mouragnon[3]早期作品的主要贡献是将BA算法引入到机器人SLAM框架下，并证明了其良好的实时性。而本文的主要贡献是将PTAM算法的适用性进一步扩展，使其可以应用于原来不可应用的场景下。为了实现这一目标，我们从头设计了一种新的单目SALM系统，引入了新的想法和算法，同时也结合了最近几年的优秀方案，比如[5]中的闭环检测，[6],[7]中提出的的闭环检测程序和covisibility graph，[37]中提出的g2o优化框架以及ORB特征[9]。就我们所知，没有哪种方案能够在如此多的情况下依然还能达到ORB_SLAM的精度。ORB_SLAM方法是目前为止最可靠最完整的单目SLAM系统。我们提出的新的关键帧生成和删除策略，允许每隔几帧就创建一个关键帧，当关键帧冗余时就丢弃。这样灵活的构图方式在外界条件很差的情况下可以保证系统正常运行，比如相机作纯旋转运动或快速移动。当算法在相同场景下运行时，地图在只有拍摄到新内容的情况下才会增长，可以从我们的长期构图结果中看到这个特性。

最后，我们还展示了ORB特征具有很好的识别能力，可识别剧烈视角变换情况下的场景信息。此外，它们的提取和匹配速度很快（不需要多线程或GPU加速），能够满足跟踪和建图的实时精度。

B、离散/特征SLAM方法与稠密/直接SLAM方法对比

最近，DTAM[44]和LSD-SLAM[10]提出了一种实时单目SALM算法，算法直接利用图像像素的亮度信息进行摄像头的定位与优化，并重构稠密或半稠密的环境地图。这类方法即为直接法，直接方法不需要特征提取，可以避免人工匹配。同时，直接法对图像模糊，弱纹理环境和高频纹理环境[45]的鲁棒性更好。与由ORB-SLAM或PTAM算法构成的稀疏地图相比，稠密/直接法SLAM对相机定位之外的其他应用任务可能用途更广泛。

直接法也有局限。首先，直接法假设真实场景中的物体的像是由该物体本身的表面反射模型产生的。光度一致性寻找匹配点的思路就限制了匹配点之间的基线距离，通常都比特征匹配点的基线要窄。这对重构的精度影响很大，因为重构需要较宽的基线来减少深度的不确定性。如果直接法建模不准确，可能会受到快门，自动增益和自动曝光的影响（如TUM RGB-D 的对比测试）。最后，直接法计算要求较高，为了满足计算速度，DTAM采用地图增量式扩张的方法，而LSD-SLAM则丢掉传感器测量信息，将地图优化降低为对位姿图的优化。

相比之下，特征法可以在更宽的基线上匹配特征，主要得益于特征匹配算法较好的视角和光照不变特性。在传感器测量值层面上使用BA联合优化相机位姿和地图点。在运动结构估计中，[46]指出了特征法相比直接法的优势。本文中的实验也证实了特征法在实时SLAM中具有更高的精度，详见第8部分B节。未来单目SLAM应该会整合两种最好的方法。

C、未来的工作

我们系统的精度可以通过结合无限远点跟踪来进一步增强。这些点在视差足够大的情况下是看不到的，也没有包含在本文算法构建的地图中，但对相机的旋转非常有用[21]。

另外一种方法是将稀疏地图更新到一个更加稠密的地图。得益于我们的关键帧选择机制，关键帧组成了一个具有高精度位姿和丰富的covisibility信息的紧凑地图。所以，ORB-SLAM稀疏地图是一个非常优秀的初始估计框架，比稠密地图更好。这个方向的首次尝试在论文[47]中有详细描述。

附录：非线性优化

光束平差法(BA)

地图云点3D位置 Xw,j∈R3，关键帧位姿Tiw∈SE(3)

W表示世界坐标，通过匹配的关键点Xi,j∈R2减少重投影误差。

地图云点j在关键帧i中的误差是：

其中πi是影射函数：

其中，Riw∈SO(3)，tiw∈R3，分别表示Tiw的旋转和平移部分

（fi,u , fi,v），（ci,u , ci,v）分别是相机i的焦点距离和主点。

代价函数：

ρh是Huber鲁棒代价函数，Ωi,j=δi,j2I2x2是协方差矩阵，与检测关键点的尺度有关。在全局捆集调整中（在初始化地图中），我们优化了所有云点和关键帧。

你可能感兴趣的:(文献阅读)

文献阅读 | PNAS | 经验和发育中的前额叶皮层程序员
:::block-1文献介绍文献题目：经验和发育中的前额叶皮层\研究团队：BryanKolb（加拿大莱斯布里奇大学）\发表时间：2012-10-08\发表期刊：PNAS\影响因子：9.4\DOI：10.1073/pnas.1121251109:::摘要前额叶皮层（PFC）接收来自所有其他皮层区域的输入，并负责规划和指导跨时间的运动、认知、情感和社会行为。它具有较长的发育过程，这使得它能够通过经验获
文献阅读 250303-Fire weakens land carbon sinks before 1.5 °C ZzYH22 笔记
Fireweakenslandcarbonsinksbefore1.5 °C来自##Intro:使用火-植被耦合模型来探索全球变暖水平的区域影响和反馈。讨论了1.5°C的目标是否与在考虑火灾状况变化时避免重大生态系统变化一致。我们发现，火灾开始显著影响全球碳储存的全球变暖水平比工业化前水平高出1.07°C（0.8–1.34°C），并得出结论，火灾已经在降低土地碳汇的有效性方面发挥了重要作用。由于气
AVM 环视拼接鱼眼相机选与握 #环视拼接 AVM
https://zhuanlan.zhihu.com/p/651306620AVM环视拼接方法介绍从内外参推导IPM变换方程及代码实现（生成AVM环视拼接图）_avm拼接-CSDN博客经典文献阅读之--ExtrinsicSelf-calibrationoftheSurround-viewSystem:AWeakly...(环视系统的外参自标定)-CSDN博客经典文献阅读之--:AWeakly...
文献阅读 250222-A Robust Causal Machine Learning Approach ZzYH22 笔记
InferringHeterogeneousTreatmentEffectsofCrashesonHighwayTraffic:ADoublyRobustCausalMachineLearningApproach来自##Intro:研究问题：高速公路交通事故对交通系统和经济都产生了相当大的影响。在这种情况下，准确可靠的应急响应对于有效的交通管理至关重要。但是，车祸对交通状态的影响因不同因素而异，并
文献阅读(part2)--Towards K-means-friendly spaces Simultaneous deep learning and clustering GUI Research Group 机器学习 python 深度聚类
学习笔记，仅供参考文章目录AbstractIntroductionBackgroundandRelatedWorksProposedFormulationOptimizationProcedureInitializationviaLayer-wisePre-Training(通过分层预训练进行初始化)AlternatingStochasticOptimizationExperiments合成数据演
【文献阅读分享】PAP-REC：个性化自动提示生成框架✨ Sheakan 推荐系统论文阅读总结人工智能推荐系统
标题期刊年份PAP-REC:PersonalizedAutomaticPromptforRecommendationLanguageModelACMTransactionsonInformationSystems(TOIS)2024研究背景在信息爆炸的时代，我们每天都要面对海量的数据和选择，这时候推荐系统就像我们的智能小助手，帮助我们在茫茫信息海洋中找到真正需要的资源。但是，传统的推荐系统模型大多
《Semantic communications - Principles and challenges》语义通信文献阅读与分析总结 snow每天都要好好学习深度学习深度学习
《语义通信：原理与挑战》文献详细总结1.语义通信的概念语义通信是一种超越传统香农通信范式的全新通信模式，它关注的是信息意义的传递，而不仅仅是数据本身的准确传输。传统通信强调比特级别的准确性，而语义通信更强调信息对接收方执行特定任务的有效性。这种模式被认为是第六代（6G）无线网络的核心技术之一，能够支持包括智能交通、智能监控、视频会议、增强现实（AR）和虚拟现实（VR）在内的多种智能应用。在语义通信
文献管理工具Zotero超详细教程，包含各个方面程序猿000001号论文阅读
1、为什么要使用Zotero上面两种方式对于后期进行写作，文献查找以及文献引用的都不方便，使用文献管理软件具有以下优点：下面是目前几款常见的文献阅读软件的对比：通过上面对比，可以看出Zotero在文献管理软件中具有一定的优势，下面介绍Zotero软件的使用。2、如何将论文导入Zotero2.1通过浏览器插件在浏览器中安装zotero插件后，在浏览器右上角就能够出现一个文件夹图标，此时就可以点击该文
Python——基于ERA5数据的饱和水汽压差（VPD）批量计算（Clausius-Clapeyron 克劳修斯-克拉伯龙关系）雨宫芳树算法 python arcgis 数据分析开发语言
一、前言之前我发布过基于CRU数据和Goff-Gratch公式计算VPD的博客，见下方：基于CRU数据计算VPD的博客但是，CRU数据的分辨率还是较为粗糙（0.5°×0.5°），而ERA5land数据集分辨率能很好地满足我的需求（0.1°×0.1°）。但是，ERA5land数据集并不提供水汽压和湿度变量供于下载，这导致利用Goff-Gratch公式很难进行计算。结合近期文献阅读和整理，这里提供另一
[特殊字符]文献阅读分享：《负面情绪更吸睛？利用大型语言模型重构新闻推荐系统中的情感框架》 Sheakan 推荐系统论文阅读总结语言模型重构人工智能
论文背景在当今信息爆炸的时代，新闻推荐系统（NewsRecommenderSystems,NRS）成为用户获取新闻的重要工具。然而，新闻内容的呈现方式（即新闻框架）对用户的参与度和付费意愿有着深远的影响。随着人工智能技术的发展，大型语言模型（LLMs）逐渐被引入新闻生产过程，为新闻框架的重构提供了新的可能性。本文通过实验研究，探讨了基于LLM的情感框架重构对用户情感、参与度和付费意愿的影响。相关工
想提升英文文献阅读速度？有哪些实用方法？ paixiaoxin 科研方法文献工具人工智能科研研究生文献管理文献阅读文献翻译 scholaread
在科研的道路上，筛选文献就像是大海捞针，找对了方法，就能快速锁定那些有价值的信息。尤其是在实验方向尚未确定时，如何从海量文献中筛选出“金子”，就显得尤为重要。关键的第一步：精准筛选当你面对一堆英文文献时，首先得明白，不是每一篇文献都值得你细读。这时候，筛选的技巧就显得至关重要。以下是如何快速而精准地进行筛选：快速阅读技巧：先看摘要和结论：这是最快速了解文章核心的方法。如果这两部分都看不懂或者不感兴
研究生师兄谈SCI论文写作心得华大基因学院
即将毕业的高产博士师兄（博士在读期间累计发表SCI论文11篇，其中第一作者或通讯作者论文10篇），受学院委托介绍一下论文写作经验，希望能对大家更快、更轻松发表学术论文提供些许帮助。一、文献阅读在开展课题前，阅读文献是一个不可或缺的环节，只有充分了解你要做的课题，才能得心应手地设计课题，进而快速的围绕计划开展研究、准备数据，方便后期撰写论文。实际上，很多小伙伴常常花费大量时间看各种文献，但还是往往不
Pytorch学习记录-接近人类水平的GEC（使用混合机器翻译模型）我的昵称违规了
五月第二周要结束了，接下来的三个月主要是文献阅读，准备8、9月的开题报告，技术类的文献集中在GEC和Textmaching的应用方面，读完之后找demo复现，然后应用。理论方面的论文也都是英文的8.NearHuman-LevelPerformanceinGrammaticalErrorCorrectionwithHybridMachineTranslation昨天一天没看论文，发现我文献阅读速度太
文献阅读（42）——使用深度学习在眼底照中检测糖网并分类（综述）柚子味的羊文献阅读深度学习分类人工智能
使用深度学习在眼底照中检测糖网并分类（综述）Deeplearningfordiabeticretinopathydetectionandclassificationbasedonfundusimages:AreviewIF=6.698/Q1文章目录使用深度学习在眼底照中检测糖网并分类（综述）先验知识/知识拓展文章结构文章结果1.introduction方法1.眼底图像一般的分析pipeline2.
机器学习第二十五周周报 ConvLSTM 沽漓酒江机器学习人工智能
文章目录week25ConvLSTM摘要Abstract一、李宏毅机器学习二、文献阅读1.题目2.abstract3.网络架构3.1降水预报问题的建模3.2ConvolutionalLSTM3.3编码-预测结构4.文献解读4.1Introduction4.2创新点4.3实验过程4.3.1Moving-MNISTDataset4.3.2雷达回波数据集4.4结论三、基于pytorch实现ConvLST
机器学习第二十八周周报 PINNs2 沽漓酒江机器学习人工智能
文章目录week28PINNs2摘要Abstract一、Lipschitz条件二、文献阅读1.题目数据驱动的偏微分方程2.连续时间模型3.离散时间模型4.结论三、CLSTM1.任务要求2.实验结果3.实验代码3.1模型构建3.2训练过程代码小结参考文献week28PINNs2摘要本文主要讨论PINN。本文简要介绍了Lipschitz条件。其次本文展示了题为Physics-informedneura
文献阅读：金鱼端脑细胞类型图谱揭示了空间结构和细胞类型进化的多样性程序员
:::block-1文献介绍文献题目Atelencephaloncelltypeatlasforgoldfishrevealsdiversityintheevolutionofspatialstructureandcelltypes\研究团队AmitZeisel（以色列理工学院）、RonenSegev（本·古里安大学）\发表时间2023-11-01\发表期刊ScienceAdvances\影响因子
文献阅读-nomogram文章（七） cHarden13
题目：DevelopmentandValidationofaRadiomicsNomogramforPreoperativePredictionofLymphNodeMetastasisinColorectalCancerlogistic回归；放射组学；结直肠癌；淋巴结转移ref：医学方：临床医生的逆袭：深入解析临床研究预测类文章思路，带你成为科研“大牛”！一.纳入病人纳入2007.2-2010.
【思维导图认证班】戴兰第四幅思维导图作业-日程规划一为宝贝
我没有选择一日的时间来进行规划，而是以一个市级课题的完成来规划具体的步骤，因为这段时间都在集中做课题，没有安排其他的事情，所以没安排具体的时间。步骤分四部分：准备、撰写、查重和提交。准备又分为文献阅读准备和人员访谈准备；撰写分为结题报告、成果鉴定、成果要报。查重为知网，小于30%。提交分电子版和纸质版。心得：撰写前梳理整个课题的环节，撰写中边阅读文献边记录自己撰写的思路，撰写后按照思维导图傻瓜式准
200320复盘呼噜噜_77b5
上午上课，完成皮肤病学习。下午文献阅读，洗了个澡，然后完成单词，听力，阅读，口语。晚上部分完成老板任务。总得来讲，时间大部分利用了，效率和质量有待提高。
文献阅读：Mamba: Linear-Time Sequence Modeling with Selective State Spaces Espresso Macchiato 文献阅读 Mamba Transformer SSSM S6 SSM
文献阅读：Mamba:Linear-TimeSequenceModelingwithSelectiveStateSpaces1.文章简介2.方法介绍1.StateSpaceModels2.SelectiveStateSpaceModels3.实验考察&结论1.简单问题上的验证2.实际场景效果1.语言模型2.DNA模型3.语音模型3.细节考察1.速度和内存考察2.消融实验4.结论&思考文献链接：ht
2019-7-20晨间日记风雨兼程_007
今天是什么日子起床：0800就寝：2300天气：晴心情：美纪念日：无叫我起床的不是闹钟是梦想年度目标及关键点：结束一年的学校生活，重整行装再出发！本月重要成果：文献阅读报告选对方向今日三只青蛙/番茄钟看望阿姨，学习人家的好习惯看看优秀的人的家庭是怎么样的从中学习，思考人生成功日志-记录三五件有收获的事务给儿子修玩具枪，让其有自豪感陪娃学习，共同见证人家的成长信任感，信赖这东西靠培养财务检视看清楚自
Pytorch学习记录-GEC语法纠错我的昵称违规了
Pytorch学习记录-GEC语法纠错01五月第一周要结束了，接下来的三个月主要是文献阅读，准备8、9月的开题报告，技术类的文献集中在GEC和Textmaching的应用方面，读完之后找demo复现，然后应用。理论方面的论文也都是英文的，国内这块做的真的不行啊……学习计划GEC概念AlibabaatIJCNLP-2017Task1:EmbeddingGrammaticalFeaturesintoL
scanpy 教程 1：预处理和聚类 3k PBMCs Tiger Z 程序人生
「写在前面」学习一个软件最好的方法就是啃它的官方文档。本着自己学习、分享他人的态度，分享官方文档的中文教程。软件可能随时更新，建议配合官方文档一起阅读。推荐先按顺序阅读往期内容：文献篇：1.文献阅读：SCANPY：大规模单细胞基因表达数据分析2.文献阅读：scverse项目为单细胞组学数据分析提供了计算生态系统目录1预处理2主成分分析3计算邻域图4嵌入邻域图5对邻域图进行聚类6寻找标记基因官网教程
文献阅读：金鱼端脑细胞类型图谱揭示了空间结构和细胞类型进化的多样性 Tiger Z 程序人生
文献介绍「文献题目」Atelencephaloncelltypeatlasforgoldfishrevealsdiversityintheevolutionofspatialstructureandcelltypes「研究团队」AmitZeisel（以色列理工学院）、RonenSegev（本·古里安大学）「发表时间」2023-11-01「发表期刊」ScienceAdvances「影响因子」13.6
文献阅读02-2022-12-15 不学无术吗
题目：recentadvancesinRNAstructurome摘要：RNAstructuresareessentialtosupportRNAfunctionsandregulationinvariousbiologicalprocesses.Recently,arangeofnoveltechnologieshavebeendevelopedtodecodegenome-wideRNAstr
2024.2.4周报 Nyctophiliaa 人工智能深度学习
目录摘要一、文献阅读1、题目2、摘要3、模型架构4、文献解读一、Introduction二、实验三、结论二、PINN一、PINN比传统数值方法有哪些优势二、PINN方法三、正问题与反问题总结摘要本周我阅读了一篇题目为DeepResidualLearningforImageRecognition的文献，文章的贡献是作者提出了残差网络的思想，且证明了更深层的残差网络具有比VGG网络更低的复杂度和更高的
一种通过增强的面部边界实现精确面部表示的多级人脸超分辨率 qq_43314576 人工智能机器学习深度学习
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录摘要Abstract文献阅读：一种通过增强的面部边界实现精确面部表示的多级人脸超分辨率二、使用步骤1、研究背景2、方法提出3、相关方法3.1、FSR网络结构3.2、多阶段FSR网络结构4、实验工作5、方法比较LSTM代码学习2.1、什么是LSTM2.2、LSTM的处理过程2.3、LSTM代码分析总结摘要本周主要阅读了2020C
基于场景文字知识挖掘的细粒度图像识别算法 qq_43314576 算法深度学习人工智能
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录摘要Abstract文献阅读：基于场景文字知识挖掘的细粒度图像识别算法1、研究背景2、方法提出方法模块3、试验4、文章贡献二、RNN代码学习2.1、什么是RNN2.2、RNN的处理过程2.3、RNN简单代码实现总结摘要本周主要阅读了2022CVPR的文章，基于场景文字知识挖掘的细粒度图像识别算法，该论文提出了一种通过挖掘场景文
2019-05-06文献阅读记录一行白鹭上青天
2019-05-06阅读记录：题目：基于RS和GIS的桓仁县乡村聚落景观格局分析（2005年发表）期刊：测绘与空间地理信息Geomatics&SpatialInformationTechnology作者：于淼；李建东摘要：运用RS和GIS技术以及景观分析方法,以辽东山区桓仁县典型的6个乡镇乡村聚落为研究对象,选取乡村聚落斑块数、斑块面积、斑块密度、平均斑块面积、面积加权平均斑块分维数等5个景观指数
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户