是小糖啊

2018_Semantic SLAM Based on Object Detection and Improved Octomap_note

注释

(2022/4/15 上午9:14:24)

“ABSTRACT” (Zhang 等。, 2018, p. 1) (pdf)

提出了什么：

“In this paper we propose a Semantic SLAM system which builds the semantic maps with object-level entities, and it is integrated into the RGB-D SLAM framework.”
- 提出一个语义SLAM系统,构建对象级别实体的语义地图,并集成到RGB-DSLAM框架。

系统详细信息：

“The system combines object detection module that is realized by the deep-learning method, and localization module with RGB-D SLAM seamlessly.”
- 该系统将采用深度学习方法实现的目标检测模块与**RGB-D SLAM定位模块**无缝结合。
“The two modules are integrated together to obtain the semantic maps of the environment”
- 将这两个模块集成在一起，得到环境的语义图
“to improve the computational efficiency of the framework, an improved Octomap based on Fast Line Rasterization Algorithm is constructed.”
- 为了提高框架的计算效率，构造了一种基于快速线光栅化算法的改进Octomap。
“for the sake of accuracy and robustness of the semantic map, Conditional Random Field (CRF) is employed to do the optimization.”
- 为了提高语义地图的准确性和鲁棒性，采用条件随机场(CRF：Conditional Random Field)进行优化。

评估与结果：

“we evaluate our Semantic SLAM through three different tasks, i.e. Localization, Object Detection and Mapping.”
- 通过三个不同的任务来评估语义SLAM：定位、目标检测和映射。
- 与ORB-SLAM2和原始的RGB-D SLAM系统相比，在TUM数据集上的动态环境评估中，作者的系统定位精度和建图速度分别提高了72.9%和91.2%
“With the improved Octomap, the proposed Semantic SLAM is 66.5% faster than the original RGB-D SLAM.”
- 在改进的·下，提出的语义SLAM比原来的·提高了66.5%。

“I. INTRODUCTION”

当前研究现状与局限性

“most recent researches in the field of SLAM only focus on the geometric mapping, instead of both geometric and semantic mapping.”
- 目前在SLAM领域的研究主要集中在几何建图上，而没有同时考虑几何建图和语义建图。
“maps built by SLAM only can tell us where obstacles are and cannot supply semantic meaning.”
- SLAM构建的地图只能告诉我们障碍物在哪里，不能提供语义。
“In such conditions, it is difficult to let the robot do some high level tasks”
- 在这种情况下，很难让机器人完成一些高水平的任务
“the map created by traditional SLAM can only be useful in simple missions, such as navigation and path planning. Obviously, it cannot meet our expected intelligent demands.”
- 传统的SLAM创建的地图只能在简单的任务中使用，如导航和路径规划。显然，它不能满足我们预期的智能需求。

作者提出的系统

“present aRGB-Dsemantic SLAM framework, which not only construct the semantic maps based on the geometric SLAM, but also improve the localization accuracy according to the semantic maps.”
- 提出的RGB-D语义SLAM框架，该框架在几何SLAM的基础上构造语义映射，并根据语义地图提高定位精度。
“one module is the RGB-D SLAM based on sparse feature, which provides information about the locations of objects and also builds the 3D map.”
- 其中一个模块是基于稀疏特征的RGB-D SLAM,它提供了物体的位置信息，并建立了三维地图。
“The other one is object detection realized by deep learning method.”
- 另一个是用深度学习方法实现的目标检测模块。
“According to results of these two modules, we design the integrated RGB-Dsemantic framework, which provides the semantic map, and improves the localization accuracy.”
- 根据这两个模块的结果，我们设计了一个集成的RGB-D 语义框架，提供了语义图，提高了定位精度。
“our system creates a point clouds map of an environment with semantic meanings, which contains separate object models with semantic and geometric information.”
- 该系统创建了一个具有语义的环境点云地图，其中包含了具有语义和几何信息的独立对象模型。
“Our map not only maintains 3D point clouds by projecting semantic messages to 3D models, but also separates object entities independently.”
- 我们的地图不仅通过将语义消息投射到三维模型来维护三维点云，而且独立地分离对象实体。
“it can provide more advanced understanding of environment”
- 可以提供对环境更高级的理解
“The proposed system can detect and classify 80-200 object classes using deep-learning based detection algorithm, while the existing semantic mapping systems [42]-[43] can only detect less than 20 classes.”
- 利用基于深度学习的检测算法，该系统可以检测和分类80-200个对象类，而现有的语义映射系统[42]-[43]只能检测不到20个类。
“when our system builds maps, it can create 3D object models without requiring a-priori known 3D models.”
- 当我们的系统建立地图时，它可以创建三维对象模型，而不需要先验已知的三维模型。
“Because 3D object entities of a semantic class, such as cup, have many kinds of shapes, it can limit the environment understanding as the robot needs to know the 3D object model of an object before identification.”
- **局限：**由于一个语义类的三维物体实体，如cup，具有多种形状，机器人在识别前需要知道物体的三维模型，从而限制了对环境的理解。
“our system mainly focuses on object-level entities, however, some other semantic segmentation methods, such as [1][2], focus only on pixel-level entities. Maps generated by such methods are less usable, because in this condition objects are modeled offline and maintained all the time.”
- 我们的系统主要关注对象级实体(改进：速度快些)，而其他一些语义分割方法，如[1][2]只关注像素级实体。这种方法生成的映射的可用性较低(注：速度太慢)，因为在这种情况下，对象是离线建模的，并且一直在维护。

“II. Related Work”

“Nowadays, SLAM has reached a level of maturity where maps can be built nearly in real time.”
- 如今，SLAM已经达到了可以几乎实时构建地图的成熟程度。
- 语义可以使机器人更加智能，完成更加高层次的任务。

A. SLAM（综述部分）

“gmapping[3] is a typical SLAM algorithm based on Rao-Blackwellized Particle Filters.”
- 是一种典型的基于Rao-Blackwellized粒子滤波的SLAM算法。
“Google’s Cartographer[4] is the newest SLAM algorithm based on Lidar input, which provides a good loop closure detection.”
- 谷歌的Cartographer[4]是最新的基于激光雷达输入的SLAM算法，提供了很好的环路闭合检测。

“FEATURE-BASED METHODS”

基于特征的方法:传统方法，从图像中提取稀疏点，匹配相邻帧且恢复相机位姿。

“KinectFusion[5] uses RGBD camera to generate dense point clouds, recovers camera poses and scene structure with ICP algorithm, and accelerates tracking by CUDA.”
- KinectFusion[5]利用RGBD摄像机生成密集点云，用ICP算法恢复摄像机姿态和场景结构，用CUDA(高性能计算上，越来越多的被使用)加速跟踪。
“RGBD_SLAM[6] can also generate dense point clouds, it tracks ORB features and optimizes camera poses by G2O algorithm. However, the algorithm in RGBD_SLAM uses every frames to optimize camera poses instead of KeyFrames, and therefore it is computationally inefficient.”
- RGBD_SLAM[6]还可以生成密集点云，跟踪ORB特征**(注：在这里就有人使用ORB 特征了)**，并利用G2O算法优化摄像机姿态。然而，RGBD_SLAM中的算法利用每帧来优化相机姿态，而不是关键帧，因此计算效率较低。
“PTAM[7] utilizes KeyFrames to optimize camera poses, it therefore works fast and stable, but it lacks loop closure detection, relocalization and auto initialization, and it can only generate sparse point clouds.”
- PTAM[7]利用关键帧对摄像机姿态进行优化，速度快、稳定性好，但缺乏闭环检测、重定位和自动初始化，只能生成稀疏点云。(注：人家只是一个里程计，要那么多要求干什么？这可是划时代的进步)
“ORB-SLAM[8], which is the state of the art in this field, not only supports RGBD camera, stereo camera and mono camera, but also contains loop-closing, relocalization, and auto initialization. It can work well both in small and large scale environments.”
- ORB-SLAM[8]是该领域的最新研究成果，它不仅支持RGBD摄像机、立体摄像机和单目摄像机，而且还包含回环、重定位和自动初始化功能。它可以很好地工作在小型和大型环境中。(注：特征点法的巅峰之作)

“DIRECT METHODS”

相机位姿直接从图像的强度（灰度不变假设）估计得到

“DSO_SLAM[9] uses Direct Methods to estimate poses and maintains 5 to 7 keyframes through sliding windows, but it lacks loop closure, which leads to more errors over time.”
- DSO_SLAM[9]采用直接方法估计姿态，并通过滑动窗口保持5到7个关键帧，但缺乏回环，随着时间的推移会导致更多的错误。
“LSD_SLAM[10] can generate semi-dense depth image, and it is used to match next frame in order to estimate camera poses. However, it is sensitive to light change.”
- LSD_SLAM[10]可以生成半稠密的深度图像，并用于匹配下一帧以估计摄像机姿态。但是，它对光的变化很敏感。
“SVO_SLAM[11] belongs to half Direct Methods, because only sparse model-based image alignment uses Direct Methods, while pose estimation and bundle adjustment depend on features matching.”
- SVO_SLAM[11]属于半直接方法，因为只有基于稀疏模型的图像对准使用直接方法，而姿态估计和束调整依赖于特征匹配。

“B. Object Detection and Semantic Segmentation”

传统的语义分割

“Some of the methods can only detect few objects through features stored in databases with traditional computer vision algorithms [34].”
- 传统的计算机视觉算法只能通过存储在数据库中的特征来检测少数目标[34]。(注：在深度学习之前就已经可以进行语义分割了)

基于深度学习的语义分割

“However, some researches based on deep learning can detect many objects, even the objects belonging to the same class but having different shapes.”
- 而一些基于深度学习的研究可以检测出很多物体，甚至是属于同一类但形状不同的物体。(注：深度学习出现后简单粗暴，准确率还高，就是速度不怎么样，特别是对实时性要求很高SLAM领域)
“we are interested in the task of object detection”
- 我们对目标检测的任务感兴趣**(注：主要是为了区分动态物体)**
“This network extracts features through AlexNext[38] and realizes classification by SVM[36], but it takes several seconds to process one image.”
- 该网络通过AlexNext[38]提取特征，通过SVM[36]实现分类，但处理一幅图像需要几秒钟的时间。注：速度慢吧
“In order to improve R-CNN, Fast R-CNN[14] maps feature map to feature vector, and it is used as an input to fully connected layer by ROI-pooling, and replaces SVM with softmax.”
- 为了改进R-CNN，Fast R-CNN[14]将特征映射到特征向量，通过ROI池化将其作为全连通层的输入，并用Softmax代替SVM。
贴一下链接，后边在仔细看看：

(ROI Pooling：ROI Pooling（感兴趣区域池化） - 刘下的文章 - 知乎 https://zhuanlan.zhihu.com/p/65423423
SVM：【机器学习】支持向量机 SVM（非常详细） - 阿泽的文章 - 知乎 https://zhuanlan.zhihu.com/p/77750026
AlexNet：深度学习卷积神经网络-AlexNet - Adia的文章 - 知乎 https://zhuanlan.zhihu.com/p/42914388
softmax: https://blog.csdn.net/bitcarmanlee/article/details/82320853
“It is therefore faster than R-CNN, but it is still too slow for a real-time requirement in SLAM. Faster R-CNN[35] utilizes the Region Proposal Network (RPN) to generate object proposals and adds anchor and shared features to promote the speed of detection, its speed can reach up to 5fps.”
- 比R-CNN更快，但对于SLAM中的实时要求来说，它仍然太慢了。Faster R-CNN[35]利用区域建议网络(RPN)生成目标建议，并增加锚点和共享特征来提高检测速度，其速度可达5fps。(注：还是太慢了)
“Yolo” 快速物体检测算法，用S X S 个网格替换物体提议，并对这些网格的分类实现最终检测。注：使用YOLO来检测动态物体，后边把动态物体上的特征点直接去除

“C. Semantic SLAM”

在前边就重复了好多遍的语义SLAM

“Semantic SLAM is used to calculate the motion and position, and object detection and semantic segmentation are utilized to generate semantic map. Semantic SLAM can be categorized into two types based on the object detection methods.”
- 利用语义SLAM计算运动和位置，利用目标检测和语义分割生成语义地图。根据对象检测方法的不同，语义SLAM可以分为两类。
“The first type uses traditional methods to detect object. Real-time Monocular Object SLAM[17] is the most common one, which employs Bags of Binary Words and a database with 500 3D object models to provide a real-time detection. But it limits a lot because 3D object entities of a semantic class like cup having many different kinds of shapes.”
- 第一类采用传统方法检测目标。实时单目对象SLAM[17]是最常见的一种，它使用二进制词袋和一个拥有500个3D对象模型的数据库来提供实时检测。但是它限制了很多，因为像cup这样的语义类的3D对象实体有很多不同的形状。
“[18] generates object proposals through multi-view images, then extracts dense SIFT descriptors from these proposals and predicts their classes. [19] employs DPM[12], in which Hog feature is used to describe the object.”
- [18]通过多视图图像生成对象建议，然后从这些建议中提取密集的SIFT描述符并预测它们的类别。[19]使用DPM[12]，其中Hog特征用于描述对象。注：这些特征精度很高，但是太慢
“The other kind of SLAM is using deep-learning methods to do the object recognition, such as method proposed in [20], however, the semantic information is built based on pixels instead of object entities.”
- 另一种是采用深度学习的方法进行目标识别，如文献[20]提出的方法，但是语义信息是基于像素而不是基于目标实体来建立的。
“In fact, this approach is too complex and not practical due to two reasons: (1) robot wants to understand the major semantic meaning of the environment in mission execution, which means it does not care about every pixel’s semantic information, (2) computational speed is not sufficient to perform pixel level semantic classification in robot SLAM system.”
- 由于以下两个原因，这种方法过于复杂和不实用：（1）机器人在执行任务时希望理解环境的主要语义，这意味着它不关心每个像素的语义信息；（2）在机器人SLAM系统中，计算速度不足以进行像素级语义分类。注：鱼与熊掌我都想要

“D. Mapping”

“Several approaches have been proposed to build 3D environments, and 3D maps can be represented with point clouds, elevation maps[21], multi-level surface maps[22] and so on.”
- 建立三维环境的方法很多，3D地图可以用点云、高程图[21]、多层曲面图[22]等表示。注：不同地图侧重领域不同，建图速度也相差很大

对不同地图的批判

“Point clouds store large number of points and consume a lot of memory.”
- 点云存储大量的点，消耗大量的内存。
“it cannot easily differentiate between cluttered and free spaces.”
- 它不能轻易区分杂乱和自由的空间。注：地图混叠吗？
“Elevation maps and multi-level surface maps cannot represent unmapped areas, although they are efficient. More importantly, these methods can not represent arbitrary 3D environments.”
- 高程图和多级表面图不能表示未映射的区域，尽管它们是高效的。更重要的是，这些方法不能表示任意的三维环境。

吹爆Octmap

“Octomap[23] is adopted which is used widely in the field of mapping. OctoMap has advantages of taking measurement uncertainty into account, being space efficient and implicitly representing free and occupied space.”
- 采用了在绘图领域中应用广泛的Octomap[23], OctoMap具有考虑测量不确定度、空间效率高、隐式表示自由空间和占用空间等优点。
“it still takes too much time to build the maps.”
- 它仍然需要太多的时间来建立地图。注：建图时间还是太多了，别急，后边作者提出了个加速算法，我推导过

III. System Overview

A. SLAM分析

开始过渡了，当前SLAM在动态环境方面的不足

“the geometric aspect of the SLAM problem is well understood, and has reached a level of maturity where city level maps can be built precisely and even in real time.”
- SLAM问题的几何方面已经得到了很好的理解，并且已经达到了一个成熟的水平，可以精确甚至实时地构建城市级地图。
“But they can only work well in static environments or the one with small dynamic objects.”
- 如今的SLAM只能在静态环境或具有小型动态对象的环境中工作。
“In the scene with small dynamic objects, as only few feature points are situated at dynamic objects, the SLAM can therefore still work well.”
- 在具有小动态目标的场景中，由于只有少量的特征点位于动态目标上，所以SLAM仍然可以很好地工作。
“Feature-Based SLAM is easy to be effected by large moving objects.”
- 基于特征的SLAM容易受到大型运动目标的影响。
“most Feature-Based SLAM systems are built based on a strong assumption that the number of features on moving objects is much smaller than those on static objects.”
- 大多数基于特征的SLAM系统都建立在一个强假设基础上，即运动物体上的特征数量比静态物体上的特征数量少得多。

建立在动态物体的特征远少于静态物体的上的特征呗

问题：动态物体与静态物体的区分标准是什么？很经典的一幕就是巨大而移动缓慢的动态物体经常被识别为静态物体，但实际上人家不是，所以作者后边对ORB-SLAM2作了改进：不用参考关键帧了，直接使用当前关键帧(牺牲建图精度，提高动态物体的识别准确度) 终究是要取舍的

“Octomap is based on OcTree structure which is good for searching and building, while point clouds only store each points without any structures. Octomap can carry not only the RGB and position information but also the semantic messages.”
- Octomap是基于八叉树结构，Octmap不仅可以携带RGB和位置信息，还可以携带语义信息。
“the point clouds only store the original messages from RGB-D camera.”
- 点云只存储来自RGB-D摄像机的原始信息。点云携带的信息少了

B. ORB-SLAM 分析

欢迎来到ORB-SLAM2

“Tracking thread is in charge of localizing the camera with every frame in real time and deciding when to insert a keyframe. In tracking thread, it performs an initial feature matching with the previous frame and optimizes the pose by Bundle Adjustment (BA) algorithm. If tracking is lost, it performs a global re-localization with Bag of Word, then searches map points by re-projection and optimizes the pose with local map points. Finally, the tracking thread can decide if a new keyframe can be generated.”
- 跟踪线程负责实时定位相机的每一帧，并决定何时插入关键帧。在跟踪线程时，对前一帧进行初始特征匹配，并通过束调整(BA)算法对姿态进行优化。如果跟踪丢失，则利用Word包进行全局重新定位，然后通过重新投影搜索地图点，并利用局部地图点优化姿态。最后，跟踪线程可以决定是否可以生成新的关键帧。
“the Local Mapping thread will triangulate new map points through its relative keyframes. Then, it optimizes the pose of relative keyframes and map points with BA. Finally, redundant keyframes and low quality map points are removed.”
- 局部建图线程将通过其相对关键帧对新的地图点进行三角化。然后，利用BA优化相关关键帧和地图点的姿态。最后去除冗余关键帧和低质量地图点。
“The Loop Closing thread responses to loop closure with every keyframe. If a loop is detected, the similarity transformation is computed which represents the drift accumulated in the loop.”
- 回环检测线程响应每个关键帧的回环。如果检测到回环，则计算表示回环中积累的漂移的相似变换。然后对齐两个回环边的重复点融合。最后在相似度约束下进行位姿图优化，以实现全局一致性。
“Although ORB-SLAM2 is a very practical algorithm, it still faces some questions, such as how to work well in dynamic environments, how to supply semantic information and maps and so on.”
- 虽然ORB-SLAM2是一个非常实用的算法，但它仍然面临着一些问题，如如何在动态环境中工作，如何提供语义信息和地图等。注：对ORB-SLAM2说了那么多就是为了这一句，批判它，批判之后要解决问题啊，引出下边

“C. Overview of Semantic SLAM System”

注：本论文的主角登场

“In the proposed Semantic SLAM system, ORB-SLAM2 is in charge of camera localization and mapping with every RGB-D frames.”
- 在所提出的语义SLAM系统中，ORB-SLAM2负责摄像机的定位和每个RGB-D帧的建图。
“Tracking thread is responsible for tracking by keyframes instead of reference frames, in order to decrease the effect of moving objects.”
- 跟踪线程负责通过关键帧而不是参考帧进行跟踪，以减少运动目标的影响。 注：这就前边说的牺牲定位精度(稍微牺牲了一丁点，结果部分来看基本没啥牺牲，然后显著降低了运动目标的影响，很值)
“Local Mapping thread adds a few keyframes to create semantic messages, because semantic messages extraction cannot fulfill the requirement of real-time performance.”
- 由于语义消息提取不能满足实时性的要求，局部建图线程增加了一些关键帧来创建语义消息。 注：对采用语义SLAM后出现实时性下降问题的解决方案
“After getting keyframes from ORB-SLAM2, YOLO[15] is used to detect objects in each keyframe to get semantic message. In our implementation, we use the tiny-weight version to detect objects, because this version is trained on MS-COCO Dataset, which contains 80 different kinds of objects.”
- 从ORB-SLAM2中获取关键帧后，利用YOLO[15]对每个关键帧中的对象进行检测，得到语义消息。在我们的实现中，我们使用微小权重版本来检测对象，因为这个版本是在包含80种不同类型对象的MS-COCO数据集上训练的（类型多嘛）。
“object regularization based on CRF is used to correct the probabilities of each object computed by YOLO.”
- 采用基于CRF的对象正则化方法，对YOLO算法计算出的每个对象的概率进行修正。
- CRF(固定速率系数)
“constraints between objects are computed according to the statistics of MS-COCO Dataset, and it is then used to optimize the object probabilities computed by YOLO detection.”
- 根据MS-COCO数据集的统计量计算对象间的约束条件，并利用该约束条件对YOLO检测计算的对象概率进行优化。
“When accurate labels of each object are captured, filter process is used to provide more stable features and remove the unstable features which are always locate on the moving objects. At the same time, the temporary objects are created, which contain point clouds produced by projection.”
- 当捕捉到每个目标的准确标记时，通过滤波处理提供更稳定的特征，去除运动目标上的不稳定特征。同时创建临时对象，其中包含投影产生的点云。
“we use data association module to decide either to create a new object or associate it with existing object in the map according to the matching score.”
- 利用数据关联模块，根据匹配结果决定创建新的对象或将其与地图中已有的对象进行关联。
“in order to find correspondence between existed objects and temporary objects, we first build relationship between keyframes and objects.”
- 为了找到已有对象与临时对象之间的对应关系，我们首先建立关键帧与对象之间的关系。
“Kd-Tree structure is used to accelerate the computation of matching score.”
- 采用Kd-Tree结构加速匹配分数的计算。
“When the existing objects can be combined with the temporary objects, the former can be updated with the new detection by a recursive Bayesian process.”
- 当现有对象与临时对象可以结合时，可以通过递归贝叶斯过程用新的检测更新前者。注：对象更新方法
“Map Generation uses point clouds stored in objects to generate map based on Octomap, which is accelerated by multi-threads realization and Fast Line Rasterization algorithm.”
- 地图生成是利用存储在对象中的点云来生成基于Octomap的地图，通过多线程实现和快速线程光栅化算法来加速地图生成。注：地图加速方法，现在多线程都是常规操作了，
“In order to integrate the concept of semantic into the framework of ORB_SLAM2, we construct relationship between keyframes and objects by referring to the implementation method between keyframes and map points, which has existed in ORB-SLAM2.”
- 为了将语义的概念融入到ORB-SLAM2框架中，借鉴了ORB-SLAM2中已有的关键帧与地图点之间的实现方法，构建了关键帧与对象之间的关系。
“In ORB_SLAM2, each keyframe stores map points that it has observed in the frame image, at the same time, each map point records the keyframes which have observed the map point sequentially.”
- 在ORB_SLAM2中，每个关键帧存储其在帧图像中观察到的地图点**(每个关键帧存储它自己观测到的地图点)，同时每个地图点记录观察到该地图点的关键帧（你记得我，我也记得你）**。
“we can build relationship between keyframes and perform some optimization, such as analyzing whether a keyframe is redundant or deciding whether a map point has high quality.”
- 我们可以建立关键帧之间的关系，并进行一些优化，如分析一个关键帧是否冗余或判断一个地图点是否具有高质量。这里没有说明怎样判断关键帧是否冗余，怎样判断地图点是否质量高，像ORB-SLAM2那样判断吗？
“we build the relationship between keyframe and each object as followings.”
- 建立关键帧和每个对象之间的关系，如下所示。

“In our realization, each object ܱ $O_i$ contains :

Word coordinates of each point cloud that are located on the object.

A fixed number of class labels and the corresponding confidence score which is calculated through a recursive Bayesian update.

Keyframes which can observe this object.

Kd-tree structure generated through the object’s point clouds, which is used for fast search.

The class label which this object belongs to.

The number of observations.”

在我们的实现中，每个对象 $O_i$ 包含：

位于该对象上的每个点云的字坐标；

固定数量的类标签和相应的置信度得分，通过递归贝叶斯更新计算；

可以观察该对象的关键帧；

通过该对象的点云生成Kd-tree结构，用于快速搜索；

该对象所属的类标签；

观察次数。

“Each keyframe $K_i$ should store :
1. The corresponding RGB image which is used to detect objects.
2. The corresponding depth image which is used to generate point clouds.
3. Objects that have been observed in this keyframe.”
每个关键帧应该存储：
1. 对应的RGB图像，用于检测目标；
2. 对应的深度图像，用于生成点云；
3. 在该关键帧中观察到的目标。
“we create an object database, in which all the detected objects are stored.
- 自己创建一个对象数据库，里边存储了所有检测到的对象。

“Semantic Mapping”

基于ORB-SLAM2的语义SLAM

“A. Improved SLAM” A.改进SLAM

“In ORB_SLAM2, Tracking thread localizes the camera with every frame through four steps. First, ORB features are extracted from RGB images. Second, ORB features are used to perform feature matching with the reference frame, preliminarily calculate the camera pose and return the number of matched map points. Third, the camera pose is optimized again with the matched locale map points which are searched through the relative keyframes. Finally, tracking thread decides whether a new keyframe is inserted based on some principles.”
- 在ORB_SLAM2中，跟踪线程通过四个步骤对每个帧的相机进行定位。
- 首先，从RGB图像中提取ORB特征。
  其次，利用ORB特征与参考帧进行特征匹配，初步计算摄像机位姿并返回匹配的地图点数。
  再次，通过关键帧搜索匹配的场景地图点，对相机姿态进行优化。
  最后，跟踪线程根据一些原则判断是否插入新的关键帧。
“tracking thread module is modified in the following three ways.”
- 跟踪线程模块通过以下三种方式进行修改。

改用关键帧的论述

“In order to reduce the effect of dynamic objects, the second step in tracking thread is changed to track by keyframes instead of reference frames.”
- 为了减少动态对象对线程跟踪的影响，将跟踪线程的第二步由参考帧改为关键帧跟踪。
注：将参考帧改为直接用关键帧，略微降低定位建图精度，提高对动态物体的适应性
“If SLAM tracks by reference frame, the camera pose calculation can easily be effected by large moving objects.”
- 给出了原因：降低大型运动物体的影响
“This is because, when a large moving object passes by, original SLAM will track features on the moving object, which affects the tracking accuracy.”
- 这是因为当一个大的运动物体经过时，原有的SLAM会对运动物体上的特征进行跟踪(注：误将大型运动物体认为是静态的环境物体)，从而影响动态环境中的跟踪精度。
“if SLAM tracks feature by keyframes, it can still calculate the correct camera pose before the new keyframe insertion.”
- 如果SLAM通过关键帧跟踪特征，它仍然可以在新的关键帧插入之前计算正确的摄像机姿态。
“The essential reason is that old keyframe doesn’t contain features of the moving object.”
- 其根本原因是**旧的关键帧(注：相邻的前几帧，若有，地图更鲁棒，但是会包含前几帧的信息)**不包含运动对象的特征。
“choose the Levenberg-Marquardt method, from G2O[50] which contains several optimization algorithm to optimize the pose of the current frame.”
- 从G2O[50]中选择Levenberg-Marquardt方法，其中包含多个优化算法来优化当前帧的姿态。
“This method needs a good initial estimated value for optimization. Therefore we use the constant velocity motion model to predict the position of the current frames as a G2O initial value before optimization.”
- 该方法需要一个良好的初始估计值进行优化。因此，我们采用等速运动模型预测当前帧的位置，作为优化前的G2O初值。
“The third step in tracking process is modified to compare the number of matched inliers with the result of the second step to judge whether the tracked current frame is lost.”
- 对跟踪过程中的第三步进行了改进，将匹配的内点数与第二步的结果进行比较，判断被跟踪的当前帧是否丢失。 注：这样好像更容易丢啊，人家ORB-SLAM2用的参考帧和前边的信息有关联，更加鲁棒，这直接使用关键帧，妥妥的马尔科夫链啊
“In ORB-SLAM2, matched inliers are compared with a constant value in the third step. It is easy to lose tracking when the camera moves fast, because the ORB feature points of current frame may only match with the map points observed by the last frame.”
- 在ORB-SLAM2中，第三步将匹配的inlier与恒定值进行比较。当摄像机快速移动时，由于当前帧的ORB特征点可能仅与上一帧观测到的地图点相匹配，容易丢失跟踪（注：对快速运动场景不适应了又）。
- 注：还有一种解释：ORB-SLAM2关键帧上的特征点更少一些，但是人家用的特征点都是参考帧，与前几帧的信息相关，有约束不好匹配。语义SLAM的关键帧特征点多一些，但是这个语义SLAM的匹配精度没有ORB-SLAM2高
“In this case, the number of the observed map points will be less than the constant value. Therefore, the third step should compare the number of matched inliers with the number of matched inliers computed by the last frame.”
- 在这种情况下，观察到的地图点数将小于常数值。因此，第三步应该将匹配Inlier的数量与上一帧计算的匹配Inlier的数量进行比较。
“The second step function computes the number of matched map points between the last keyframe and the current frame, therefore we should compare the number of matched inliers with the result of the second step.”
- 第二步函数计算上一个关键帧和当前帧之间匹配的映射点的数量，因此我们应该将匹配的inlier的数量与第二步的结果进行比较。
“Tracking thread is changed to create more keyframes.”*
- 跟踪线程被改进以创建更多的关键帧。ORB-SLAM2中，**当相机移动时观测到的特征越来越少，跟踪容易丢失。**因此，需要更多的关键帧来创建更多的地图点。

“B. Object Detection”

“In semantic SLAM, individual objects are important entities which not only can supply semantic information for the map, but also can enhance the localization accuracy”
- 语义信息对SLAM的帮助：在语义SLAM中，单个目标是重要的实体，它们不仅可以为地图提供语义信息，而且可以提高定位精度
“In deeplearning area, DeepLab[39] and FCN[40] can provide pixel level semantic segmentation, however, RCNN, Fast-RCNN and Faster-RCNN can supply the object level’s bounding box detection. Furthermore, they may generate too many object proposals which cause detection of same region multiple times.”
- 在deeplearning区域，DeepLab[39]和FCN[40]可以提供像素级的语义分割，而RCNN、Fast-RCNN和Faster-RCNN可以提供对象级的边界盒检测。此外，它们可能会产生太多的目标建议，导致同一区域多次检测。
“Thus, many of them are too slow, and they cannot satisfy the real-time requirement when they are integrated with SLAM.”
- 因此，在与SLAM集成时，很多算法速度太慢，不能满足实时性的要求。
“YOLO can process 45 images per second, therefore we choose YOLO as the object detection method to generate a number of object proposals in the form of bounding boxes for every keyframe in our proposed semantic SLAM system.”
- YOLO每秒可以处理45幅图像，因此我们选择YOLO作为对象检测方法，在我们提出的语义SLAM系统中，以包围盒的形式为每个关键帧生成大量的对象建议。（速度还可以）
“We use the network trained on the COCO dataset instead of PASCAL VOC, because COCO dataset contains 80 types of objects, while PASCAL VOC dataset only has 20 kinds of objects.”
- 由于COCO数据集包含80种对象，而PASCAL VOC数据集只有20种对象，所以我们使用了在COCO数据集上训练的网络来代替PASCAL VOC。
“After some experiments, we find that normal YOLO still takes about 0.04s per images which cannot fulfill realtime requirement. However, Tiny YOLO weights can fulfill all these requirements.”
- 经过一些实验，我们发现正常的YOLO仍然需要0.04s左右的每幅图像，不能满足实时性的要求。然而，微小的YOLO权重可以满足所有这些要求。
“we use Tiny YOLO weights instead of normal YOLO weights. In the implementation, YOLO detects the new keyframe in Local Mapping module after the new keyframe is added and wrong map points are culled sequentially.”
- 我们使用微小的YOLO权重而不是正常的YOLO权重。在实现中，YOLO在添加新的关键帧后，在本地映射模块中检测新的关键帧，并依次剔除错误的映射点。

“C. Object Regularization” C.对象正则化

“Although we can get the semantic label for each object through YOLO algorithm, semantic context among objects has not been explicitly incorporated into the object categorization models.”
- 虽然我们可以通过YOLO算法得到每个对象的语义标签，但对象之间的语义上下文并没有显式地纳入到对象分类模型中。
“Some researchers have found that context information is good for semantic segmentation, however, object context requires access to the referential meaning of the object [25].”
- 一些研究者发现语境信息有利于语义切分，然而，对象语境需要获取对象的参考意义[25]。
“In other words, when performing the task of object categorization, objects’ category label must be assigned with respect to other objects in the scene, assuming there is more than one object present.”
- 换句话说，在执行对象分类任务时，假设场景中存在不止一个对象，就必须为场景中的其他对象分配对象的类别标签。
“In the task of image segmentation, context information is used to optimize the final result with CRF (Conditional Random Filed) algorithm.”
- 在图像分割中，利用上下文信息，采用条件随机域算法对最终分割结果进行优化。
“The main problem that CRF can solve effectively is how to model the class scores calculated by some classifiers and local information of images simultaneously.”
- CRF能够有效解决的主要问题是如何将分类器计算的分类分数和图像的局部信息同时建模。
“Then this problem can be treated as a problem of maximizing a posteriori.”
- 那么这个问题可以看作是一个最大后验概率的问题。
“We can define unary potentials to model the probabilities that each pixel or patches belongs to each category, and pairwise potentials to model relation between two pixels or patches.”
- 我们可以定义一元势函数来模拟每个像素或块属于每个类别的概率，定义点对势函数来模拟两个像素或块之间的关系。
  语义分割之DeepLabv1 - SpartacusIn21的文章 - 知乎 https://zhuanlan.zhihu.com/p/53421692
“The frequently used CRF models contain unary potentials, pairwise potentials and some weighted parameters. The pairwise potentials are modeled in 4 or 8 neighbors, like [44]-[46-51], therefore this structure is limited in modeling long distances on the image.”
- 常用的CRF模型包括一元势函数、点对势函数和一些加权参数。点对势函数是在4或8个邻居中建模的，因此这种结构在图像上的长距离建模中是有限的。
“Toyoda et al. [32] proposed a fully connected CRF to integrate local information and global information jointly which sets up pairwise potentials on all pairs of pixels or patches in semantic image labeling task. By modeling long range interactions, dense CRF provides a more detailed labeling compared to its sparse version. The dense CRF with Gaussian kernel potentials has emerged as a popular framework for semantic image segmentation tasks”
- 丰田章男等人。[32]提出了一种将局部信息和全局信息联合集成的全连通CRF算法，在语义图像标注任务中，在所有对像素或片上建立成点对势函数。通过对远程交互进行建模，稠密CRF提供了比稀疏版本更详细的标记。具有高斯核结合势函数的稠密CRF已经成为一种流行的语义图像分割框架
“we construct a probabilistic object-based dense CRF. Compared with CRF based on pixel level, our proposed model can reduce the computational complexity significantly.”
- 我们构造了一个基于对象对象的稠密CRF。与基于像素级的CRF相比，该模型可以显著降低计算复杂度。
构建了一个基于对象概率的稠密CRF。
给出基于对象模型的Gibbs energy function:
$P(x)=\frac{1}{Z} \exp (-E(x))$
$E(x)=\sum_{i} \psi_{u}\left(x_{i}\right)+\sum_{iE(x)=i∑ψu(xi)+i<j∑ψp(xi,xj)$
- $x$ : 分配给对象特征的标签
- $i, j$ 的范围从 $1 - k (k 是地图中对象的数量)$
- $Z$ 是归一化因子
- 在基于对象的CRF模型中，目标是最小化 $E (x)$ 来获得最终的分配标签
一元势函数 $\Psi_{u}$ 建模CRF中每个vertex
点对势函数 $\Psi_{p}$ 建模CRF中vertices之间的联系
- (G2O?)
一元势函数和点对势函数的一般表达形式：
$\psi_{u}\left(x_{i}\right)=-\log P\left(x_{i}\right)$
$\psi_{u}\left(x_{i}, x_{j}\right)=\mu\left(x_{i}, x_{j}\right) \sum_{m=1}^{K} \omega_{m} \exp \left(-a_{m}\left(f_{i, j}\right)^{2}\right)$
- $P(x_{i})$ : YOLO算法检测到的第 $i^{}$ 对象的标签概率分布
- $\omega$ : 线性组合的权重
- $\mu$ : 标签兼容函数，描述两个不同类同时出现在相邻位置的可能性
- Potts 模型是最简单的标签兼容函数，并在本系统中使用：
- $\mu\left(x_{i}, x_{j}\right)=\left\{\begin{array}{cc} 0, & \text { if } x_{i}=x_{j} \\ 1, & \text { otherwise } \end{array}\right\}$
- $f_{i,j}$ : 第 $i$ 个对象和第 $j$ 个对象的约束
- $f_{i, j}$ 计算如下：
- $f_{i, j}=\frac{1}{p_{i, j}}f_{i, j}=\frac{1}{p_{i, j}}$
  - $p_{i,j}$ : 第 $i$ 个对象和第 $j$ 个对象出现在同一位置的概率，通过COCO数据集进行统计获得
每个图像都有不同种类的对象在同时显示，因此，根据这些图像计算标签共视关系计数矩阵
矩阵中的元素 $i, j$ 表示标签为 $i$ 的对象在标签为 $j$ 的对象的训练图像中图像的次数
对角线元素表示对象在训练集中的频率，标签共视关系计数矩阵的部分，及混淆矩阵如图所示：
- [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gfEIqQmS-1650186682956)(2018_Semantic%20SLAM%20Based%20on%20Object%20Detection%20and%20Improved%20Octomap_math.assets/image-20220414144210932.png)]
$p_{i,j}$ 的计算：
$p_{i, j}=\frac{n_{i, j}}{n_{j}}$
- $n_j$ : 表示对象$j $ 的频率
- $n_{i,j}$ : 对象 $i$ 和对象 $j$ 同时出现的频率
“After we get the unary and pairwise potentials, we can use mean fields method to optimize the CRF model. Based on this method, we not only utilize the YOLO object detection, but also integrate the object context information to refine the final object confidence score”
- 在得到一元势和两两势后，我们可以用平均场法对CRF模型进行优化。在此基础上，我们不仅利用了YOLO目标检测方法，还结合了目标的上下文信息对最终的目标置信度得分进行了精化

“D. Temporary Objects Generation”D.临时对象生成

“After getting the accurate semantic label, we can filter features and map points according to the semantic label type, thus the effects of dynamic objects can be reduced to the maximum extent.”
- 在得到准确的语义标签后，根据语义标签类型滤除特征和地图点，从而最大限度地减少动态对象的影响。

“feature filter” 特征滤波器：

首先，将对象分成静态与动态两种类型。然后从上面的算法计算标签和边界框，我们排除了属于动态对象的ORB特征、地图点和DBoW特征，保留了静态对象上的特征

“An original image is shown in Fig.5(a); Fig.5(b) shows ORB features extracted from the original image; Fig.5© shows the semantic messages extracted from the original image; Fig.5(d) shows the result of the features filter.”
原始图像如图5(a)所示；图5(b)示出了从原始图像中提取的球体特征；图5©示出了从原始图像提取的语义消息；图5(d)示出了特征滤波器的结果。
利用语义信息去除动态位于动态兑现上的点，但是从图5(d)中左下角人的裤子上的特征点还是没能去除
“After the feature filter process, we generate some temporary objects which contain object size, object type, object confidence scores, and the corresponding point clouds.”
- 在特征过滤过程之后，我们生成一些临时对象，这些对象包含对象大小、对象类型、对象置信度分数以及相应的点云。
“point clouds generated by the RGB-D camera contain some noises.”
- 然而由RGB-D摄像机生成的点云包含一些噪声。
如何去除噪声
“In order to remove these noises, we apply statistical calculation to point clouds. If the points deviate from the average, they may be noises, and can therefore be removed.”
- 为了去除这些噪声，我们对点云应用统计计算。如果这些点偏离平均值，它们可能是噪声，因此可以消除。
“in order to save memory, point clouds are down-sampled with 5 mm resolution. When getting the robust temporary objects and point clouds, we use data association to decide whether those temporary objects are new objects or already exist in the map.”
- 为了节省内存，点云以5毫米分辨率下采样。在获取鲁棒的临时对象和点云时，利用数据关联来判断这些临时对象是新的还是已经存在于地图中。

“E. Data Association” E.数据关联

“Data association is very important for robust SLAM. In our semantic SLAM system, data association is used to judge the detected objects. In the proposed method, there are two steps for data association.”
- 数据关联对于健壮的SLAM至关重要。在我们的语义SLAM系统中，利用数据关联来判断检测到的对象。在所提出的方法中，数据关联分为两个步骤。

数据关联

First

“First, we need to find the candidate objects for each temporary objects.”
- 首先，我们需要为每个临时对象找到候选对象。
“Through the relationship between keyframes and map points, we can easily find keyframes which are relative to the current keyframe. These keyframes not only are close to the current keyframe, but also are more likely to contain same objects because they have enough shared map points.”
- 通过关键帧与映射点之间的关系，可以方便地找到与当前关键帧相对应的关键帧。这些关键帧不仅与当前关键帧接近，而且更有可能包含相同的对象，因为它们有足够的共享地图点。
“With the relationship between keyframes and objects, the objects seen by these relative keyframes are considered as the candidate objects for every temporary object.”
- 利用关键帧与对象之间的关系，将这些关键帧所看到的对象作为每个临时对象的候选对象。
“When KeyFrame4 is inserted, the system detects object3, object4 and object5, which are treated as three temporary objects.”
- 当插入KeyFrame4时，系统检测到object3、object4和object5，（关键帧4能观测到的对象）它们被视为三个临时对象。
  每个关键帧对应的临时对象：
  将当前关键帧能够看到的对象作为临时对象
“In order to find the candidate objects for such three temporary objects, we take the following two steps.”
- 为了找到这三个临时对象的候选对象，我们采取以下两个步骤。
“First, we search the relative keyframes for KeyFrame4.”
- 首先，我们搜索相关的关键帧来查找KeyFrame4。关键帧2和关键帧3都有共同的地图点，一个为2个另一个为3个。论文中却只说了关键帧3和关键帧4是相对关键帧 相对关键帧的选取规则不明
  问题：相对关键帧的选取规则好像有点问题，看前面的话，好像是具有共视关系数目最多的作为相对关键帧，但是，根据图7，对象2明显不能被关键帧3和4观测到。若相对关键帧的选取只需要有共视关系的就是的化，那关键帧2也应该是关键帧
其次，推断对象2、对象3和对象4可以被关键帧3和关键帧4观测**（问题：从图中看出对象2不能被关键帧3和4观测）** 要说具有相同地图点的关键帧为相对关键帧（关键帧2、关键帧3、关键帧4为相对关键帧，而不是只有3和4），然后相对关键帧所观测到的对象（2、3、4）都被推断成能被相应关键帧组观测到

此处有疑问，感觉作者写的有点问题哈

“therefore Object2, Object3 and Object4 are regarded as candidate objects for temporary objects observed by KeyFrame4.”
- 因此，Object2、Object3和Object4被视为由KeyFrame4观察的临时对象的候选对象。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6oR7NIT9-1650186682956)(2018_Semantic%20SLAM%20Based%20on%20Object%20Detection%20and%20Improved%20Octomap_note.assets/image-20220417161153514.png)]
“With the relationship between keyframes and objects, we can avoid some undesirable situation caused by moving objects.”
- 利用关键帧与对象之间的关系，可以避免由于对象的移动而引起的一些不良情况。
“In the third keyframe, it generates a temporary object whose label is TV monitor.”
- 在第三个关键帧中，它生成一个标签为电视监视器的临时对象。
- [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1UxhYgTY-1650186682957)(2018_Semantic%20SLAM%20Based%20on%20Object%20Detection%20and%20Improved%20Octomap_note.assets/image-20220417161345794.png)]
“According to the relationship between keyframes and objects, we can easily find that the TV monitor on the first keyframe is a candidate object for the temporary object observed in the third keyframe.”
- 根据关键帧与对象的关系，我们可以很容易地发现第一个关键帧上的电视监视器是第三个关键帧中观察到的临时对象的候选对象。
“The first keyframe and the third keyframe have a lot of same map points, which reveals that the first keyframe is one of the relative keyframes for the third keyframe.”
- 第一关键帧和第三关键帧具有许多相同的映射点，这表明第一关键帧是第三关键帧的相对关键帧之一。
“If we use the object seen by the last keyframe (it is the second keyframe in this condition) as candidate objects, the temporary object (TV monitor in the third keyframe) will be regarded as a new object by data association because the last keyframe does not contain the white TV monitor.”
- 如果我们使用上一个关键帧看到的对象（在这种情况下是第二个关键帧）作为候选对象，由于上一个关键帧不包含白色电视监视器，所以临时对象（第三个关键帧中的电视监视器）将通过数据关联被视为新对象。注：插入新关键帧的规则

“Second”

“among the candidate objects, we need to select which one is most similar to the temporary object.”
- 多个候选对象选最相似的那一个。
“we perform a nearest neighbor search between 3D points in candidate and temporary objects, and calculate the Euclidean Distance between the matched point pairs.”
- 我们在候选对象和临时对象中的三维点之间进行最近邻搜索，并计算匹配点对之间的欧几里得距离。
- 注：选取规则
“k-d tree is used to accelerate the matching process.”
- 采用k-d树加速匹配过程。
“According to the matched point pairs, scores between candidate and temporary objects can be calculated.”
- 根据匹配的点对，可以计算候选对象和临时对象之间的分数。
- 候选对象和临时对象间的打分公式：
- $\mathbf{S} = \frac{M}{N}$
  - $M：\text{distance} \leq 2cm$ 的匹配点数
  - $N$ ：来自临时对象的点数
“A candidate object with the highest score which is also higher than the threshold, is selected as the associated object.”
- 选择具有最高分且也高于阈值的候选对象作为关联对象。
“If all the objects do not fulfill real-time requirements, the temporary object is considered as a new object which can be inserted into the SLAM system.”
- 如果所有的对象都不能满足实时性要求，则将临时对象作为新的对象插入到SLAM系统中。
  理解：一个对象没有临时对象和候选对象的化，就将其作为新对象插入SLAM系统中注：新关键帧插入规则

“F. Object Model Update”F.对象模型更新

“When we find the correspondence between candidate and temporary objects, the point clouds and confidence scores associated with them should be fused together.”
- 当我们发现候选对象和临时对象之间的对应关系时，将与它们相关的点云和置信度分数融合在一起。
YOLO中的对象检测中，输出RGB图像到RCNN框架，给定第 $k$ 张图像的数据 $I_k$ ，YOLO的输出可以用一种简化的方式解释为类标签上对象的独立概率分布
例如 $P(O_{u}) = l_i|I_k$ ， $u$ 表示检测到的对象， $l_i$ 表示第 $i$ 个类标签
这使得我们能够通过递归贝叶斯更新方式更新可见集 $V_k \in M$ 中的所有对象和相应的概率分布：
$P\left(l_{i} \mid I_{1, \ldots, k}\right)=\frac{1}{Z} P\left(l_{i} \mid I_{1, \ldots, k-1}\right) P\left(O_{u}=l_{i} \mid I_{k}\right)$
方程 $(9)$ 应用于每个对象的所有标签概率，且最后用常数 $Z$ 进行归一化得到适当的分布

G. Map Generation

又比较了一番点云地图和Octomap

“In our system, 3D point clouds are stored in every keyframe, and the segmented 3D point clouds are also stored in the corresponding object.”
- 在我们的系统中，三维点云存储在每个关键帧中，分割后的三维点云也存储在相应的对象中。
“the map based on point clouds can be generated by projecting the stored 3D points according to the associated poses.”
- 基于点云的地图可以通过将存储的三维点根据相关联的姿态进行投影来生成。
“However, the map based on point clouds is useless for advanced mission such as path planning or grasp point selection,”
- 但基于点云的地图对于路径规划或抓取点选择等高级任务毫无用处，注：前边说了好多次了
“because point clouds do not use any structures to store each points, which is bad for searching, and each point has no volume information, which makes collision detection and 2D maps generation easily fail.”
- 由于点云不使用任何结构来存储每个点，不利于搜索，并且每个点没有体信息，容易导致碰撞检测和二维地图生成失败。
  没有体信息，容易导致碰撞检测和二位图像生成失败，注：我的理解是不能确定物体的边界，生成的地图混叠
“point clouds cannot distinguish the unknown area, the empty area, and cannot eliminate noise.”
- 点云不能区分未知区域、空区，不能消除噪声。
“Octomap” Octmap 使用Octree来存储点云，当插入一个新点后，它能够区分未知和空区域，还能降低噪点。
Octomap 是一个基于八叉树的概率3D建图框架，实现中，八叉树的根节点代表整个空间，八个子节点代表八个小空间。八叉树的叶节点代表空间中最小的分辨率体素
Octomap在实现过程中，移动物体和距离测量中的误差会导致地图中出现大量噪声。Octomap使用概率模型来解决这个问题，每个叶节点都存储其被占用或空闲的概率。当插入一个新的3D点时，其对应的叶节点以以下方式更新其概率：
$L\left(n \mid z_{1: t}\right)=L\left(n \mid z_{1: t-1}\right)+L\left(n \mid z_{t}\right)$
$L(n)=\log \left[\frac{P(n)}{1-P(n)}\right]$
- $n$ 表示叶子节点 $n$
- $Z_t$ 表示测量值 $Z_t$
- $P(n|Z_t)$ 表示体素 $n$ 在给定测量值 $Z_t$ 下被占用的概率 注：前文中没有出现这个公式，是不是写错了？ $L(n|z_t)$ ?

这里有个疑问，P(n|Z_t) 前文中并没有出现该公式，写错了吗？ $L(n|z_t)？$

Octomap可以生成基于体素或像素的3D或2D地图Octomap中的每个体术不仅可以存储其被占用或空闲的概率，还可以存储固定数量的类标签和置信度。
最初的Octomap通过两步来生成地图
第一步：
计算空体素从相机到被占体素的位置。问题：计算空体素太费时
作者对此过程进行了优化
最初的Octomap通过两步来生成地图
第一步：
计算空体素从相机到被占体素的位置。问题： 计算空体素太费时
作者对此过程进行了优化: 考虑二维平面的例子 注：加速算法
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-C4Bac57W-1650186682957)(2018_Semantic%20SLAM%20Based%20on%20Object%20Detection%20and%20Improved%20Octomap_math.assets/image-20220414211058962.png)]
在图10中，有一个 $X_s,Y_s)$ 指向 $X_e, Y_e)$ 的直线，斜率：
$K=\frac{Y_{e}-Y_{s}}{X_{e}-X_{s}}$
网格 $(X, Y)$ 被定义为： $(X, Y)$ 网格数坐标
$X=\frac{X_{S}}{V}, Y=\frac{Y_{S}}{V}$
- $V$ 是网格的尺寸
网格中的偏移量被定义为：偏离格线距离
$X_{0}=X_{S} \% V, Y_{0}=Y_{S} \% V$
最后可以通过下式计算出 $D$ : 通过斜率计算得出
$\times\left(V-X_{0}\right)+Y_{0}$
如果 $D < V$ , 意味着 $n < N$ . 因此下一个空体素是 $(X + 1, Y)$ 注：已验证过
此外还有三种情况，如图11:[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bjSUg8Jq-1650186682958)(2018_Semantic%20SLAM%20Based%20on%20Object%20Detection%20and%20Improved%20Octomap_math.assets/image-20220414215123548.png)]
- $(a)$ ：可以交换起始点和结束点同上边的计算得出空体素的位置
- $(b)$ : 可以通过图12的方式将 $L 1$ 转换到 $L 2$ 来计算空体素的位置 过 $L$ 对称 线 $L$ 通过式16确定(中点)
  - $Y=\frac{Y_{s}+Y_{e}}{2}$
  - [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-N233XuPP-1650186682958)(2018_Semantic%20SLAM%20Based%20on%20Object%20Detection%20and%20Improved%20Octomap_math.assets/image-20220414215925713.png)]
- $(c)$ : 交换 $(b)$ 中两点可得
第二步：

将所有新体素插入到一个Octomap中，Octomap通过Octomap结构为每个新体素定位到相应的叶子节点
“probability of corresponding leaf node is updated with the new voxel.”
- 用新的体素更新对应叶节点的概率。
“However, both of these two steps use a single thread to process. Although the first step can use OpenMP to create multi threads to compute the empty voxels, we find that it runs slower than the one with a single thread because too many threads are created. In order to accelerate mapping with multi-threads, three strategies are proposed.”
- 但是，这两个步骤都使用单个线程进行处理。虽然第一步可以使用**OpenMP（注：我没用过这个库）创建多个线程来计算空体素，但我们发现它比单线程运行得慢，因为创建的线程太多了。（注：线程数是否超过核心数？若线程数超过核心数，系统会自动调度，速度不会慢的，只有当线程数等与核心数，根据木桶原理，速度取决于最慢的那个线程，但这样还是应该快于单线程啊？？？？疑惑？？作者也没给出原因）**为了加速多线程映射，提出了三种策略。
“First, we use a thread Pool to take the place of OpenMP. The second step is modified to use eight threads to insert voxels into an Octomap. And the third is that the whole architecture can be accelerated by using a producer-consumer model.”
- 首先，我们使用线程池来代替OpenMP。第二步被修改为使用八个线程将体素插入到一个八分图中。第三，整个体系结构可以通过使用生产者-消费者模型来加速。注：TBB挺不错

“V. Evaluation” V.评价

“we give detailed evaluation of the proposed semantic SLAM system in three different ways. First, we use TUM dataset to evaluate the accuracy of tracking. Second, PASCAL dataset is used to evaluate the accuracy of detection. Third, we compare the efficiency between improved and original Octomap.”
- 从三个不同的角度对所提出的语义SLAM系统进行了详细的评价。
- 首先，我们使用TUM数据集来评估跟踪的准确性。
- 其次，利用PASCAL数据集对检测的准确性进行评估。
- 最后，比较了改进后的Octomap与原Octomap的效率。

“Tracking”跟踪

写了一堆关于这个数据集的东西

“TUM dataset is an excellent dataset to evaluate the accuracy of camera localization as it provides accurate ground truth for the sequences.” TUM数据集为摄像机定位提供了准确的地面真值，是评价摄像机定位精度的一种很好的数据集。
“It contains seven kinds of sequences recorded by a RGB-D camera at 30fps and a resolution of 640 x 480.” 它由RGB-D摄像机以30fps、640×480的分辨率记录了7种序列。
“We only use Handheld SLAM sequence, Robot SLAM sequence, Structure vs. Texture sequence and Dynamic Objects sequence among the seven sequences because these four sequences represent most of the scenes of every day.” 在这七个序列中，我们只使用手持SLAM序列、机器人SLAM序列、结构纹理序列和动态对象序列，因为这四个序列代表了每天的大部分场景。
“these sequences contain different kinds of objects, which can ensure more semantic information than other kinds of sequences.” 这些序列包含不同种类的对象，可以保证比其他种类的序列更多的语义信息。
“Handheld SLAM sequence is recorded by hands, and therefore it has complex and unstable trajectories, while Robot SLAM sequence is recorded by real robots, hence it has stable and simple trajectories.” 手持SLAM序列由手记录，轨迹复杂且不稳定，而机器人SLAM序列由真实机器人记录，轨迹稳定且简单。
“But all of them are experimented in the scene without dynamic objects.” 但它们都是在没有动态物体的场景中进行实验的。
“Furthermore, Dynamic Objects sequence is recorded by hands, however when the recordings have some dynamic objects, the trajectory is found to be unstable in such scenes.” 此外，动态目标序列是由人工记录的，但当记录中有一些动态目标时，在这种场景中会发现轨迹不稳定。
“For comparison, we use different RGB-D SLAM in the benchmark.” 为了进行比较，我们在基准测试中使用了不同的RGB-D SLAM。
“Each sequence is processed 5 times, and we use RMSE to judge its localization Accuracy” 对每个序列进行5次处理，利用RMSE判断其定位精度
使用均方根误差 $R M S E$ :
$E=\sqrt{\frac{\sum_{i=1}^{n}\left(X_{o b s, i}-X_{\text {model, } i}\right)^{2}}{n}}$
- $n$ 表示观测次数
- $i$ 表示第 $i$ 次观测
- $X_{obs,i}$ 是第 $i$ 次观测的地面真值
- $X_{model,i}$ 是第 $i$ 次观测值的计算结果

“B. Localization Accuracy with Improved SLAM”B.改进的SLAM定位精度

“First, we verify the localization accuracy with Improved SLAM.” 首先，我们用改进的SLAM来验证定位精度。
“For comparison we have executed ORB-SLAM2 with a RGB-D camera in the benchmark.” 为了进行比较，我们在基准测试中使用RGB-D相机执行了ORB-SLAM2。
“Table I shows the median RMSE error of the benchmark.”表一显示了基准的中值RMSE误差。
“It can be seen that the RMSE error of Improved SLAM is little worse than the error of ORB-SLAM2 in static environment, which means the accuracy of our SLAM is close to ORB-SLAM2.” 可以看出，在静态环境下，改进后的SLAM的RMSE误差比ORB-SLAM2的误差大一点，表明改进后的SLAM的精度接近ORB-SLAM2。注：相差不大
“The reason of worse RMSE error is that when tracking reference frames, the number of common features that the last reference frame and the current keyframe have is larger than that the last keyframe and the current keyframe have.” **注分析原因：**RMSE误差较大的原因是在跟踪参考帧时，最后一个参考帧和当前关键帧所具有的共同特征数大于最后一个关键帧和当前关键帧所具有的共同特征数。
“Because of the number of common features, SLAM tracking by reference frames can provide more accurate localization in the static environment.” 在静态环境下，基于参考帧的SLAM跟踪可以提供更精确的定位，因为它具有大量的公共特征。
是ORB-SLAM2使用了参考关键帧，能提供更精确的信息。
“However, in the scene with dynamic objects, our SLAM is better than ORB-SLAM2. This is because our SLAM tracks by keyframes instead of reference frames, when a big moving object passes through the camera, the trajectory is easy to follow the moving object if SLAM tracks by reference frames.”但是，在有动态物体的场景中，我们的SLAM比ORB-SLAM2要好。这是因为我们的SLAM是通过关键帧而不是参考帧跟踪的，当一个大的运动物体通过摄像机时，如果SLAM是通过参考帧跟踪的，那么轨迹就容易跟随运动物体。
“Since a big moving object contains a lot of features, and SLAM are based on the assumption that the number of features in moving objects is much smaller than the number of features in static objects, so in this case, original ORB-SLAM2 considers the big moving object to be static.” 由于一个大的运动物体包含大量的特征，而SLAM是基于运动物体中的特征数目远小于静态物体中的特征数目的假设，因此在这种情况下，原始的ORB-SLAM2将大的运动物体视为静态的。
原因是较大物体的上的参考关键帧数目会大于静态环境，使得ORB-SLAM2误认为较大移动物体是静态物体，其实它不是
注：只使用关键帧和使用参考关键帧的不同方法有点鱼与熊掌的感觉，目前的理解是针对不同环境的需求使用不同的方案
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pWPtmZNJ-1650186682959)(2018_Semantic%20SLAM%20Based%20on%20Object%20Detection%20and%20Improved%20Octomap_note.assets/image-20220417164632108.png)]

“C. Localization Accuracy with Semantics” C.语义定位精度

“we verify the improvements of our semantic SLAM. For comparison we have also executed RGB-D SLAM[6] in the benchmark.”我们验证了语义SLAM的改进。为了进行比较，我们还在基准测试中执行了RGB-D SLAM[6]。
评估语义SLAM ，用RGB-D SLAM作对照组

“Fig.13 shows the comparisons of trajectories calculated by semantic SLAM, with the trajectories calculated by ORB-SLAM2 and RGBD-SLAM. As we observe, our trajectories are similar to the trajectories calculated by ORB-SLAM2 in the scenes without dynamic objects.”图13示出了由语义SLAM计算的轨迹与由ORB-SLAM2和rgbd-slam计算的轨迹的比较。正如我们所观察到的，我们的轨迹与ORB-SLAM2在没有动态物体的场景中计算的轨迹相似。
基线的中值均方根误差：
静态环境中，我们的语义SLAM的RMSE比ORB-SLAM差一点，但是很接近了
引起RMSE比ORB-SLAM差一点的原因是：局部建图线程需要更多时间来检测对象，需要更多时间来处理关键帧，因此一些由跟踪线程生成的关键帧可能会被丢弃。（为什么？有点不理解，他们是独立的线程啊？跟线程有什么关系？）应该是没有使用参考帧的缘故吧

动态环境中，语义SLAM比ORB-SLAM2好很多
主要原因：
一、语义SLAM保留了静态对象上的特征，为每个关键帧剔除了可能属于动态物体的动态特征。
二、由于每一帧都是按关键帧追踪，可以提供更稳定的特征，因此在有动态物体的场景中，定位可以更准确（第二个原因好像有点问题）

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-53pMEoBl-1650186682959)(2018_Semantic%20SLAM%20Based%20on%20Object%20Detection%20and%20Improved%20Octomap_note.assets/image-20220415084730463.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2LltWagF-1650186682959)(2018_Semantic%20SLAM%20Based%20on%20Object%20Detection%20and%20Improved%20Octomap_note.assets/image-20220415084751642.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GoC4WVC2-1650186682960)(2018_Semantic%20SLAM%20Based%20on%20Object%20Detection%20and%20Improved%20Octomap_note.assets/image-20220415084812189.png)]

D.Detection

为展示我们面向对象的语义建图系统的能力，使用室内RGB-D系列来生成每个环境的全局地图，然后比较每个类别的地图中记录的对象数量。结果如图14, 能够识别场景中的大多数对象，但还是有些对象会缺失，两台显示器，只检测到了一台
原因：它们靠的太近了。在一些场景中，它会将一台显示器和一个键盘识别为一台笔记本电脑，因为它们在场景中靠得很近。
还有一个问题是：YOLO是以边界框的形式给出结果，所以每个对象都会包含背景的一部分
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pEAvC5o9-1650186682960)(2018_Semantic%20SLAM%20Based%20on%20Object%20Detection%20and%20Improved%20Octomap_note.assets/image-20220415085755988-16501860768701.png)]

E. Mapping

将检测到的对象转化为Octomap的结果如图15所示
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-T1JKMcIz-1650186682961)(2018_Semantic%20SLAM%20Based%20on%20Object%20Detection%20and%20Improved%20Octomap_note.assets/image-20220415090530233.png)]
在语义SLAM中结合RGB和深度图像来生成点云，并获得每个点云的位置，因此点云及其位置可用于通过Octomap创建地图
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0uzZfYNG-1650186682961)(2018_Semantic%20SLAM%20Based%20on%20Object%20Detection%20and%20Improved%20Octomap_note.assets/image-20220415091219506.png)]
比较改进后的Octomap和原始的Octomap 选用TUM数据集构建多线程地图，结果如图16
计算空体素的时间如图17所示
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fcpE4MHQ-1650186682961)(2018_Semantic%20SLAM%20Based%20on%20Object%20Detection%20and%20Improved%20Octomap_note.assets/image-20220415091338324-16501862346123.png)]

你可能感兴趣的:(SLAM,机器学习,深度学习,其他)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
网易严选官方旗舰店，优质商品，卓越服务高省_飞智666600
网易严选官方旗舰店是网易旗下的一家电商平台，以提供优质商品和卓越服务而闻名。作为一名SEO优化师，我将为您详细介绍网易严选官方旗舰店，并重点强调其特点和优势。大家好！我是高省APP最大团队&联合创始人飞智导师。相较于其他返利app，高省APP的佣金更高，模式更好，最重要的是，终端用户不会流失！高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
其二十八尾喵
你知道吗？图片发自App我今天知道了你有喜欢的人，不是我。心空空的，整个人都不是我的了。可，怎么办？还是要好好的活着，毕竟你喜欢的人，我不能杀，可是我可以杀其他喜欢你的人呀！也罢，此生无缘，来世再见。鱼干
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
厉国刚：新闻学与传播学到底有何区别微观大道
厉国刚：新闻学与传播学到底有何区别头几天，有人在知乎上问我：新闻学与传播学到底有何区别。他是一位想要跨专业考研的学生，对新闻传播学学科可谓了解甚少，甚至一头雾水，想要让我帮他解释解释。在研究生学硕层面，新闻传播学是一级学科，分成新闻学、传播学这两个二级学科。有些高校，还自设了广告学、出版发行学等其他二级学科，但从官方角度，新闻传播学一级学科下，正统的就是那两个二级学科。招生时，一般会按一级学科招，
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
【从浅识到熟知Linux】Linux发展史 Jammingpro 从浅学到熟知Linux linux 运维服务器
归属专栏：从浅学到熟知Linux个人主页：Jammingpro每日努力一点点，技术变化看得见文章前言：本篇文章记录Linux发展的历史，因在介绍Linux过程中涉及的其他操作系统及人物，本文对相关内容也有所介绍。文章目录Unix发展史Linux发展史开源Linux官网企业应用情况发行版本在学习Linux前，我们可能都会问Linux从哪里来？它是如何发展的。但在介绍Linux之前，需要先介绍一下Un
如何培养兴趣绽蕊向阳
今天读李笑来的书《与时间做朋友》，读到有关兴趣部分，深有感触。书中提到，好多人说对某事没有兴趣，实际上是没有能力把这件事做好，做这件事时的感受很不好，有挫败感，每个人对自己不擅长做不好的事情，都本能的容易逃避，所以就以为自己对这件事不感兴趣，他们真正感兴趣的是其他事情。可事实上，出现这种感觉应该仅仅是因为还没有开始做那件事情，也还没有在那件事情上遭受挫折而已。其实，很多人真的放弃原来做的事情，转去
戴容容中原焦点团队.网络初级第33期,坚持分享第19天 2022年3月9日 TessDai
《每个人眼中的世界都是不同的》“一千个人眼里有一千个哈姆雷特”世界是多元的,每个人都有自己的道理,人人按照自己的理解去看待这个世界的人和物.我们如此,其他人也是如此.因此,任何事情,我们要放下自己以为的真理,去理解他人认为的真理,只有同频方能共振.孩子在慢慢长大的过程中慢慢学会独立,甚至对抗.尤其当孩子处于青春期的时候,他们开始有很多自己独立的想法,和一些特立独行的做法,家长常常会觉得不可思议,觉
系统架构设计师需求分析篇二 AmHardy 软件架构设计师系统架构需求分析面向对象分析分析模型 UML和SysML
面向对象分析方法1.用例模型构建用例模型一般需要经历4个阶段：识别参与者：识别与系统交互的所有事物。合并需求获得用例：将需求分配给予其相关的参与者。细化用例描述：详细描述每个用例的功能。调整用例模型：优化用例之间的关系和结构，前三个阶段是必需的。2.用例图的三元素参与者：使用系统的用户或其他外部系统和设备。用例：系统所提供的服务。通信关联：参与者和用例之间的关系，或用例与用例之间的关系。3.识别参
每时每刻都是开始2019-03-09 Action熊猫
过去有多少想了无数遍要做的，但实际并没有做到的。以没时间，或其他种种自己认为可以接受的理由，看着一天走啦，一月去啦，又是一年。最后笑一笑，新年不是来了吗！重新开始...如果在过去的365天里，每次醒来，都没能开始，那新年来了，又如何呢？何不把人生的每时每刻都作为起点，不等待，不期盼，不自欺，让每时每刻都在开始中...。
2022-02-15 百味人生摆渡人
习惯她和他在谈恋时，就吵架，有时吵的还很厉害，不像其他恋人，恋爱期间有说不完的情话，享受不尽的温情，珍惜在一块的每一分每一秒。分手也分了无数次，不知怎的，就是没有分开。不见面时，特想见面，见了面时，说不了几句，又就开始吵，吵的次数多了，连他们自己也说不清值不值得吵，为什么吵。她妈妈说，这孩子从小就性格倔强。他爸爸说，这孩子从小就性格固执。想想其实也没什么大事。为吃什么吵为穿什么吵为说什么吵……日子
android 更改窗口的层次,浮窗开发之窗口层级 Ms.Bu android 更改窗口的层次
最近在项目中遇到了这样的需求：需要在特定的其他应用之上悬浮自己的UI交互(拖动、输入等复杂的UI交互)，和九游的浮窗类似，不过我们的比九游的体验更好，我们越过了很多授权的限制。浮窗效果很多人都知道如何去实现一个简单的浮窗，但是却很少有人去深入的研究背后的流程机制，由于项目中浮窗交互比较复杂，遇到了些坑查看了很多资料，故总结浮窗涉及到的知识点：窗口层级关系(浮窗是如何“浮”的)？浮窗有哪些限制，如何
06选课支付模块之基于消息队列发送支付通知消息 echo 云清学成在线 java rabbitmq 消息队列支付通知学成在线
消息队列发送支付通知消息需求分析订单服务作为通用服务，在订单支付成功后需要将支付结果异步通知给其他对接的微服务，微服务收到支付结果根据订单的类型去更新自己的业务数据技术方案使用消息队列进行异步通知需要保证消息的可靠性即生产端将消息成功通知到服务端：消息发送到交换机-->由交换机发送到队列-->消费者监听队列，收到消息进行处理，参考文章02-使用Docker安装RabbitMQ-CSDN博客生产者确
基于STM32的汽车仪表显示系统：集成CAN、UART与I2C总线设计流程极客小张 stm32 汽车嵌入式硬件物联网单片机 c语言
一、项目概述项目目标与用途本项目旨在设计和实现一个基于STM32微控制器的汽车仪表显示系统。该系统能够实时显示汽车的速度、转速、油量等关键信息，并通过CAN总线与其他汽车控制单元进行通信。这种仪表显示系统不仅提高了驾驶的安全性和便捷性，还能为汽车提供更智能的用户体验。技术栈关键词微控制器：STM32显示技术：TFTLCD/OLED传感器：速度传感器、温度传感器、油量传感器通信协议：CAN总线、UA
淘陶居老袁藏品东海堂
【造像艺术】文化遗产•汉地木造像的区域特征、古代精品造像欣赏。。。。。。（来源：蠢牛/颜旭茂）原创2016-06-12作者：作者：蠢牛（颜旭茂）木造像的地位一直挺尴尬的。国外大型博物馆的木造像基本都是宋元以前的，明代只藏极品。国内也就故宫、国博和上博有能力弄几尊宋木，山西省博貌似只有一尊顶级的明代菩萨能拿得出手，其他木雕大省的博物馆再怎么也应当展示些明清木雕吧，总比同时代那什么坛坛罐罐更有艺术性。
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
【创客文案社】第三期写手招募筱瑶123
创客文案社第三期写手招募开始了。要求：1：注册一个月以上2：本身热爱写作3：有时间参与接单投稿参与方式：可以关注公众号：写作灵感；也可以通过其他转发文章的文友帮忙拉入群；也可以简信我。参与之后的文友，会先进入新人班，进行基本的试稿与培训，先接一些比较简单的单子；在这里可以一边赚钱，一边学习。不知不觉，来三四个月了，也发现了很多很有意思的现象。1：在上写一篇文章，基本都是几毛钱，多的也不过几块钱的收
中国广电永久9元流量套餐！性价比最高流量卡套餐介绍！优惠攻略官
中国广电是中国最大的传媒集团之一，其推出的流量套餐备受消费者青睐。中国广电最实惠的流量套餐不仅价格亲民，而且提供了优质的网络体验。首先，中国广电的流量套餐价格实惠，适合不同消费者的需求。无论是短期的日租卡还是长期有效的月租卡，用户都可以根据自己的实际情况选择适合自己的套餐。而且，流量的价格相对于其他运营商的套餐来说更加合理，给用户提供了更大的选择空间。☞大流量卡套餐「→点这免费申请办理」或者截图扫
Python实现TIFF 文件转换为 PNG 和 JPG 格式 sand&wich python 开发语言
在日常的图像处理工作中，可能会遇到需要将TIFF格式的图像转换为其他格式的情况，例如PNG和JPG。下面，本文将介绍如何使用Python和GDAL库实现这一功能。准备工作在开始之前，请确保已经安装了必要的库：GDAL（GeospatialDataAbstractionLibrary）可以使用以下命令安装GDAL：pipinstallgdal代码实现以下是一个将TIFF文件转换为PNG文件的示例代码
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比