尤齐

实时单目物体SLAM Real-time Monocular Object SLAM

2015

摘要：

我们提出了一个基于对象的实时SLAM系统，该系统利用了迄今为止最大的对象数据库。我们的方法包括两个主要部分：1）利用对象刚性约束改进地图并找到其真实比例的单目SLAM算法，以及2）基于二进制词包的新型对象识别算法，该算法为500个3D对象的数据库提供实时检测。这两个部分共同工作并相互受益：SLAM算法从对象的观察中积累信息，将对象特征锚定到特定地图地标，并对优化设置约束。同时，将部分或完全位于地图内的对象用作先验来指导识别算法，实现更高的召回率。我们在五个真实环境中评估了我们的建议，显示了相对于其他最先进技术，地图精度和效率的提高。

关键词：物体撞击，物体识别

1.介绍

在环境中移动和操作的机器人需要实时获取关于它的实时信息。这些信息可以从视觉SLAM（同步定位和地图绘制）中获得，视觉SLAM是许多系统的关键组成部分，允许移动机器人在探索周围环境时创建地图，并跟踪自己的位置。计算出的地图提供了丰富的几何信息，可用于可靠的摄像机定位，但对于描述观察到的场景却很差。最近，这些地图增加了对象，允许机器人与场景交互[1、2、3]。

要在SLAM地图中包含对象，必须通过计算刚体3D变换在机器人获取的图像中识别这些对象。一条庞大的研究路线为这个问题提供了解决方案[4、5、6、7]，但它已被排除在视觉大满贯之外。

我们在本文中的目标是将目标识别和单目目标SLAM结合在一起，并基于随时间累积信息的新解决方案，以计算更鲁棒的目标姿态，并保持它们始终位于场景中。为了实现这一点，我们提出了一种新的对象识别算法，该算法在基于关键帧的视觉SLAM算法构建地图时提供对象检测。一旦从不同的摄像机位置多次观察到一个对象，这些具有多次观察的对象特征将在地图中作为锚点进行三角化。

锚点提供对象在地图内的位置，并在束调整（BA）优化中设置附加几何约束。由于对象模型是真实比例的，因此锚点提供地图比例的观察。标准BA优化了相机姿态和地图点位置，众所周知，它只能恢复到比例的地图。相比之下，我们的算法优化了摄像机姿态、点以及锚点、对象和比例，因此我们得到了由对象组成的真实比例的地图。

我们的系统依赖于对象识别算法，该算法在单个图像的基础上工作，但利用了视频序列。它利用SLAM收集的信息将先前的观察视为当前图像中对象位置的线索。这允许获得更快和更可重复的检测，从而为SLAM提供更多的几何约束。

我们提出的基于二进制词包的新型对象识别算法[8]，使用与对象数量无关的静态视觉词汇表，并使用ORB（面向快速和旋转简短）特征对对象的整体外观进行建模[9]。在类似RANSAC的步骤[10]中，通过引导匹配，从2D到3D对应中找到对象的姿态。我们的系统使用包含多达500个对象的数据库快速可靠地识别3D对象，同时保持SLAM系统的实时约束

我们的工作做出了以下贡献：

1.我们提出了一个完整的视觉SLAM系统，该系统能够在地图中插入真实对象，并通过使用单目相机进行重新观察来改进其三维姿态。

2.我们展示了在单个对象数据库中存储数百个综合3D模型的可行性，该数据库由具有直接和反向索引的二进制字包组成。我们还提出了一种在验证阶段对假设对应进行采样的新技术。

3.我们提出了一种新的SLAM后端，该后端将对象提供的几何信息包括到地图优化中，以提高地图、对象及其每个步骤的相对比例的准确性。

4.我们在真实和独立的数据集中给出结果，并与其他系统进行比较。我们的结果证明，通过包含对象，我们的单目系统可以检索场景的真实比例，并获得比PTAM[11]和RGB-D SLAM[12]更准确的结果，同时保持实时性能（跟踪需要7.6毫秒，识别大约每幅图像200毫秒）。我们的结果还表明，该系统对于偶尔的错误检测非常鲁棒，避免了地图损坏。

论文的主要内容如下：第2节介绍了目标SLAM和目标识别的相关工作。第3节概述了我们的完整系统。第4节详细介绍了视觉SLAM方法和对象插入，第5节详细介绍对象识别算法。第6节展示了我们系统的实验评估，第7节总结了本文。

2.相关的工作

对象增强映射之前已经通过基于扩展卡尔曼滤波器的SLAM方法进行了处理[2，13]。然而，目前最先进的单目SLAM方法是基于关键帧的，这些关键帧仅使用一些选定的视频帧创建贴图。正如Strasdat等人[14]所证明的，这些系统能够产生比基于滤波器的方法更好的结果，因为它们处理大量点，并以帧速率实时生成更大的精确稀疏点图。

Castle等人[3]的工作是第一批将对象识别与基于单目关键帧的SLAM相结合的工作之一。在两帧中检测到一个对象后，他们计算其在地图中的姿态。这些对象显示为增强现实，但与我们的方法不同，它们不会将对象添加到优化中。他们建立了一个由SIFT特征描述的37幅平面图片的数据库。与此系统相反，仅限于平面对象，我们可以处理具有任意3D形状的对象。

Bao等人[15，16]首先提出了Montion的语义结构（SSfM），这是一个联合优化摄像机、点和对象的框架。SLAM方法处理信息来自视频流的事实，因此点和关键帧的图形是增量的，而SSfM一次处理所有帧。此外，在[15]中，识别和重建步骤是分离和独立的。然而，在我们的算法中，识别和重建同时发生，因为SLAM和目标检测是完全集成的。[15]中的识别方法检索对象的边界框，而我们的对象检测器检索6自由度姿态。

同样，Fioraio等人[17]提出了一种SLAM系统，该系统在识别出具有足够可信度的3D对象时，将其添加到地图中，并通过束调整与地图一起优化其姿态。他们建立了一个由7个对象组成的数据库，这些对象由使用RGB-D相机在多个尺度上采集的3D特征描述，为每个尺度创建独立索引。识别是通过找到由基于RANSAC的算法过滤的3D到3D假定对应来执行的。尽管他们能够用几个对象构建房间大小的地图，但他们的系统不能实时运行。相比之下，我们的系统通过使用二进制2D特性和可以同时处理所有关键点尺度的单一索引结构，提高了可伸缩性和执行时间。

Salas Moreno等人[1]提出了一种结合RGB-D地图构建和对象识别的最新视觉SLAM系统。它们用一个图来表示地图，其中节点存储摄像机或对象的位置，并在优化整个图时增强所有这些对象的姿态。使用KinectFusion[18]预先建立对象数据库，用点对特征描述其几何结构[19]。这些由哈希表索引，并通过计算大量候选刚体变换来执行识别，这些候选刚体变换在霍夫空间中发出投票。Hough投票是一种使用RGB-D数据进行对象检测的流行技术[20、21、22]，但其可扩展性不清楚。事实上，Salas Moreno等人[1]通过利用GPU计算实现了实时执行，但他们只显示了4个对象的结果。在我们的工作中，我们展示了在单目相机的CPU上计算的多达500个对象的高频结果。

关于对象识别，我们的建议遵循的研究路线是在图像和对象模型之间寻找局部特征的匹配。Sivic和Zisserman[23]提出了一个视觉词汇表，用于匹配大型集合中的2D图像。他们提出用k均值聚类图像特征的描述符空间，以量化特征，并用数字向量表示图像，表示为文字包，从而实现快速比较。另一方面，Lowe[24]推广了一种基于查询和模型2D图像之间直接匹配SIFT特征的方法。匹配特征需要计算大型特征集之间的描述符距离，这可能非常耗时。为了加快这一过程，他提出了最佳箱优先技术，用k-d树寻找近似邻居。视觉词汇和k-d树后来被推广用于实时匹配大型图像集。Nister&Stewenius[25]提出了一种基于MSER（最大稳定极值区域）[26]和SIFT特征的分层视觉词汇树，利用该特征可以对40000张图像数据集进行快速检测。Muja&Lowe[27]提出了一种自动配置一组k-d树的方法，以最佳拟合要匹配的特征数据。

为了从单个图像中完全恢复对象的姿态，需要将3D信息合并到模型中。Gordon&Lowe[28]开始创建3D点云模型，通过应用运动技术恢复对象结构。然后，可以通过从2D到3D对应中解决透视-n问题[10]来检索姿势。这是最近许多物体识别方法的基础[5,29,7,6,30]。例如，Collet等人[5]为79个对象构建3D模型，并使用对象的训练图像构建一组k-d树，以索引其SIFT特征进行直接匹配。

，图1：系统概述：每个视频帧都由SLAM跟踪线程处理，以定位摄像机，并确定是否向地图添加了新的关键帧。对象识别应用于尽可能多的帧，利用先前看到的对象的位置信息。如果识别成功，则存储对对象的观察，直到有足够的几何信息。此时，对象实例被三角化并插入到地图中，与锚定到对象点的新地图点以及观察它们的帧子集一起，生成语义关键帧。此操作允许查找地图比例并将对象几何约束包括到地图优化中。

树的不同离散化级别允许以几种方式计算特征对应。例如，Xiao等人[30]以分层方式离散化SIFT描述符空间，以创建3级树。它们显示了在所有级别上计算特征匹配的好处，而不仅仅是最精细的匹配，从而获得更多的假定对应，从而提高了对象识别率。然而，过多的对应可能会使姿态恢复阶段负担过重，导致执行时间过长。相反，Sattler等人[29]的方法仅从位于同一视觉单词中的特征中检索对应关系，但由于离散化错误，这可能会丢失不共享视觉单词的正确点对。在我们的工作中，我们使用直接索引[8]在粗离散化级别计算位于同一树节点的特征之间的对应关系。这在对应点的数量和执行时间之间提供了平衡的权衡。所有这些工作都使用SIFT或SURF特征，这些特征用64或128个浮点值的向量描述，并使用与对象建模相同的图像训练匹配树，这迫使它们在将新对象添加到数据库时重新创建树。Rublee等人[9]提出了二进制和紧凑的ORB特征（256位长度描述符），并提供了与SIFT和SURF[31]相似的区别。此外，从独立数据创建的不需要重建的二进制词的视觉词汇表适合索引大量图像集合[8]。在这项工作中，我们展示了单一独立的ORB特征词汇表的可行性，以实时（约200 ms\/图像）识别具有大型数据库（最多500个对象）的3D对象

3.系统概述

我们的系统构建了一个由摄像机姿态、点和对象组成的3D地图，如图1所示。我们利用并行跟踪和映射（PTAM）算法[11]的前端来跟踪摄像机运动，并添加了两个新的并行过程，以在地图中执行对象识别和对象插入。我们的系统还包括一个基于g2o[32]的完全重新设计的后端，该后端对关键帧姿态、贴图点、对象和贴图比例执行关节SLAM优化。

SLAM跟踪处理所有视频帧，以在未知地图比例的每个时间步长计算摄像机的姿态。当帧提供独特的几何信息时，它将与新的贴图点一起作为关键帧插入到贴图中。

同时，在尽可能多的帧上执行对象识别，以搜索存储在对象模型数据库中的已知对象。如果存在由SLAM地图和先前识别给出的对象位置的可用信息，则利用该信息来指导当前图像中的检测。成功的检测提供了对对象实例的观察。无论使用何种识别算法，从单个图像获得的检测可能是虚假的或不准确的。为了避免这些问题，我们不是在第一次识别后将对象放置在地图中，而是在累积了随时间变化的一致观察后将其插入SLAM地图中。所有观测给出的信息用于三角测量目标点，从而确定SLAM地图内目标的姿态。生成的点作为锚点插入三维地图中，观察它们的相机作为语义关键帧。选择这些关键帧不是因为几何标准，而是因为它们包含相关的语义信息。不提供视差或区别几何信息的观察帧被丢弃。每个三角测量都为我们提供了地图比例的估计，我们使用它来全局优化它。

4.对象感知的SLAM

4.1.地图中的对象

插入我们的算法产生的单个图像中的对象识别用于将这些对象插入SLAM地图中。为了稳妥地放置它们，而不是依赖于单个检测，我们累积了几个，直到我们有足够的几何信息来计算稳妥的3D姿态。该过程如图2所示，并在下面进行说明。

第5节中描述的对象检测器在尽可能多的帧中搜索对象，而SLAM使用它们跟踪摄像机，因此姿势TWCi=？RWCi |s tWCi？每个摄像机i的位置是已知的，具有初始未知的地图比例尺s。对象模型O的成功识别返回从相机到对象帧的变换TCiO。由于同一对象模型的多个物理实例可能存在，我们检查此检测属于哪个实例。我们通过计算全局姿态T的假设来实现∗WO＝世界中检测到的对象的TWCi TCiO，并检查与先前观察到的或已经在地图中的同一模型的其他对象的重叠。请注意，仅当我们已经对地图比例s进行了估计时，此操作才有效。否则，我们假设同一模型的连续检测来自同一真实对象。之后，我们确定对象O的检测是模型O的第k个实例Ok的观察。如果与之前观察到的任何对象没有重叠，我们只创建一个新实例。

观察BiOk＝hTWCi、TCiOk、XO、Uii产生模型O、XO的一些3D点与相机Ci、Ui拍摄的图像的2D点之间的一组对应关系。对于每个通信hxO，uii∈ hXO，Uii，如果相对于同一对象实例的xO的其余观察的视差不够显著，则丢弃对应的对语义关键帧（红色摄影机）、对象及其点插入到地图中，更新其比例。对象观察不提供视差或新点，完全忽略。

累积对象实例的观察，直到以下条件成立：1）从两个不同位置观察到至少5个不同的对象点xO，2）摄像机之间的视差至少为3度，以及3）未显示对齐和良好的几何条件。在世界帧（xW）中对点进行三角剖分，并将对hxO、xWi作为锚定点插入地图中。提供视差的帧也作为语义关键帧插入。

锚点在对象SLAM中起决定性作用，因为它们提供了对象在地图中的位置，并在BA中设置了额外的几何约束，从而实现地图比例估计。因此，锚点与地图点的处理方式不同：它们不会被PTAM的维护算法丢弃，仅使用新的对象观察更新，并通过在目标关键帧中投影锚点周围定义的3×3像素区域中使用匹配互相关在地图的关键帧之间传播。从语义关键帧中提取用于相关性的面片并进行扭曲，以便通过单应性补偿缩放、旋转和缩短。

4.2.目标SLAM优化

在基于标准关键帧的SLAM中，通过关节束调整（BA）估计点XW的稀疏映射和选定关键帧TWCi的相机位置。图4（a）显示了表示估计问题结构的贝叶斯网络

5.具有大型数据库的3D对象识别

对象识别需要从一组独立的图像和离线创建的模型数据库中构建视觉词汇表。然后，在线实时执行识别过程，对在位置TWCi处拍摄的查询图像执行两个主要步骤：检测适合图像特征的多个模型候选，以及通过计算相机和对象之间的刚体变换来验证候选。通过基于单词包查询数据库中的所有模型或利用对象的先前已知位置来获得候选。验证步骤利用图像和对象模型点之间的2D到3D对应来找到图像TCiO中的对象姿态。结果是观察BiO=hTWCi、TCiO、XO、Uii所识别的对象模型中。然后，SLAM算法将这些结果与其对应的对象实例Ok相关联，同时考虑当前摄像机的姿态（第4.1节）。

5.1.对象模型我们的对象模型由一组与ORB描述符相关联的3D点和完整对象的外观文字包表示组成。ORB特征具有计算效率，因为它们用256位的字符串描述图像块。

从从对象的不同视角拍摄的一组训练图像离线创建每个对象模型O。我们使用Bundler和PMVS2软件[35，36]对这些图像进行束调整，并获得物体PO的密集3D点云，如图5所示。我们仅保留至少3幅图像中一致出现的点。由于在识别过程中，对象可以以任何比例和视角出现，因此我们将每个3D点与从不同比例级别（高达2个八度）和多个训练图像中提取的多个ORB描述符相关联。

如果训练图像的视点几乎没有不同，我们可以获得具有非常相似的描述符的3D点，这些描述符增加了很少的区别。为了避免过度表达，我们将特征转换为视觉文字，并保持每个3D点和视觉文字的平均描述符[29]。最后，通过将其所有视图的残存二元特征转换为具有视觉词汇表的单词包向量，获得基于外观的对象表示。该模型提供了所有对象表面的信息，因此单个比较产生了与查询图像中对象的视点和比例无关的相似性度量。

5.2.对象模型数据库

对象模型在由可视化词汇表、反向索引和直接索引组成的数据库中进行索引[8]。视觉词汇表由具有二元节点的树组成，该树由训练ORB描述符的分层聚类创建。树的叶子构成了视觉词汇的词汇。我们使用了从加州理工学院256[37]的30607张独立图像中获得的12M个描述符，构建了一个具有k=32个分支和L=3个深度级别的词汇表6，产生了33K个单词。当给定ORB特征时，其描述符向量从根到叶遍历树，在每个级别选择最小化汉明距离的节点，并获得最终叶作为字。通过串联一组ORB特征的等价词，我们获得了一个词包向量，其条目用术语频率-逆文档频率（tf idf）值加权，并用L1范数归一化。对于在训练图像中出现较少的词，该权重较高，因为期望它们更具辨别力。反向索引为词汇表中的每个单词存储其所在的对象，以及其在该对象中的权重。当给定查询图像时，该结构提供了对查询词包向量和模型向量之间的公共词的快速访问。直接索引为每个对象模型存储它包含的树节点和相关的ORB特征。这用于区分在验证阶段需要2D到3D对应时可能匹配的特征。如果我们使用直接索引在其他树级别（更粗的离散化级别）存储节点，我们可以增加对应的数量，对执行时间几乎没有影响[8]。在这项工作中，我们将节点存储在词汇树的第一个离散化级别。

5.3.获得对象候选的先验知识

获得检测候选的第一种方法来自于先前观察到或插入地图中的那些对象。检测地图中已经存在的对象非常有用，因为我们可以找到尚未定位到地标的新点。插入它们有助于优化对象的姿势。该过程在算法1中描述。

7.结论

我们提出了一种对象感知单目SLAM系统，该系统包括一种新的高效3D对象识别算法，用于多达500个3D对象模型的数据库。一方面，我们展示了在SLAM流水线中嵌入单帧单词包识别方法如何提高具有数十个不同对象、重复实例、遮挡和杂波的数据集的识别性能。我们相信，这种优势不仅可以通过这种技术实现，还可以通过嵌入在SLAM管道中的任何其他识别方法实现，该方法可以利用物体的累积观测。

另一方面，对象的包含为SLAM地图添加了一组锚点，这些锚点在后端优化中提供了几何约束，并启用了真实地图比例估计。我们已经证明，与使用RGB-D数据的其他最先进算法相比，我们的系统可以生成更精确的地图。

有一种情况我们在这项工作中没有提到：当地图中插入的第一个对象是由错误的观察结果引起的。这将导致第一次不正确的比例尺估计，并导致地图丢失。这可以通过检查每个物体三角测量所给出的尺度估计的方差来解决，以便消除具有不一致尺度的任何观测。或者，如果初始粗略规模估计可用，也可以避免该问题；例如从机器人和移动设备通常配备的里程表或IMU传感器。然而，由于我们方法的安全步骤，这种情况很少发生，在我们的实验中也没有发生。

在地图中包含对象为使用语义数据增强它们铺平了道路，为用户提供丰富的信息，或为操作机器人提供关于环境的额外知识[49]。我们可以在未来的工作中使用这些知识来推理对象的移动性，从而使对象帧在3D空间中移动成为可能，从而创建动态地图。

C++17 并行算法：std::execution::par
在多核处理器普及的今天，如何高效利用硬件资源成为提升软件性能的关键。C++17引入的并行算法库（ParallelAlgorithms）为开发者提供了一套标准化的并行编程接口，通过简单的策略切换即可将顺序算法转换为并行执行。本文将深入探讨C++17并行算法中最核心的执行策略std::execution::par，从基础概念到高级应用，全面解析其原理、用法及最佳实践。一、C++17并行算法概述1.1并
求平方根：牛顿迭代法 mjfztms leetcode 算法
应用牛顿迭代法求解方程近似解，收敛速度很快牛顿迭代法求解平方根给你一个非负整数x，计算并返回x的算术平方根n，结果只保留整数部分。算法流程图由题意得，n2=xn^2=xn2=x，即为对f(n)=n2−xf(n)=n^2-xf(n)=n2−x求解。第一步：易得：x2−x1=0−f(x1)f′(x1)x_2-x_1=\frac{0-f(x_1)}{f'(x_1)}x2−x1=f′(x1)0−f(x1)
【秋招算法】2025 届搜广推方向求职历程（SSP、头部计划）秋冬无暖阳° 搜广推等—算法面经面试职场和发展算法
【秋招算法】2025届搜广推方向求职历程（SSP、头部计划）文章目录【秋招算法】2025届搜广推方向求职历程（SSP、头部计划）1.背景2.日常实习3.暑期实习3.1暑期BG3.2暑期记录4.秋招4.1秋招BG4.2转正4.3头部4.4提前批4.5正式批5.面试记录5.1Coding5.2其他高频编程题5.3常见八股、面经6.关于搜广推1.背景关于日常实习、暑期实习、提前批，秋招、春招、补招何为大
推荐算法（推广搜）——广告和推荐有什么不同？
导语近几年新兴起一个行业：推广搜。即推荐、广告、搜索算法的简称。各大厂都隐隐将其作为公司核心技术来发展。此文将带领大家探秘广告和推荐有什么区别以及其相似处。再此强调一下，广告算法里面的推荐广告和自然推荐结果里的推荐系统进行对比，但因为广告算法里面还有“搜索广告”，搜索广告和推荐系统差异性就太大了，这里不做讨论。一、不同点1.1本质不同推荐广告和自然推荐本质中要处理的群体和衡量的利益完全不一样。（图
算法分析与设计实验2：实现克鲁斯卡尔算法和prim算法表白墙上别挂我算法笔记经验分享
实验原理（一）克鲁斯卡尔算法：一种用于求解最小生成树问题的贪心算法，该算法的基本思想是按照边的权重从小到大排序，然后依次选择边，并加入生成树中，同时确保不会形成环路，直到生成树包含图中所有的顶点为止。具体步骤：边的排序：将所有边按照权重从小到大排序。初始化：创建一个空的生成树（可以是一个空的图结构），以及一个用于记录每个顶点所属集合（或称为连通分量）的数据结构（例如并查集）。边的选择：依次选择排序
（面经总结）一篇文章带你整理面试过程中常考的九大排序算法南淮北安冲刺大厂之面经总结面经排序算法二分插入冒泡快速
文章目录一、二分插入排序1.原理2.代码二、冒泡排序1.原理2.代码三、插入排序算法1.原理2.代码四、快速排序算法1.原理2.代码五、希尔排序1.原理2.代码六、归并排序1.原理2.代码七、桶排序八、基数排序九、堆排序1.原理2.代码十、总结1.算法分类2.性能分析一、二分插入排序首先必须是排好序的数组，然后通过二分查找，找到合适的位置，插入1.原理二分查找算法又叫作折半查找，要求待查找的序列有
Python常考面试题汇总（附答案） TT图图面试职场和发展
写在前面本文面向中高级Python开发，太基本的题目不收录。本文只涉及Python相关的面试题，关于网络、MySQL、算法等其他面试必考题会另外开专题整理。不是单纯的提供答案，抵制八股文！！更希望通过代码演示，原理探究等来深入讲解某一知识点，做到融会贯通。部分演示代码也放在了我的github的该目录下。语言基础篇Python的基本数据类型Python3中有六个标准的数据类型：Number（数字）(
opencv-python与opencv-contrib-python的区别联系剑心缘零碎小知识 python opencv
opencv-python包含基本的opencvopencv-contrib-python是高配版，带一些收费或者专利的算法，还有一些比较新的算法的高级版本,这些算法稳定之后会加入上面那个。官网对contrib模块的简介（点击链接跳转）参考链接
通信算法之278：数据链/自组网通信设备--MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码--1.系统指标需求及帧结构设计秋风战士无线通信基带处理算法 MATLAB仿真软件无线电算法无人机经验分享
MIMO(2T2R)-OFDM系统系列–实际工程应用算法代码第一章：系统指标需求拆解分析第二章：通信系统帧结构设计和OFDM参数设计第三章：通信业务速率设计及理论解调门限第四章：同步序列设计及同步性能仿真验证第五章：数据业务设计及性能仿真验证第六章：信道模型设计第七章：接收关键算法设计及仿真验证第八章：其它待补充本文目录MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码一、实际项目：系
通信算法之287：通信技术点咨询秋风战士 MATLAB仿真软件无线电无线通信基带处理算法网络算法无人机经验分享
专业技术咨询方向第一：SFBC编码与解码原理推导第二：SFBC系统中信道均衡推导第三：云哨物理层协议-速率匹配-解调门限-5dB第四：两天线SCFDE系统（SFBC码）帧结构设计第五：两天线OFDM系统（SFBC码）帧结构设计第一：SFBC编码与解码原理推导第二：SFBC系统中信道均衡推导第三：云哨物理层协议-速率匹配-解调门限-5dB第四：两天线SCFDE系统（SFBC码）帧结构设计第五：两天线
知识图谱的个性化智能教学推荐系统(论文+源码) 毕设工作室_wlzytw python论文项目知识图谱人工智能
目录摘要Abstract目录第1章绪论1.1研究背景及意义1.2国内外研究现状1.2.1知识图谱1.2.2个性化推荐系统1.3本文研究内容及创新点1.4全文组织结构第2章相关理论与技术概述2.1知识图谱2.1.1知识图谱的介绍与发展2.1.2知识图谱的构建2.3协同过滤推荐算法2.2.1推荐算法概述2.2.2Pearson相关系数2.2.3Spearman相关系数2.4Bert模型和Albert模
反向传播神经网络极简入门自信哥
单个神经元神经网络是多个“神经元”（感知机）的带权级联，神经网络算法可以提供非线性的复杂模型，它有两个参数：权值矩阵{Wl}和偏置向量{bl}，不同于感知机的单一向量形式，{Wl}是复数个矩阵，{bl}是复数个向量，其中的元素分别属于单个层，而每个层的组成单元，就是神经元。神经元神经网络是由多个“神经元”（感知机）组成的，每个神经元图示如下：这其实就是一个单层感知机，其输入是由和+1组成的向量，其
【限时干货】Calibre智能分类，轻松突破内网限制畅享电子书库比头发还脆弱服务器 tcp/ip linux
文章目录前言1.网络书库软件下载安装2.网络书库服务器设置3.内网穿透工具设置4.公网使用kindle访问内网私人书库前言本研究旨在构建一套运行于微软操作系统环境下的独立电子图书管理体系，核心目标是建立可远程操作的资源访问机制。该架构采用高可用性设计，在第三方阅读平台服务中断时仍能保障数字内容传输的稳定性。系统创新性地融合了两大核心技术组件：通过Calibre开源软件实现文献分类算法与格式转换功能
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
说话人识别python_基于各种分类算法的说话人识别（年龄段识别） weixin_39673184 说话人识别python
基于各种分类算法的语音分类(年龄段识别)概述实习期间作为帮手打杂进行了一段时间的语音识别研究，内容是基于各种分类算法的语音的年龄段识别，总结一下大致框架，基本思想是：获取语料库TIMIT提取数据特征，进行处理MFCC/i-vectorLDA/PLDA/PCA语料提取，基于分类算法进行分类SVM/SVR/GMM/GBDT...用到的工具有HTK(C,shell)/Kaldi(C++,shell)/L
深入解析C++中 std::sort背后的实现原理 —Introsort（Introspective Sort）点云SLAM C++c++算法数据结构快速排序排序算法堆排序深度优先
Introsort简介Introsort是一种混合排序算法，结合了三种经典算法的优点：算法用于特点快速排序通常情况平均时间复杂度O(nlogn)堆排序当快速排序退化（递归过深）时最坏时间复杂度O(nlogn)插入排序小规模数组时（如长度≤16）常数开销小，快Introsort运行机制排序逻辑如下：if(size2*log2(n))堆排序（HeapSort）else快速排序（QuickSort）快速
冒泡排序算法详解（含Python代码实现）算法_小学生算法
冒泡排序（BubbleSort）是最基础的排序算法之一，通常用于学习排序算法的入门理解。本文将通过Python代码实现冒泡排序，并详细讲解其原理、执行流程、复杂度分析及适用情况。✨一、算法简介冒泡排序的核心思想是：相邻两个元素比较，将较大的元素不断“冒泡”至右侧，最终实现排序。其基本过程是重复比较相邻的元素，如果顺序错误就交换，重复这一过程，直到没有任何需要交换的为止。二、Python代码实现下面
揭秘 Spring Cloud Zuul 在后端的负载均衡策略大厂资深架构师 Spring Boot 开发实战 spring cloud 负载均衡 spring ai
揭秘SpringCloudZuul在后端的负载均衡策略关键词：SpringCloudZuul、负载均衡、微服务网关、Ribbon、请求路由摘要：在微服务架构中，API网关是流量的“总调度员”，而负载均衡则是它的“智能大脑”。本文将以“小区门卫派件”为故事主线，用通俗易懂的语言揭秘SpringCloudZuul如何通过集成Ribbon实现后端负载均衡。我们将从核心概念到算法原理，从代码实战到应用场景
【NWFSP问题】基于中华穿山甲算法CPO求解零等待流水车间调度问题NWFSP研究（Matlab代码实现）
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述1.引言2.理论基础2.1中华穿山甲算法（CPO）核心原理2.2NWFSP数学模型3.CPO-NWFSP求解框架设计3.1编码与解码3.2离散化位置更新3.3目标函数适配4.实验设计与性能分析4.1实验设置4.2结果分析4.3敏感性分析5.结论与展望
LRU Cache Mr_Xuhhh c++c语言算法开发语言 python
LRUCache定义缓存算法（LeastRecentlyUsed)核心思想最近最少使用或最久未使用。当缓存空间不足时，它会优先淘汰最长时间没有访问的数据项类比：图书馆的书架管理，经常被借阅的书放在最前面方便取用，而长期无人问津的书会被移到后面或下架数据结构选择与设计1）双向链表1.用于维护元素的访问顺序，最近访问的元素放在链表头部，最久未被访问的放在尾部2.支持O（1）时间复杂度的任意位置插入和删
【Python】simulink与python联合仿真
1.1Simulink的边界：事件驱动、算法复杂性与AI集成瓶颈Simulink的核心优势在于其强大的微分方程求解器和对连续时间系统、离散时间系统的精确描述能力。其基于“信号流”和“框图”的建模范式，使得工程师可以直观地构建与物理现实高度对应的数学模型。然而，这种优势也带来了其天然的局限性：基于时间的驱动核心(Time-BasedCoreEngine):Simulink的“心脏”是一个时间驱动的仿
【PyTorch】教程：torch.nn.GELU 老周有AI~算法定制 PyTorch pytorch 深度学习 python
torch.nn.GELU原型CLASStorch.nn.GELU(approximate='none')参数approximate(str,optional)–gelu近似算法用none或者tanh，默认为none;定义高斯误差线性单元函数GELU(x)=x∗ϕ(x)\text{GELU}(x)=x*\phi(x)GELU(x)=x∗ϕ(x)其中ϕ(x)\phi(x)ϕ(x)为高斯分布的累积分布
数据结构之栈实验 lannnn_ 学习记录数据结构 c语言栈
栈实验实验目的实验环境实验要求实验内容源代码运行结果实验目的掌握栈这种数据结构特性及其主要存储结构，并能在现实生活中灵活运用。实验环境CodeBlocks实验要求1.熟悉c语言的语法知识；2.掌握栈的顺序存储结构—顺序栈的定义、构造、获得栈顶元素、入栈、出栈等基本操作；实验内容完成栈的定义、构造、获得栈顶元素、进栈、出栈等函数的编写。要求在主函数中实现对以上操作的调用，编写一个算法判断给定的字符向
新手必看：入行大模型前一定要知道的几件事！和老莫一起学AI 人工智能 java 机器学习大模型算法程序员转行
大模型怎么转？适合哪些人？哪些方向对新手友好？又有哪些坑你必须避开？文章有点长，但全是我这几年观察下来最真实的经验，如果你真的想搞懂大模型、入场不踩坑，建议认真读完，或先收藏慢慢看。一、大模型≠ChatGPT，先搞清“全景图”再出发说句真话，很多人对“大模型”的第一印象就是——ChatGPT。但这只是它的"最上层"，底下的基建、平台、算法、数据处理、推理部署……才是撑起整个技术栈的骨架。入行大模型
php字符串匹配算法,字符串查找算法及原理
面试题:判断字符串是否在另一个字符串中存在？面试时发现好多人回答不好,所以就梳理了一下已知的方法,此文较长,需要耐心的看下去。从实现和算法原理两方面解此问题，其中有用PHP原生方法实现也有一些业界大牛创造的算法。实现方法一:语言特性-内置函数/*strpos示例*///testecho'match:',strpos('xasfsdfbk','xasfsdfbk')!==false?'true':'
字符串的两种模式匹配算法--暴力法与KMP算法
对于字符串而言，最常见的基本操作莫过于查找某一字符串（模式串）在另一字符串（主串）中的位置，这一操作过程叫做字符串的模式匹配，常见的模式匹配算法有朴素模式匹配算法和KMP模式匹配算法，下面结合代码对这两种模式匹配算法的思想做个总结。参考博客：很详尽的KMP算法（厉害）1.朴素模式匹配算法（暴力法）朴素模式匹配算法的思想就是，把主串中的每一个字符作为子串开头，与要匹配的字符串进行逐字符匹配，直到所有
DTW 动态时间规整：时间序列的柔性桥梁
在时间的长河中，数据如浪花般不断涌现，而时间序列数据更是其中璀璨的存在。当我们试图比较两段时间序列时，常常会遇到一个棘手的问题：就像两位舞者，他们演绎着相同的舞蹈，却有着不同的节奏与速度，直接对比难以判断二者的相似度。而DTW（DynamicTimeWarping，动态时间规整）算法，就像一座神奇的柔性桥梁，能够跨越时间节奏的差异，精准度量时间序列间的相似性，在众多领域发挥着不可或缺的作用。一、D
串---暴力字符串匹配算法实现 KYGALYX 数据结构算法数据结构
暴力字符串匹配算法详解暴力字符串匹配算法（BruteForceStringMatchingAlgorithm）是一种简单的字符串匹配算法，它通过逐个比较主串中的字符与模式串中的字符来进行匹配。虽然这种方法简单直观，但在最坏情况下可能需要多次比较，导致效率较低。本文档将详细介绍暴力字符串匹配算法的原理、步骤以及如何在C语言中实现。1.暴力字符串匹配算法原理1.1主串与模式串主串：待搜索的字符串。模式
搜索领域SEO进阶：内容优化与用户体验提升搜索引擎技术 ux ai
搜索领域SEO进阶：从关键词堆砌到用户价值——内容优化与体验升级的实战指南关键词SEO进阶、内容质量、用户体验、E-E-A-T、用户行为信号、结构化数据、页面速度优化摘要当“SEO=关键词堆砌”的时代成为历史，当搜索引擎算法从“识别文字”进化到“理解意图”，SEO从业者正面临一场从“技术投机”到“用户价值”的范式转移。本文将深度拆解搜索领域的进阶策略：从内容优化的核心逻辑（E-E-A-T框架、主题
2023年搜索领域的技术认证与职业发展指南搜索引擎技术搜索引擎 ai
2023年搜索领域的技术认证与职业发展指南关键词搜索领域、技术认证、职业发展、搜索引擎技术、人工智能搜索摘要本指南旨在为搜索领域的从业者和有志于进入该领域的人士提供全面的技术认证与职业发展参考。首先介绍搜索领域的概念基础，包括其历史发展和关键问题。接着阐述相关理论框架，分析不同认证背后的原理。架构设计部分展示搜索系统的组成与交互。实现机制探讨算法复杂度和代码优化。实际应用部分给出实施和部署策略。高
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

实时单目物体SLAM Real-time Monocular Object SLAM

你可能感兴趣的:(算法)