秃头队长

＜论文阅读＞FLIRT：二维激光数据的兴趣区域及其在机器人导航中的应用

摘要：在这篇文章中，我们提出了FLIRT（快速激光兴趣区域变换），用于 2D 激光数据的多尺度兴趣区域算子。FLIRT结合了基于大地线（是指地球椭球面上两点间的最短程曲线）的曲线近似范围信号的探测器和基于占用概率极坐标直方图的描述符。在标准室内和室外数据集的一组比较基准实验中发现了这种组合，该分析与计算机视觉文献中针对兴趣点发现的值重复性和匹配性能相似，鼓励FLIRT在二维激光数据上的广泛应用。我们展示了FLIRT与RANSAC的结合，如何通过特别简单的算法应用于闭环、全局定位、增量建图和基于位姿估计的SLAM。结果表明，FLIRT特征在精确召回性能、效率、通用性和简单性方面对机器人导航具有巨大潜力。

1 Introduction

局部图像特征的引入对许多计算机视觉任务产生了巨大影响，如物体和场景识别、运动跟踪、立体匹配或视觉机器人定位和SLAM。典型的策略是在图像空间中选择感兴趣的位置，并计算区域上的独特描述符，以这些位置为中心。这将图像内容描述为可用于匹配的局部感兴趣区域的集合。对于稳定位置的检测和编码图像结构的描述，都有多种方法可用于图像距离数据。上述领域产生兴趣点的原因也适用于机器人中广泛使用的激光扫描仪产生的2D距离数据。

对于机器人导航，兴趣点有可能成为基于特征和基于网格的方法的替代方案，虽然这两种方式在类似应用的条件下都被证明是成功的，它们都有优缺点。几何特征允许紧凑的地图表示和高精度，但依赖于预定义的模型。从这个意义上讲，使用原始数据或网格的密集方法是通用的，但随着地图大小和维度的变化，其缩放效果较差。另一方面，兴趣点结合了离散特征的紧凑性和原始距离数据的通用性。

Mikolajczyk 等人对图像的不同检测器和描述符进行了比较，对于三维数据，已经提出了几种方法来将比例空间从图像扩展到三维点云，用连通性模型表示的表面代替常规图像网格。Taubin 的一项开创性工作，通过扩散方程的离散对应物取代了连续拉普拉斯算子，Pauly等人提出了一种不同的拉普拉斯图 $_g$ 方法，计算了表面变化量。该量由在采样点的局部邻域中计算的样本协方差矩阵的特征值形成，Novatnack 和 Nishino 使用表面几何表示检测多尺度特征，该表达由嵌入在规则密集2D域中的曲面法线编码。然而，该方法依赖于连接网格来构造参数化，并依赖于良好曲面法线的可用性。Unnikrishnan 等人定义了一个将输入曲线映射为多尺度参数化的积分算子。该算子在大地线的坐标中沿着曲线定义，兴趣点在大地线的邻域中被发现为局部极值。利用激光测距仪的数据，Cole 等人提出了局部显著性的信息论测量方法，以在测量空间中找到自然特征。然而，对于穷举搜索，显著性计算是昂贵的，并且作者只计算随机选取的点的显著性值。

对于二维距离数据，几乎没有相关工作。与本文最接近的是 Bosse 和 Zlot 的工作路线。其中，作者将整个激光扫描定义为特征，并使用方向直方图来描述它们。另一个，针对基于子地图的SLAM应用程序中的位置识别任务，评估了2D距离数据的几对检测器/描述符。虽然有趣，但与我们的方法的主要区别是，在子地图上定义了9×9m的描述符支持区域，这些子地图是20-30次扫描的集合，间隔为1−相距2米，他们的方法是子地图特征化技术，而不是局部兴趣点算子。虽然这一特性并不限制于论文中给出的良好结果，但我们有兴趣为2D范围数据设计一个通用的多尺度关键点，该关键点保留了局部性的重要概念，而局部性是视觉兴趣点成功的关键。FLIRT功能就是本着这种精神设计的：它们是在局部定义的（在典型地0.5米半径的支持区域）和在单帧扫描上。

2D距离数据不同于图像数据和3D点云的原因是多方面的。作为一种简单的方法，可以将计算机视觉技术应用于距离数据，用距离信号代替图像强度值。虽然这种方法得到了一些结果，但它无法处理许多兴趣的结构，因为这些结构周围的范围变化可能很弱（角落就是一个例子）。这是因为距离数据的性质不同于图像数据的性质，因为距离数据表示更高维度空间中的流形。在3D范围数据的情况下，该流形是3D中的曲面，对于2D数据，它是笛卡尔空间中的曲线。此外，对于距离数据，测量稀疏度是高度不均匀的，并且视点变化，部分原因是测距仪的角度分辨率比相机低，这些差异激发了2D范围数据特殊衍生的兴趣点变换。本文扩展了我们之前的工作，其中我们比较了2D距离数据的几种检测器和描述符方法，并提出FLIRT是稳定性和匹配性能方面最强大的组合。在这里，我们报告了FLIRT应用于导航问题的综合实验，如全球定位、环路闭合、增量建图和SLAM。

本文的结构如下。第2节介绍了FLIRT探测器和描述符。第3节描述了FLIRT如何应用于机器人导航，第4节给出了实验结果。第5节总结了本文。

2 FLIRT

在本节中，我们介绍了快速激光兴趣点变换（FLIRT），这是一种用于二维距离数据的多尺度兴趣点算子。该算子由基于距离信号的大地线曲线近似的检测器和基于占用概率的极性直方图的描述符组成。这种特殊的组合是综合评估的结果，我们在一组基准实验中比较了四个不同的检测器和两个描述符。现在我们将描述FLIRT检测器和描述符。

2.1基于曲率的检测器

探测器来源于 Unnikrishnan 和 Hebert 针对3D点云的方法，应用于2D距离数据。该检测器背后的基本原理是距离数据定义笛卡尔空间中的曲线，尺度空间理论应应用于该曲线而不是原始信号。

应用于该曲线而不是原始信号。作者定义了一个将输入曲线映射到多尺度参数化的积分算子。
$\int_Γk(s,u;t)a(u)du \tag{1}$ $\mathcal{N}(s-u;t) \tag{2}$
其中 $Γ$ 是曲线，$α(s)是大地线的坐标s的参数化， $k (s, u; t)$ 是高斯核,然后，通过用（未知）采样密度 $p (s; t)$ 归一化平滑核，
$\tilde{k}(s,u;t) = {k(s,u;t)\over p(s;t)p(u;t)} \tag{3}$ $p(s;t)=\int k(s,u;t)p(u)du \tag{4}$
尺度 $t$ 处的采样密度$p(s;t)，通过使用高斯核的局部核密度估计来近似。这产生了每个刻度的曲线，
$\tilde{S}(a(s);t)=\int_{Γ}{\tilde k(s,u;t)a(u)du} \tag{5}$
增加 $t$ 的平滑度。然后通过找到指数阻尼表达式的局部最大值来检测兴趣点
${2||x-\tilde S(a(s);t)|| \over t} e^{2||x-\tilde S(a(s);t)| \over t|} \tag{6}$
$||x-\tilde S(a(s);t)||$ 是原始曲线与其平滑版本 $\tilde S(a(s);t)$ 之间在笛卡尔空间中的误差距离。利用该方法， $t$ 尺度下的兴趣点对应于 $t$ 等于平滑信号的局部曲率的倒数的位置 $\tilde S(a(s);t)$ 。示例检测结果如图2和图4所示。

2.2β-网格描述符

图像和距离数据之间的一个重要区别是，距离数据编码度量距离，但也编码传感器（发出光或声音）和测量对象之间的定向自由空间信息。占用网格自然地处理自由空间信息，这就是为什么我们采用这个概念来为二维范围数据构建有意义的描述符。具体来说，对于每个检测到的兴趣点 $p_{det}$ ，我们定义了围绕 $p_{det}$ 的空间的极轴细分。这种细分在极轴空间中是线性的，其半径与兴趣点的比例成比例。为了估计占用概率，我们应用贝叶斯参数学习。这种方法提供了一种可靠的方法来初始化小区概率，并对占用值进行方差估计。

我们现在导出了占用网格的贝叶斯参数估计表达式。考虑第 $j$ 个格子，其被光束 $b$ 击中的可能性遵循伯努利分布，由格子占用概率 $occ_j$ 参数化，其中当激光束在格子内反射（击中）时， $b$ 等于 $1$ ，当激光束穿过格子（未击中）时 $b$ 等于 $0$ 。占用概率使用伯努利的共轭先验进行建模，伯努利是贝塔分布，这是一个在区间[0，1]上定义的连续分布，由两个正形状参数 $α$ 和 $β$ 进行参数化，
$p_β(occ_j;α,β) = {occ_j^{a-1}(1-occ_j)^{β-1} \over B(α,β)} \tag{7}$
其中 $B (α, β)$ 是 $E u l e r β$ 函数。得到占用概率 $occ_j$ 包括估计 $B e t a$ 分布的参数（因此描述符的名称）。注意，兴趣点还定义了一个由曲率给出的方向。该方向用于获得旋转不变量。

在一系列测量中，也就是说，一系列光束 ${b_i}^n_{i＝1}$ ，击中或者未击中箱子，更新规则如下:
$α_i = α_{i-1} + \sum 1^{b_i}$ $β_i = β_{i-1} +\sum1^{1-b_i} \tag{8}$
对于 $i = 0$ ，两个参数都设置为 $1$ ，其 $B e t a$ 分布在 $[0 ， 1]$ 上是均匀的。点估计值为后验贝塔分布的期望值:
$\hat{occ_j} = {α\over {α+β}} = {hit +1 \over hit + misses +2} \tag{9}$
因此，该概率的方差为:
$var(occ_j) = {αβ \over {α+β}^2(α+β+1)} \tag{10}$
极坐标直方图中占用概率的集合及其方差估计构成了 $p_det$ 的 $b e t a$ 网格描述符

3 应用

现在，我们将探讨FLIRT在机器人导航方面的潜力。我们将FLIRT功能应用于全局定位，回环闭合，增量建图和基于位姿估计的SLAM，并展示了如何仅使用现成的RANSAC和图形优化器成功解决这些导航任务。位姿推算仅在无特征的地方（例如无结构的无限走廊）的特殊情况下才需要，其中系统可以回退到测程法或等速运动模型。除了这种情况，与FLIRT的数据关联完全基于外观，不依赖于已知非常容易出错的位姿估计。

3.1 全局定位和闭环

全局定位是在给定传感器观测和先验地图的情况下估计机器人姿势的问题。这是一个相关性问题，例如，对于SLAM中的回环，机器人必须决定是否已经访问了当前观察到的地方以及在哪里访问过。假设地图 $m$ 是一个节点网络，每个节点都拥有相应的机器人姿势，扫描 $z$ 和相应的 $F L I R T$ 特征集 $F$ ，使用 $R A N S A C$ 可以在线性时间内轻松解决全局定位问题。

通过匹配其特征集 $F_i$ ， $F_j$ ，两个扫描的关联如下。特征检测后，第一步是通过匹配描述符向量来计算候选对应集。此匹配是使用对称 $χ^2$ 距离和阈值为 $0.4$ 的最近邻策略完成的。将候选对应设置为输入后， $R A N S A C$ 返回特征集 $x_{ij}$ 、内点集合 $C$ 和位移残差 $e$ 。内点阈值设置为 $0.3$ 。如果内点数高于阈值 $n_{min}^I$ ，则被视为匹配。然后使用完整的内点集合中以最小二乘方式细化位移估计。有关匹配示例，请参见图 1。

在姿势跟踪中，该程序提供一组加权样本，其中 $R A N S A C$ 获得的位置和权重作为残差的倒数。这些样本近似给定观测值和地图 $p(x_t |z_t , m)$ 的姿态分布，可用于许多贝叶斯滤波方案进行定位。

3.2 SLAM 和增量建图

FLIRT功能允许基于特征的SLAM方法（如使用视觉关键点）或基于位姿的SLAM方法（如基于完整扫描的或使用关键点的）。由于数据关联完全基于外观，因此基于位姿的方法似乎是此处采取的自然选择。作为 SLAM 后端，我们使用的 $T O R O$ 图形优化器。

可以通过紧凑的算法1执行具有FLIRT功能的SLAM。开始时，使用空映射 ${ } m = \{\}$ 调用算法。它以增量方式添加新节点，并针对每个位姿在地图中查找有效的约束。无需区分增量匹配的局部约束和回环闭合的全局约束。如果内点集足够大，则约束有效， $∣ C ∣$ > $n^{min}_I$ ，并且完整扫描的重投影误差 $Error(x_t) < E_{max}$ 。第二个条件是进一步保证匹配的几何相关性。该算法生成局部密集的位姿图，其中节点交织在一起，直到扫描之间的重叠变得太小而无法进行有效的 RANSAC 匹配。

如果环境包含对称性（看起来相似的地方）或无特征的区域，则基于外观的数据关联是不够的，需要对位姿进行区分。对于前一种情况，将对候选约束的一致性执行附加测试。为此，我们在两条边之间的最短路径上传播估计的协方差（由 Dijkstra 算法找到），并在显著性水平 $0.95$ 处执行验证检验。扫描到扫描匹配的协方差 $Σ$ 是通过将兴趣点的误差传播到最小二乘位移表达式来计算的。这会在第 6 行中添加另一个条件。提取的兴趣点不足且系统回退到里程计的情况需要另外两行，测试和对里程计的推算。

算法 1 也适用于增量建图或扫描匹配问题。使用二维范围数据的局部兴趣点，增量建图具有与视觉里程计相同的问题陈述，并且可以通过BA技术来解决。事实上，算法1实现了基于位姿的束调整变体：从当前扫描中提取FLIRT特征后，可以从滑动窗口 $W$ 将其与前 $n$ 次扫描相匹配。每次成功的 $R A N S A C$ 匹配都会与 $W$ 内的扫描产生一个位移，该位移作为约束添加到姿势图中。对算法 1 的简单更改实现了这一点：在第 4 行中选取扫描的集合从 $m$ 更改为 $W$ 。通过这种方式，算法 1 同时实现 SLAM 和增量建图。

【LangChain编程：从入门到实践】LangChain与其他框架的比较 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】LangChain与其他框架的比较1.背景介绍1.1人工智能发展现状在当今时代，人工智能(AI)已经成为科技领域中最热门和最具革命性的话题之一。随着计算能力的不断提升和算法的持续优化,AI系统正在不断扩展其应用范围,包括自然语言处理、计算机视觉、决策系统等各个领域。1.2LangChain概述在这种背景下,LangChain作为一个新兴的AI框架应运而生。L
PHP接单涨薪系列（九）之计算机视觉实战：PHP+Stable Diffusion接单指南（2025高溢价秘籍）攻城狮凌霄 PHP PHP接单涨薪 AI php 计算机视觉 stable diffusion
案例场景某电商公司使用本方案后，产品图制作成本降低90%，广告转化率提升35%，单月节省设计费用超¥80,000。本文将彻底解密如何用PHP+AI视觉技术接取高单价设计外包，让你在竞争激烈的市场中脱颖而出！一、视觉设计市场的AI革命1.1传统设计vsAI设计设计任务传统流程AI流程需求沟通初稿设计反复修改最终交付AI生成微调即时交付2025年设计市场数据对比：指标传统设计AI设计提升幅度单图制作时
地面电力巡检机器人系统设计（支持资料参考_相关定制）
摘要随着时代的发展，电力基础设施建设逐‎‏渐成为‎‏经济发‎‏展的重‎‏要一环‎‏。目前‎‏，巡检‎‏作业方‎‏式仍旧‎‏是以人‎‏工巡视‎‏为主，‎‏这样就‎‏会使得‎‏检修时‎‏间滞后‎‏，导致‎‏输电线‎‏路运行‎‏效率低‎‏下。机器人对释放劳动力和提高人们生活水平有着不可替代的地位,已经成为各国科技发展的重要战略。机器人可以为我们做一些我们人类做不到的事情也可以帮助我们去一些危险地区探索或
纹理贴图算法研究论文综述点云SLAM 算法图形图像处理算法纹理贴图计算机图形学计算机视觉人工智能虚拟现实（VR）纹理贴图算法综述
纹理贴图（TextureMapping）是计算机图形学和计算机视觉中的核心技术，广泛应用于三维重建、游戏渲染、虚拟现实（VR）、增强现实（AR）等领域。对其算法的研究涵盖了纹理生成、映射、缝合、优化等多个方面。1.引言纹理贴图是指将二维图像纹理映射到三维几何表面上，以增强模型的视觉真实感。传统方法主要关注静态几何模型上的纹理生成与映射，而近年来，随着多视角图像重建、RGB-D扫描、神经渲染的发展，
ConvNeXT：面向 2020 年代的卷积神经网络
摘要视觉识别的“咆哮二十年代”始于VisionTransformer（ViT）的引入，ViT很快取代了ConvNet，成为图像分类任务中的最新最强模型。然而，vanillaViT在应用于目标检测、语义分割等通用计算机视觉任务时面临困难。HierarchicalTransformer（如SwinTransformer）重新引入了若干ConvNet的先验知识，使Transformer成为实用的通用视觉
ZED相机与Foxglove集成：加速机器人视觉调试效率的实用方案
随着机器人技术的发展，实时视觉数据流的高效传输和可视化成为提升系统性能的重要因素。通过ZED相机（包括ZED2i和ZEDX）与FoxgloveStudio平台的结合，开发者能够轻松访问高质量的2D图像、深度图和点云数据，从而显著提高感知系统的调试效率。实时可视化价值数据监控ZED相机与Foxglove的集成使得开发者可以在Foxglove平台上查看高分辨率的2D图像、深度图和点云数据。这种能力让团
深度学习前置知识全面解析：从机器学习到深度学习的进阶之路
一、引言：人工智能时代的核心技术在当今这个数据爆炸的时代，人工智能(AI)已经成为推动社会进步的核心技术之一。作为AI领域最重要的分支，深度学习(DeepLearning)在计算机视觉、自然语言处理、语音识别等领域取得了突破性进展，彻底改变了我们与机器交互的方式。本教案将从机器学习的基础知识出发，系统性地介绍深度学习的核心概念、数学基础、网络架构和训练方法，为读者构建完整的知识体系框架。无论你是刚
PyTorch实战：从零构建CNN模型，轻松搞定MNIST手写数字识别
PyTorch实战：从零构建CNN模型，轻松搞定MNIST手写数字识别大家好！欢迎来到我的深度学习博客！对于每个踏入计算机视觉领域的人来说，MNIST手写数字识别就像是编程世界的“Hello,World!”。它足够简单，能够让我们快速上手；也足够完整，可以帮我们走通一个深度学习项目的全流程。之前我们可能用Keras体验过“搭积木”式的快乐，今天，我们将换一个同样强大且灵活的框架——PyTorch，
计算机视觉中的Transformer：ViT模型详解与代码实现 AI大模型应用工坊计算机视觉 transformer 人工智能 ai
计算机视觉中的Transformer：ViT模型详解与代码实现关键词：计算机视觉、Transformer、ViT、自注意力机制、图像分块摘要：传统卷积神经网络（CNN）统治计算机视觉领域多年，但2020年一篇《AnImageisWorth16x16Words:TransformersforImageRecognitionatScale》的论文打破了这一格局——它将NLP领域的Transformer
《YOLO11的ONNX推理部署：多语言多架构实践指南》空云风语 YOLO 人工智能深度学习目标跟踪人工智能计算机视觉 YOLO
引言：YOLO11与ONNX的相遇在计算机视觉的广袤星空中，目标检测始终是一颗耀眼的明星，其在自动驾驶、智能安防、工业检测、医疗影像分析等诸多领域都有着举足轻重的应用。想象一下，自动驾驶汽车需要实时准确地检测出道路上的车辆、行人、交通标志；智能安防系统要快速识别出监控画面中的异常行为和可疑人员；工业生产线上，需要精准检测产品的缺陷；医疗影像分析中，辅助医生检测病变区域。这些场景都对目标检测技术的准
逻辑结构学派一（五个基础理论）刘海东刘海东人工智能
逻辑结构学派一（五个基础理论）作者：刘海东，中国广东技术师范大学摘要本篇论文通过《逻辑结构学派的宗旨》、《逻辑结构学》、《逻辑工程学》、《逻辑方程结构图理论》、《仿生逻辑理论》五个领域的研究提出《逻辑结构学派的宗旨》、《主观能动性结构》、《主观能动性结构工程》、《赋予生命的逻辑方程结构图》、《仿生逻辑》五个基础经典理论，让人工智能、机器人、智能社会三个主体的基础研究有了方向、方法和判断标准。关键词
【CVPR2024】计算机视觉|即插即用|DFAM:marine！不懂DFAM，别说你会做水下动物分割！
论文地址：http://arxiv.org/pdf/2404.04996v1代码地址：https://github.com/Drchip61/Dual_SAM关注UPCV缝合怪，分享最计算机视觉新即插即用模块，并提供配套的论文资料与代码。https://space.bilibili.com/473764881摘要本研究提出了一种新颖的特征学习框架，名为**Dual-SAM，用于高性能的海洋动物分割
【无需编程即可创建交易机器人】
打造交易机器人通常需要一定的编程知识，但也有一些无需编程的工具和平台可以帮助用户实现这一目标。以下是几种无需编程即可创建交易机器人的方法：使用可视化交易平台许多交易平台提供了可视化工具，允许用户通过拖放组件来创建交易策略。例如，TradingView和MetaTrader都提供了这样的功能。用户可以通过选择不同的技术指标、设置条件规则来构建交易策略，而无需编写代码。利用第三方机器人服务一些第三方服
Python与Dlib库实现人脸技术实战西域情歌
本文还有配套的精品资源，点击获取简介：本项目详细说明了如何使用Python结合Dlib库实现人脸检测、识别、数量检测和距离检测。利用Dlib提供的机器学习算法和计算机视觉功能，包括HOG特征检测、级联分类器、面部特征向量模型和关键点预测等，项目能够快速准确地在图像中检测和识别人脸。此外，还介绍了如何统计图像中的人脸数量以及如何计算人脸之间的距离。通过实际代码资源，开发者能够掌握实时人脸技术的应用，
STM32外设应用全解析人工智能我来了 IT技术 stm32
STM32外设应用全解析STM32微控制器是一颗神奇的芯片，仿佛是嵌入式系统的瑞士军刀，集合了多种外设，为你的项目赋能。今天，我们将深入解析STM32的外设，看看它们如何为各种应用场景增添色彩。准备好了吗？让我们一起探讨吧！1.STM32外设概述1.1什么是STM32外设？你有没有想过，单片机其实就像一个机器人，而外设就是帮它实现各种功能的“工具人”？STM32单片机，基于ARMCortex-M3
视觉表征和多模态融合一只齐刘海的猫语言模型
视觉表征和多模态融合是当前人工智能领域的研究热点，特别是在计算机视觉和自然语言处理的交叉领域。视觉表征是指将图像或视频信息转化为模型可以处理的向量形式，而多模态融合则是将不同类型的数据（如视觉、文本、音频等）进行整合，以实现更全面、准确的信息理解和处理。视觉表征(VisualRepresentation)目的：将图像或视频数据转化为深度学习模型可以理解的特征向量。方法：卷积神经网络(CNN)：传
【LLM论文阅读】一只齐刘海的猫论文阅读
LLM论文阅读论文重点论文链接RopeRoFormer:EnhancedTransformerwithRotaryPositionEmbeddingRoPE论文阅读YarnUnderstandingYaRN:ExtendingContextWindowofLLMs论文YaRN笔记T5ExploringtheLimitsofTransferLearningwithaUnifiedText-to-Te
AI时代的微改变测试@小成同学人工智能人工智能
改变1：新闻行业AI主播正式上岗改变2：手机制造商李健称荣耀不再是智能手机制造商改变3：汽车制造商马斯克:特斯拉其实不是一家汽车制造商，而是一家人工智能机器人公司。特斯拉的终极目标是成为一家生产机器人的公司，包括车形机器人和人形机器人。强者拥抱变化，弱者畏惧变化，顺应时代洪流。
路径规划算法---A* 算法详解：最优路径规划的启发式之王 HR Zhou 路径规划算法算法路径规划 A算法图搜索算法
A*（A-Star）算法是最常用、最实用的路径规划算法之一。它结合了Dijkstra算法的最短路径保证与启发式搜索的高效性，是自动驾驶、机器人、游戏AI等领域的“黄金标准”。一、A*是什么？A*是一种启发式图搜索算法，用于在图中寻找从起点到目标的最短路径。它兼顾两件事：已经走过的真实代价（走了多远）到目标的预计距离（还有多远）并通过一个公式综合评估下一步该往哪走。二、核心思想公式f(n)=g(n)
提炼总结—ROS2机器人开发（第9章）（下）
写在最前面的话为什么做该博客？该博客的特点是什么？随着DeepSeek、ChatGPT等AI技术的崛起，促使机器人技术发展到了新的高度，诞生了宇树科技、特斯拉为代表的人形机器人，四足机器人等等，越来越多的科技巨头涌入机器人赛道，行业对于相关人才的需求也随之达到了顶峰。本博客的内容是替你阅读所有关于机器人的经典书籍，采用书籍瘦身计划，帮你提炼出核心内容，采用最通俗易懂的语言来解释原理，将书读薄。大大
LabVIEW 3D 场景中 Voronoi 图（基站覆盖模拟）功能 LabVIEW开发 LabVIEW知识 LabVIEW参考程序 labview 3d LabVIEW程序 LabVIEW知识 LabVIEW功能
通过MathScriptNode与3D场景图（SceneGraph），模拟蜂窝基站部署场景，通过Voronoi图划分基站覆盖区域。既实现三维地形构建、交互操作（如视角调整、基站创建），又能动态生成Voronoi图展示基站影响范围，覆盖对象创建、纹理映射、透明度设置等三维可视化关键逻辑，为通信场景模拟、机器人路径规划等提供基础验证环境。功能介绍核心流程三维地形构建：用随机高度图（rand函数生成）创
AI人工智能领域必备：AI芯片的关键作用 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 AI人工智能与大数据技术人工智能 ai
AI人工智能领域必备：AI芯片的关键作用关键词：AI芯片、算力、神经网络、能效比、专用架构、异构计算、存算一体摘要：在人工智能高速发展的今天，从手机里的“语音助手”到马路上的“自动驾驶汽车”，从医院的“智能影像诊断”到工厂的“机器人流水线”，AI技术的落地离不开一个“幕后大功臣”——AI芯片。本文将用“快递分拣工厂”“人脑神经村”等生活案例，带你一步一步理解AI芯片的核心作用、工作原理和未来趋势，
大语言模型应用指南：谷歌 Gemini 简介 AI天才研究院 AI大模型企业级应用开发实战 AI人工智能与大数据计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型应用指南：谷歌Gemini简介关键词：大语言模型，Gemini，谷歌，人工智能，应用指南1.背景介绍近年来，人工智能领域取得了突破性进展，尤其是大语言模型（LargeLanguageModels，LLMs）的出现，彻底改变了我们与信息交互的方式。从最初的聊天机器人到如今的代码生成、文本创作等领域，LLMs展现出惊人的能力。谷歌作为科技巨头，一直走在人工智能研究的前沿。继BERT、LaMD
用于人形机器人强化学习运动的神经网络架构分析
1.引言：人形机器人运动强化学习中的架构探索人形机器人具备在多样化环境中自主运行的巨大潜力，有望缓解工厂劳动力短缺、协助居家养老以及探索新星球等问题。其拟人化的特性使其在执行类人操作任务（如运动和操纵）方面具有独特优势。深度强化学习（DRL）作为一种前景广阔的无模型方法，能够有效控制双足运动，实现复杂行为的自主学习，而无需显式动力学模型。1.1人形机器人运动强化学习的机遇与挑战尽管DRL取得了显著
从0到1掌握OpenCV！Python图像处理实战全解析（附代码+案例）小张在编程 Python学习 opencv python 图像处理
引言你有没有想过，手机里的美颜滤镜如何精准识别五官？监控摄像头如何在人流中锁定可疑目标？医学影像软件如何从CT片中快速标注病灶？这些“神奇操作”的背后，往往藏着一个低调的“图像处理神器”——OpenCV。作为Python生态中最受欢迎的计算机视觉库，它用一行行代码将抽象的像素点变成可操作的“数字画布”。今天，我们就从最基础的图像读写开始，手把手带你解锁OpenCV的“十八般武艺”，从图像处理小白变
目标检测在国防和政府的应用实例 MzKyle 计算机视觉目标检测人工智能计算机视觉
一、目标检测技术概述目标检测是计算机视觉的核心任务，通过算法对图像/视频中的物体进行识别与定位，当前主流技术包括：经典算法：YOLO系列（实时性强）、FasterR-CNN（精度高）、SSD（平衡速度与精度）技术升级：结合深度学习（CNN、Transformer）、多模态融合（视觉+红外+雷达）、边缘计算实时处理二、国防领域核心应用实例（一）军事侦察与监控系统无人机侦察与目标识别应用场景：战术无人
关于系统无法找到 arm-linux-gcc 命令，这表明你的环境中尚未安装 ARM 交叉编译工具链。以下是详细的解决方案：（DIY机器人工房） DIY机器人工房软件问题解决方法大全 arm开发 linux 运维交叉编译嵌入式
1.错误原因分析错误信息：无法将“arm-linux-gcc”项识别为cmdlet/函数/程序这说明Windows或Cygwin环境中没有安装ARM交叉编译工具，或者工具路径未添加到系统PATH中。当前环境：你之前使用的是Cygwin环境下的x86_64架构GCC（用于编译x86程序），而arm-linux-gcc是专门用于编译ARM架构程序的工具链，需要额外安装。2.解决方案：安装ARM交叉编译
VLA模型
一介绍在机器人领域，视觉-语言-动作(VLA)模型的发展经历了显著的演变，这得益于计算机视觉和自然语言处理领域的进步。VLA模型代表了一类旨在处理多模态输入的模型，整合了来自视觉、语言和动作的信息。这些模型对于实现具身智能至关重要，使机器人能够理解物理世界并与之互动。以下是VLA模型发展的时间线：早期阶段：计算机视觉和自然语言处理的集成大约在2015年开始，随着视觉问答(VQA)系统的出现。这些系
禾赛嵌入式工程师面试
面试的是机器人嵌入式岗位1如果一个按键A，按键B，用ST32控制，你会如何设计从而识别哪个短按，长按，同时按，你会如何设计为了识别按键的短按、长按和同时按的情况，可以通过STM32的GPIO（通用输入输出）和定时器来实现。基本思路是：短按：按键按下并立即释放，按下时间很短。长按：按键按下并持续一段时间不释放。同时按：按键A和B同时按下。方案设计：硬件连接：将按键A和按键B连接到STM32的GPIO
Random Erasing：计算机视觉的「隐形斗篷」——遮挡艺术的对抗学习革命星光银河深度学习-代表性技术主题 /概念层面计算机视觉学习人工智能 cnn 神经网络深度学习
当ImageNet冠军模型在真实世界的遮挡面前崩溃时（识别准确率骤降38%），中科院自动化研究所2017年提出的RandomErasing技术以一纸惊艳了学界。这种在图像中随机挖洞的简单操作，让ResNet-50在Partial-iNaturalist数据集上抗遮挡能力提升4.2倍，错误率降低59%，揭示了模型鲁棒性的深层密码。️遮挡困境：视觉模型的阿喀琉斯之踵图像识别鲁棒性演化史时代技术Imag
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数