奥比中光3D视觉开发者社区

SLAM快速入门

作者 | Channon
编辑 | 3D视觉开发者社区

01 SLAM概述

SLAM是Simultaneous localization and mapping缩写，意为“同步定位与建图”。

SLAM的典型应用领域:

机器人定位导航领域-地图建模，VR/AR方面-辅助增强视觉效果，无人机领域-地图建模, 无人驾驶领域-视觉里程计。

SLAM框架:

传感器数据：主要用于采集实际环境中的各类型原始数据。包括激光扫描数据、视频图像数据、点云数据等。

视觉里程计：主要用于不同时刻间移动目标相对位置的估算。包括特征匹配、直接配准等算法的应用。

后端：主要用于优化视觉里程计带来的累计误差。包括滤波器、图优化等算法应用。

建图：用于三维地图构建。

回环检测：主要用于空间累积误差消除。

其工作流程大致为：

传感器读取数据后，视觉里程计估计两个时刻的相对运动（Ego-motion），后端处理视觉里程计估计结果的累积误差，建图则根据前端与后端得到的运动轨迹来建立地图，回环检测考虑了同一场景不同时刻的图像，提供了空间上约束来消除累积误差。

基于传感器的SLAM分类

基于激光雷达的激光SLAM(Lidar SLAM)和基于视觉的VSLAM(Visual SLAM)。

1. 激光SLAM

激光SLAM采用2D或3D激光雷达（也叫单线或多线激光雷达），2D激光雷达一般用于室内机器人上（如扫地机器人），而3D激光雷达一般使用于无人驾驶领域。激光雷达的出现和普及使得测量更快更准，信息更丰富。激光雷达采集到的物体信息呈现出一系列分散的、具有准确角度和距离信息的点，被称为点云。通常，激光SLAM系统通过对不同时刻两片点云的匹配与比对，计算激光雷达相对运动的距离和姿态的改变，也就完成了对机器人自身的定位。

激光雷达测距比较准确，误差模型简单，在强光直射以外的环境中运行稳定，点云的处理也比较容易。同时，点云信息本身包含直接的几何关系，使得机器人的路径规划和导航变得直观。激光SLAM理论研究也相对成熟，落地产品更丰富。

2. 视觉SLAM

眼睛是人类获取外界信息的主要来源。视觉SLAM也具有类似特点，它可以从环境中获取海量的、富于冗余的纹理信息，拥有超强的场景辨识能力。早期的视觉SLAM基于滤波理论，其非线性的误差模型和巨大的计算量成为了它实用落地的障碍。近年来，随着具有稀疏性的非线性优化理论(Bundle Adjustment)以及相机技术、计算性能的进步，实时运行的视觉SLAM已经不再是梦想。

视觉SLAM的优点是它所利用的丰富纹理信息。例如两块尺寸相同内容却不同的广告牌，基于点云的激光SLAM算法无法区别他们，而视觉则可以轻易分辨。这带来了重定位、场景分类上无可比拟的巨大优势。同时，视觉信息可以较为容易的被用来跟踪和预测场景中的动态目标，如行人、车辆等，对于在复杂动态场景中的应用这是至关重要的。

融合激光+视觉

激光SLAM和视觉SLAM各擅胜场，单独使用都有其局限性，而融合使用则可能具有巨大的取长补短的潜力。例如，视觉在纹理丰富的动态环境中稳定工作，并能为激光SLAM提供非常准确的点云匹配，而激光雷达提供的精确方向和距离信息在正确匹配的点云上会发挥更大的威力。而在光照严重不足或纹理缺失的环境中，激光SLAM的定位工作使得视觉可以借助不多的信息进行场景记录。

SLAM与SFM的区别与联系
SFM即Structure From Motion

传统三维重建，这是一门计算机视觉学科的分支，特点是把数据采集回来，然后离线处理，常见应用就是重建某建筑物的3D地图。

区别：

SFM是vision方向的叫法，而SLAM是robotics方向的叫法。

SLAM所谓的Mapping，SFM叫structure；SLAM所谓的Location，SFM方向叫camera pose。

从出发点考虑，SFM主要是要完成3D reconstuction，而SLAM主要是要完成localization。

从方法论的角度上考虑，SFM不要求prediction的，real-time是不要求的，但是对于SLAM而言prediction是必须的，SLAM的终极目标是real-time navigation。

SLAM要求实时，数据是线性有序的，无法一次获得所有图像，部分SLAM算法会丢失过去的部分信息；基于图像的SFM不要求实时，数据是无序的，可以一次输入所有图像利用所有信息。

SLAM是个动态问题，会涉及到滤波、运动学相关的知识，而SFM主要涉及的还是图像处理的知识。

联系：

基本理论是一致的，都是多视角几何；

传统方法都需要做特征值提取与匹配；

都需要优化投影误差；

回环检测和SfM的全局注册方法是同一件事情。

02 代表性的SLAM算法

•VINS-Mono MONO SLAM https://github.com/HKUST-Aerial-Robotics/VINS-Mono

•ORB-SLAM2 RGBD SLAM https://github.com/raulmur/ORB_SLAM2

•LOAM Laser SLAM https://github.com/laboshinl/loam_velodyne

•MaskFusion Semantic SLAM https://github.com/martinruenz/maskfusion

•BundleFusion Dense 3D Reconstruction https://github.com/niessner/BundleFusion

1. VINS-Mono

论文解读

近年来的发展趋势为用低成本惯性测量单元(IMU)辅助单目视觉系统。

单目视觉-惯性系统(VINS)的主要优点是具有可观测的度量尺度，以及翻滚角(roll)和俯仰角(pitch)。这让需要有尺度的状态估计的导航任务成为可能。

IMU测量值的积分可以显著提高运动跟踪性能，弥补光照变化、缺少纹理的区域或运动模糊的视觉轨迹损失的差距。

原文的解决方案的核心是一个鲁棒的基于紧耦合的滑动窗非线性优化的单目视觉惯性里程计(VIO)。

（1）一个鲁棒的初始化过程，它能够从未知的初始状态引导系统。

（2）一个紧耦合、基于优化的单目视觉惯性里程计，具有相机-IMU外部校准和IMU偏置估计。

（3）在线回环检测与紧耦合重定位。

（4）四自由度全局位姿图优化。

（5）用于无人机导航、大规模定位和移动AR应用的实时性能演示。

（6）完全集成于ros的pc版本以及可在iphone 6或更高版本上运行的IOS版本的开源代码。

源码解析

Visual-Inertial融合定位算法

VINS-Mono主要包含两个节点：前端节点feature_tracker_node和后端节点estimator_node。

前端节点处理Measurement Preprocessing中的Feature Detection and Tracking，其他几个部分(IMU preintegration, initialization, LocalBA, Loop closure)都是在estimator_node中处理。

2. ORB-SLAM2

论文解读

ORB-SLAM2是基于单目，双目和RGB-D相机的一套完整的SLAM方案。在实时和标准的CPU的前提下能够进行重新定位和回环检测，以及地图的重用。在实验当中，我们关心的是在大场景中建立可用的地图和长期的定位。与此前的SLAM方案进行对比，在大多数的情况下，ORB-SLAM2展现出一样好的精确程度。

视觉SLAM仅仅通过一个单目相机就能够完成。单目相机也是最便宜也是最小巧的传感器设备。然而深度信息无法从单目相机中观测到，地图的尺度和预测轨迹是未知的。此外，由于不能从第一帧当中进行三角测量化，单目视觉SLAM系统的启动往往需要多个视角或者滤波技术才能产生一个初始化的地图。最后，单目SLAM可能会造成尺度漂移，以及在探索的过程中执行纯旋转的时候可能会失败。通过使用一个双目或者RGB-D相机将会解决这些问题，并且能够成为一种更加有效的视觉SLAM的解决方案。

在这篇文章当中，在单目ORB-SLAM[1]的基础上提出ORB-SLAM2，有以下贡献：

（1）这是首个基于单目，双目和RGB-D相机的开源SLAM方案，这个方案包括回环检测、地图重用和重定位。

（2）我们的RGB-D结果说明，光速法平差优化（BA）比ICP或者光度和深度误差最小方法的更加精确。

（3）通过匹配远处和近处的双目匹配的点和单目观测，我们的双目的结果比直接使用双目系统更加精确。

（4）针对无法建图的情况，提出了一个轻量级的定位模式，能够更加有效的重用地图。

系统框架展示:

3. LOAM

论文解读

《LOAM：Lidar Odometry and Mapping in Realtime》

LOAM是激光雷达SLAM中鼎鼎有名的，一套基于线面特征的前端框架。

使用一个三维空间中运动的两轴激光雷达来构建实时激光里程计。

提出可以同时获得低漂移和低复杂度计算，并且不需要高精度的测距和惯性测量。

核心思想是分割同时定位和建图的复杂问题，寻求通过两个算法同时优化大量变量。

一个是执行高频率的里程计但是低精度的运动估计，另一个算法在一个数量级低的频率执行匹配和注册点云信息。将这两个算法结合就获得高精度、实时性的激光里程计。

使用以6自由度运动的2轴雷达的距离测量值。

难点：不同时间接收到的距离测量值以及运动估计的误差会导致点云的误匹配。

以高频率但低保真度执行测距法以估计激光雷达的速度+以较低的数量级频率运行，以进行点云的精确匹配和配准。

结果表明，该方法可以在最先进的离线批处理方法水平上实现准确性。

主要贡献：是把同时定位与建图（SLAM）技术分为两部分，一个是高频率（10HZ）低精度的里程计odometry过程，另一个是低频率（1HZ）高精度的建图mapping过程，二者结合可实现低漂移、低计算量、高精度的SLAM。

Lidar Odometry：分为特征点提取Feature Point Extraction和特征点关联 Finding Feature Point Correspondence两部分。

特征点提取：在激光雷达每一次sweep中，根据曲率对点进行排序，作为评价特征点局部表面光滑性的标准。曲率最大的为边缘点，曲率最小的为平面点，每个局部提取2个边缘点和4个平面点。
特征点关联：使用scan-to-scan方式，分为边缘点匹配和平面点匹配两部分。计算点到直线的距离和点到平面的距离。
姿态解算：根据匹配的特征点云估计接收端位姿。
Lidar Mapping：低频率建图，前面获得相邻帧的姿态变换，接下来要和全局地图进行匹配，将其加入到全局地图中。

源码解析

LOAM源码主要由四个节点构成，分别完成特征点提取，高频低精度odom，低频高精度odom，双频odom融合的功能，每个节点以rosnode的形式存在，也就是说是独立的进程，进程间通过rostopic传递点云， odom等数据。实际上，四个节点的执行顺序完全是串行的，很容易改成单进程的版本。

4. MaskFusion

-与Mask-RCNN的关联(有使用到)。

多个运动目标进行实时识别、跟踪和重构。

一个实时的、对象感知的、语义的和动态的RGB-D SLAM系统, 超越传统的输出静态场景的纯几何地图的系统。

尽管取得了这些进步，SLAM方法及其在增强现实中的应用在两个领域中仍处于非常初级的阶段。

a.大多数SLAM方法依赖于这样一种假设，即环境大多是静态的，移动的对象最多只能被检测为异常值并被忽略。可以处理任意动态和非刚性的场景仍然是一个开放的挑战。

b.大多数SLAM系统提供的输出是一个纯粹的环境几何图。近期才出现添加语义信息的工作，并且识别主要是限于少数已知的对象实例的三维模型可提前得知，或每个3D地图点划分成一组固定的语义类别没有区分对象实例。

贡献:

识别、检测、跟踪和重构多个运动的刚性对象，同时可以精确地分割每个实例并为其分配一个语义标签。

联合的输出：

(i)Mask- RCNN，这是一个强大的基于图像的实例级分割算法，可以预测80个对象类的对象类别标签；

(ii)一种基于几何的分割算法，这将根据深度和表面法线线索生成一个对象边缘映射，以增加目标掩码中对象边界的准确性。

该系统利用语义场景理解来映射和跟踪多个目标。在从二维图像数据中提取语义标签的同时，系统为每个对象实例和背景分别建立了独立的三维模型。

它在识别、重构和跟踪三个主要问题上存在局限性。

在识别方面，MaskFusion只能识别经过MaskRCNN训练的类中的对象(目前MS-COCO数据集的80个类)，不考虑对象标签分类错误。虽然MaskFusion可以处理一些非刚性物体的存在，例如人类，但是通过将它们从地图上移除，跟踪和重构仅限于刚性物体。在没有三维模型的情况下，跟踪几何信息较少的小目标会产生误差。

5. BundleFusion

BundleFusion_ Real-time Globally Consistent 3D Reconstruction 3D实时重建。

实时、高质量、大规模场景的3D扫描是混合现实和机器人应用的关键。

然而，可扩展性带来了姿态估计漂移的挑战，在累积模型中引入了严重的错误。

这种方法通常需要数小时的离线处理才能全局地纠正模型错误。

最近的在线方法显示了引人注目的结果，但存在以下问题:

（1）需要几分钟的时间来进行在线纠正，阻止了真正的实时使用；

（2）帧对帧(或帧对模型)位姿估计过于脆弱，导致跟踪失败较多；

（3）只支持非结构化的基于点的表示，这限制了扫描的质量和适用性。

我们系统地解决这些问题与一个新颖的、实时的、端到端重建框架。

其核心是一种鲁棒位姿估计策略，通过考虑RGB-D输入的完整历史，用一种有效的分层方法对全局相机位姿集的每帧进行优化。

我们消除了对时间跟踪的严重依赖，并不断地对全局优化的帧进行定位。提出了一个可并行优化框架，该框架采用基于稀疏特征和密集的几何与光度匹配的对应。

我们的方法实时估计全局优化(即束调整BA)姿态，支持从总体跟踪失败中恢复(即重定位)的鲁棒跟踪，并在一个单一框架内实时重新估计3D模型以确保全局一致性。

我们的方法在质量上优于最先进的在线系统，但以前所未有的速度和扫描完整性。提出的框架导致了一个全面的针对大型室内环境的在线扫描解决方案，易用并且能得到高质量的结果。

版权声明：本文仅做学术分享，未经授权请勿二次传播，版权归原作者所有，若涉及侵权内容请联系删文。

3D视觉开发者社区是由奥比中光给所有开发者打造的分享与交流平台，旨在将3D视觉技术开放给开发者。平台为开发者提供3D视觉领域免费课程、奥比中光独家资源与专业技术支持。

点击加入3D视觉开发者社区，和开发者们一起讨论分享吧~

也可移步微信关注官方公众号 3D视觉开发者社区 ，获取更多干货知识哦！

最全2025年AI开发工具深度对比分析：程序员的智能编程助手全指南最新功能、定价策略、使用体验和适用场景 Cursor、GitHub Copilot、Claude 4、Claude Code wei佳人工智能 ai AI编程 webstorm idea vscode
2025年AI开发工具深度对比分析：程序员的智能编程助手全指南引言(不想看文字可直接看后面图表对比）随着人工智能技术的飞速发展，AI编程助手已经从概念走向现实，成为现代软件开发不可或缺的工具。2025年上半年，AI编程工具市场迎来了前所未有的变革，各大厂商纷纷推出革命性功能，从简单的代码补全演进为能够理解完整项目上下文的智能编程代理。据最新市场研究显示，全球AI代码工具市场在2024年达到67亿美
微信小程序-礼物商城：完整开发项目教程薛迟
本文还有配套的精品资源，点击获取简介：微信小程序是腾讯公司推出的移动应用开发平台，适用于无需安装即可使用的在线服务。本项目分享的“微信小程序-礼物商城”源码为开发者提供了电商功能的实际参考，包括商品展示、搜索、购物车、订单管理、支付和用户评价等。源码覆盖了WXML、WXSS、JavaScript基础技术，数据存储、网络请求、页面路由、组件化开发、样式设计、调试与发布、授权与登录以及性能优化等微信小
Python高效编程技术大全：从解释器到异步编程竹石文化传播有限公司
本文还有配套的精品资源，点击获取简介：《Python高性能编程技术》旨在指导开发者深入理解Python的性能优化方法。本书涵盖了从解释器机制、数据结构和内置函数的优化，到使用Numpy、Pandas、多线程和多进程进行数值计算和数据处理，再到并发编程和性能分析等全面技术，帮助开发者提升代码执行效率和处理各种性能挑战。1.Python解释器性能分析Python作为一门解释型语言，其性能受到解释器行为
内核编译配置选项简介（2.4.18-rmk7-pxal）(转) wenlifu71022 linux 内核编译网络 ide system linux networking linux内核
http://blog.chinaunix.net/u1/40228/showart_335965.htmlCodematurityleveloptions代码成熟度选项[*]Promptfordevelopmentand/orincompletecode/drivers显示尚在开发中或尚未完成的代码与驱动.除非你是测试人员或者开发者，否则请勿选择我是开发者，所以选[*][]Promptforob
Python day15
@浙大疏锦行Pythonday15.内容：复习日本周主要的内容是一些常见的机器学习流程以及其中的部分内容标签编码以及连续特征的处理：归一化和正态化等。图像的绘制：热力图、Shap图等的绘制超参数优化算法：网格搜索、贝叶斯以及启发式算法模拟退火、遗传算法等不平衡数据集的处理：过采样以及欠采样。
Spring AOP（面向切面编程，Aspect-Oriented Programming）
SpringAOP（面向切面编程，Aspect-OrientedProgramming）一、SpringAOP是什么？SpringAOP是Spring框架提供的面向切面编程支持，用于将横切关注点（cross-cuttingconcerns，如日志、事务、权限检查等）与核心业务逻辑分离。AOP允许开发者通过声明式方式将通用功能模块化，减少代码重复，提高代码可维护性。核心概念Aspect（切面）：切面
电商新风口：实时视频直播模型MirageLSD震撼发布！| AI日报未来世界2099 AI日报人工智能大模型 MirageLSD
应用1、OpenAI重磅推出ChatGPTAgent！智能体时代正式开启，浏览器将被AI接管2、00后天才团队震撼发布！全球首个A股金融博弈智能体应用横空出世3、KimiPlayground震撼上线：AI助手进化成"全能工具王"，开发者狂欢开启4、MistralAI聊天机器人LeChat大升级：语音交互+深度研究+图像编辑三连击5、Slack掀起AI办公革命：聊天自动总结、术语秒懂、工作流一键自动
初级程序员的复仇！硅谷科技圈技术大佬神作：之前说的vibe coding都是放屁！代理军团来了！2025年底手动编码就会消失！ jike007gt 科技人工智能大数据
文章指出，初级开发者更愿意接受并快速适应AI工具，而部分资深开发者则因对新技术的抵触而落后。即，在AI时代，灵活适应比经验更重要！这导致初级开发者在新技术环境中表现出更高的效率和适应性，成为企业在AI编程时代的重要资产。前天Claude4刷屏了，但不知道大家有没有注意到，Anthropic的老大，Dario，时不时就会在keynote中就会引用一篇文章：《RevengeoftheJuniorDev
【亲测免费】 CAN总线嵌入式开发——从入门到实践：开启智能通信新篇章邴洁沫Edna
CAN总线嵌入式开发——从入门到实践：开启智能通信新篇章去发现同类优质开源项目:https://gitcode.com/项目介绍在现代嵌入式系统中，CAN（ControllerAreaNetwork）总线技术因其高效、可靠的通信能力而备受青睐。为了帮助广大开发者、电子工程师以及对CAN总线技术感兴趣的学生和研究人员更好地掌握这一技术，我们推出了“CAN总线嵌入式开发——从入门到实践”项目。本项目不
微信小游戏源码和小程序游戏代码开发搭建部署南云放马归
本文将利用小程序游戏提供的能力制作一个简单的方块旋转小程序游戏，旨在从零开始介绍小程序游戏的开发过程。源码：casgams.top/gm注册小程序游戏账号进入小程序注册页面按照指引填写信息并提交相应信息，服务类别选择“程序游戏”，子类别可以先选择“休闲程序游戏”，您可以拥有自己的小程序游戏账号，安装并启动开发者工具。fromairtest.core.apiimport*auto_setup(__f
UE5网络联机函数 UE星空 UE蓝图 ue5
FindSessionsCreateSessionJoinSessionDestroySessionSteam是p2p直接联机一、steam提供的测试用AppIdAppId是steam为每一款游戏所设定的独有标识，每一款要上架steam的游戏都会拥有独一无二的AppId。不过为了方便开发者测试，steam提供了游戏名为SpaceWar的AppId480供大家免费使用。二、根据虚幻文档接入Onlin
通过 Ollama 获取并运行本地大型语言模型（LLM）
Ollama是一个开源工具，专为在本地机器上便捷部署和运行大型语言模型（LLM）而设计。它支持多种操作系统（Windows、macOS、Linux），并提供简单的命令行接口和API，适合开发者、研究人员以及对数据隐私有较高要求的用户。本文档将详细指导您如何通过Ollama在本地获取和运行LLM。1.准备工作在开始之前，请确保您的系统满足以下要求：操作系统：Windows、macOS或Linux（支
3D打印遥控投喂船：用ESP32C3打造低成本水上机器人 iotzgq 机器人
项目缘起：从脚踏船到智能投喂的创新转身在创客圈，灵感往往源于意外的"灵光一闪"。这个3D打印遥控投喂船的项目最初只是想做一艘普通的遥控脚踏船，直到开发者突发奇想：为什么不增加一个自动投喂装置？这个改动让项目瞬间具备了实用价值——不仅能在湖面操控小船畅玩，还能精准投放鱼食或鱼药到人工难以到达的水域。最令人称道的是其无线通信方案：放弃了传统遥控模块，采用ESP-NOW协议实现船与遥控器的通信。这种方案
PyCharm高效入门指南：快速提升Python开发效率 famenzhiling python pycharm ide
1.引言PyCharm简介：JetBrains开发的Python集成开发环境（IDE），适用于专业开发者和初学者。为什么选择PyCharm：高效代码编辑、智能工具集成和强大的调试功能。目标读者：Python新手或有其他IDE经验但想快速上手PyCharm的用户。2.安装与初始配置下载与安装：访问JetBrains官网下载PyCharmCommunity（免费版）或Professional（付费版）
Postman + Newman + Jenkins 接口自动化测试 Thomas Kant 自动化测试 postman newman jenkins allure
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】Postman
无人值守人工智能智慧系统数据分析：深度洞察与未来展望呆码科技人工智能数据分析数据挖掘
无人值守人工智能智慧系统数据分析：深度洞察与未来展望随着科技的飞速发展，人工智能（AI）技术已逐渐渗透到社会经济的各个领域，其中无人值守人工智能智慧系统作为AI技术应用的前沿阵地，正引领着一场深刻的行业变革。这类系统通过集成高级算法、大数据分析、物联网（IoT）及云计算等先进技术，实现了对复杂环境的自主监控、智能决策与高效管理，极大地提升了运营效率，降低了人力成本，并开启了数据驱动决策的新纪元。本
Lecture 5：Training versus Testing 薛家掌柜的
回顾一下前四个Lecture，Lecture1讲的是找一个使得（也就是），Lecture2讲的是使得，Lecture3讲的是机器学习的分类，Lecture4讲的是让。那么，我们就有两个核心问题需要解决了。我们如何保证尽可能地靠近？我们如何使得足够小？而在这两个问题里面，假设集大小又扮演着什么样的角色？应该多大呢？如果是一个很小的，能够满足，但是可选的假设又太少了。如果是一个很大的，可选的假设很多，
Redisson：强大的Redis Java客户端库大宝S**蜜 java
Redisson：强大的RedisJava客户端库在Java应用程序中，Redis经常作为缓存、消息代理、分布式锁等功能的首选。然而，直接使用Redis的原生协议或Jedis等简单的Java客户端可能不足以满足复杂的分布式和并发需求。这时，Redisson作为一个功能强大的RedisJava客户端库，提供了许多高级功能和易用性改进，成为开发者的有力工具。1.Redisson简介Redisson是一
论“人工智能生命体”站在那个高度？（之二）中國龍在廣州人工智能-智能体-具身智能人工智能
第一部分：人工智能生命体人工智能生命体，提及的是《人工智能生命体新启点》一书，原文附后，本文中以本书代表。《人工智能生命体新启点》一书，是在现今科学技术发展，从人工智能、智能体、具身智能等大环境下，形成的一种全新理念的理论指导，以此发展出具有自我意识的人工智能生命体，拥有现代科技并以生命体的形式出现，具备类人类般的思想活动，更好的体现与融入人类的社会环境；具有自我意识的智能生命体就如人类的拥有大脑
医疗AI与融合数据库的整合：挑战、架构与未来展望（上） Allen_Lyb 数智化教程（第二期）人工智能数据库架构
引言随着人工智能（AI）在医疗健康领域的广泛应用，数据已成为医疗AI发展的核心驱动力。然而，医疗数据具有极度的异构性（包括结构化电子病历、医学影像向量、基因组JSON/图结构、传感器时序等），传统数据架构难以高效整合。因数据孤岛、复杂ETL流程以及昂贵维护成本，医疗AI平台通常难以充分发挥价值。融合数据库（ConvergedDatabase/多模态一体化数据库）通过支持SQL、JSON、图、向量、
一文看懂：马斯克旗下人工智能公司 xAI 正式推出的Grok 4，Grok 4 如何开启 “多智能体内生化” 的 AI 新范式，重塑多模态大模型与 AI Agent 未来陈敬雷-充电了么-CEO兼CTO 《GPT多模态大模型与AI Agent智能体》新书内容人工智能 gpt agi chatgpt 大模型 deep learning 神经网络
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】GPT多模态大模型与AIAgent智能体书籍本章配套视频课程【陈敬雷】文章目录GPT多模态大模型与AIAgent智能体系列二十六一文看懂：马斯克旗下人工智能公司xAI正式推出的Grok4，Grok4如何开启“多智能体内生化”的AI新范
大模型开源王炸！Kimi K2凭万亿参数撕开大模型天花板：代码、Agent、推理全碾压，32家企业疯抢接入陈敬雷-充电了么-CEO兼CTO 《GPT多模态大模型与AI Agent智能体》新书内容 transformer chatgpt 深度学习 lstm kimi Agent AIGC
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】GPT多模态大模型与AIAgent智能体书籍本章配套视频课程【陈敬雷】文章目录GPT多模态大模型与AIAgent智能体系列二十七开源王炸！KimiK2凭万亿参数撕开大模型天花板：代码、Agent、推理全碾压，32家企业疯抢接入一、架构
使用C#打造预约日程管理系统 Ready-Player
本文还有配套的精品资源，点击获取简介：在信息技术领域，日程管理是重要需求。本文介绍如何使用C#语言实现一个名为"AppointmentSchedule"的预约日程管理系统。首先，文章将引导读者设计一个存储日程信息的数据结构，并提供一个容器类来管理多个预约。然后，文章将讨论如何处理预约冲突并提供用户界面设计建议。同时，也会探讨数据持久化的方法，以及如何为系统添加提醒功能和网络同步功能。最后，开发者可
深入理解传输对象模式：优化分布式系统数据交互的利器
在现代分布式系统架构中，如何高效地在不同层或不同服务间传输数据是一个关键问题。频繁的网络调用会导致系统性能下降，用户体验受损。传输对象模式（TransferObjectPattern）正是为解决这一问题而生的经典设计模式。本文将全面剖析传输对象模式的原理、实现、应用场景及最佳实践，帮助开发者掌握这一优化系统性能的利器。一、传输对象模式概述1.1模式定义传输对象模式（也称为值对象模式、数据载体模式或
从架构到API，你真的掌握了Electron的全貌吗？露露在前端 javascript 前端前端框架 vue.js 面试架构
前言Electron的原理是每个开发Electron应用的开发者都需要了解的知识内容，因为知道整个原理全貌后你才能在设计一个应用的时候更加的合理，遇到问题才知道从哪个方面去分析。这篇文章将主要从架构层面，协作方式，底层支持，源码层面，API设计等方面来剖析Electron的原理。架构层面两个组件Electron的核心架构是基于Chromium和Node.js两个主要组件，各自扮演不同的角色。Chr
解密PHP魔术方法：从__construct到__invoke的终极指南 Jay_MIng php java linux 开发语言运维 python 设计语言
PHP的魔术方法是一类特殊的方法，标志是以下划线__开头，在特定情况下会被自动调用。开发者可以合理利用此特性重载类的默认行为。实现自己想要实现的目的。根据魔术方法的作用可划分为以下几类。基本魔术方法__construct构造函数，在创建对象时自动调用unknownPrototype;//读取了不可访问属性：unknownPrototype__set给不可访问属性赋值时调用unknownProtot
一文讲透HTML语义化标签
文章目录语义化标签概述HTML标签及其含义常见HTML5语义化标签语义化标签对搜索引擎（SEO）的影响提升搜索引擎排名增强可访问性改善用户体验语义化标签案例各标签作用说明语义化标签概述HTML语义化是指使用恰当的标签来准确表达内容的结构和含义，使网页不仅对人类开发者可读，也能被搜索引擎、辅助技术等更好地理解和处理。例如，用表示页眉，表示独立内容区块，提升页面可访问性和SEO效果。HTML标签及其含
Prompt：开启与AI高效对话的钥匙
解密Prompt：开启与AI高效对话的钥匙一、什么是Prompt？——AI的“使用说明书”想象一下，你正在指挥一位无所不知但毫无主动性的“实习生”——人工智能（AI）。你不能指望它“心领神会”，你必须给出清晰、具体的指令，它才能准确地完成你想要的任务。这个指令，就是Prompt（提示或提示词）。简单来说，Prompt是你向AI（如大型语言模型LLM）发出的文本或问题，用以引导它生成特定的、高质量的
Python 生物信息学秘籍第三版（四）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/9694cf42f7d741c69225ff1cf52b0efe译者：飞龙协议：CCBY-NC-SA4.0第十一章：生物信息学中的机器学习机器学习在许多不同的领域中都有应用，计算生物学也不例外。机器学习在该领域有着无数的应用，最古老且最为人熟知的应用之一就是使用主成分分析（PCA）通过基因组学研究种群结构。随着该领域的蓬勃发展，还有许多其他潜在的应
AI人工智能中Actor - Critic算法的深入解析与应用场景 AI智能探索者 AI Agent 智能体开发实战人工智能算法 ai
AI人工智能中Actor-Critic算法的深入解析与应用场景关键词：Actor-Critic、强化学习、策略梯度、价值函数、深度强化学习、马尔可夫决策过程、A2C/A3C摘要：本文将深入解析Actor-Critic算法的核心原理，从基础概念到数学推导，再到实际应用场景。我们将通过生动的比喻解释这一强化学习中的重要算法，展示其Python实现代码，并探讨它在游戏AI、机器人控制等领域的应用。最后，
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http

SLAM快速入门

01 SLAM概述

02 代表性的SLAM算法

你可能感兴趣的:(开发者,人工智能,机器学习,SLAM)