尤齐

视觉slam从几何到深度学习：挑战与机遇＜Ongoing Evolution of Visual SLAM from Geometry to Deep Learning: Challenge＞

2018年

摘要

视觉同时定位和映射（SLAM）在机器人界已经研究了几十年。随着基于几何模型的技术日益成熟和精确，视觉SLAM已经取得了重大进展和成就。然而，在具有挑战性的环境下，它们往往是脆弱的。最近，有一种趋势是开发数据驱动的方法，例如深度学习，以解决具有更稳健性能的视觉SLAM问题。本文旨在通过提供全面的技术回顾，见证视觉SLAM技术从基于几何模型到数据驱动方法的不断发展。我们的贡献不仅是汇编了最先进的端到端深度学习SLAM工作，还深入了解了深度学习SLAM的潜在机制。为此，我们首先简要概述了基于几何模型的方法。接下来，我们确定使用深度学习的视觉深度估计是进化的起点。正是基于深度估计，使用深度学习的自我运动或姿势估计技术迅速蓬勃发展。此外，我们努力将使用深度学习的语义分割与紧急语义SLAM技术联系起来，以阐明自我运动和高水平理解的同时估计。最后，我们设想了这一研究方向的一些进一步机会。

关键词：SLAM·深度学习·深度估计·姿态估计·语义映射

导言

视觉同步定位和映射（SLAM）对于实现基于视觉的移动机器人的持续自主性至关重要，尤其是在未知环境中。它也是巨大的基于视觉的应用程序（如虚拟和增强现实）的关键使能器。在过去的几十年中，来自机器人和计算机视觉社区的研究人员一直致力于设计一些高效和通用的视觉SLAM系统。

大多数现有的视觉SLAM方法基于视觉几何显式地建模摄像机投影、运动和环境。因此，它们被称为基于模型的SLAM。根据使用图像信息的方式，它们可分为基于特征的方法[1-3]和直接方法[4-6]。具体而言，基于特征的视觉SLAM方法从图像中提取稀疏特征，如点和线，用于特征匹配和自我运动估计，而直接方法在光度一致性假设下直接使用密集（或半密集）图像像素进行运动估计。环路闭合检测和后端优化可以与这两种方法结合起来，形成一个完整的可视化SLAM系统。

在过去十年中，最先进的基于模型的视觉SLAM算法取得了巨大成功。例如，基于特征的[3]和直接[6]方法都证明了定位和映射精度的优越性能。然而，它们仍然面临许多挑战性问题，特别是在大规模环境中部署或在极端照明条件下。如今，系统鲁棒性[7]和高级（语义）认知计算感知[7，8]是视觉SLAM系统的要求很高的任务。不幸的是，仅仅依靠基于模型的方法来解决这些问题变得越来越具有挑战性。其中一个原因是，高维图像携带重要的“冗余”信息，现实世界具有复杂的外观，难以以精确的方式手动建模。

深度学习可以以端到端的方式从海量数据中自动学习有效的特征表示，不需要提取手动设计的特征[9]。通过这种方式，深度学习可以根据具体问题学习更稳健和有效的特征，并成功地证明了对一些具有挑战性的认知和感知任务的良好能力，如手写代码识别[10]、人体姿势估计[11]、触觉识别[12]和面部标志定位[13]。不可避免地，视觉SLAM从基于模型的方法演变为深度学习方法。针对视觉SLAM问题开发深度学习方法的最新尝试包括从单目图像对场景的深度估计[14]、视觉里程估计[15]和语义图生成[8]。这些最新进展预示着视觉SLAM系统通过引入自适应和学习能力来解决挑战性问题的巨大潜力。

本文旨在回顾视觉SLAM系统从基于模型到深度学习方法的不断变化。以前的一些出版物提供了各种SLAM技术概述。DurrantWhyte等人[16，17]从递归贝叶斯公式的角度介绍了解决SLAM问题的基本方法。Scaramuzza等人[18，19]对视觉测程（VO）进行了全面审查。Cadena等人[7]对视觉SLAM进行了详细调查，并描述了一些开放性挑战和研究问题，包括系统鲁棒性和语义感知。然而，他们主要集中于基于模型的方法，没有或有限地讨论数据驱动方法。从技术上讲，它们关注于特征的选择、递归优化的框架或循环闭包的检测。显然，我们的工作与他们的不同之处在于，我们专注于使用深度学习的视觉SLAM方法的最新进展，包括深度神经网络的构建、损失函数的设计和估计的灵活性。此外，我们还展示了当设计损失函数或构建深度学习架构时，深度学习SLAM如何从基于模型的方法中受益。我们还强调了语义SLAM对于图像分割的强大深度学习能力的重要性。最后，这个方向的未来机会集中在系统鲁棒性、语义理解和学习能力。

基于模型的SLAM方法

基于模型的SLAM方法基于多视图几何体和光度一致性，显式建模摄像机投影、运动和环境。它们可以分为基于特征的方法和直接方法。基于特征的方法从2D图像中提取和匹配特征点，然后计算和优化相机姿态以及这些特征点在3D中的位置。相反，直接方法使用图像中的像素，通过最小化光度误差而不提取特征点，直接计算6自由度相机姿态。尽管存在大量基于模型的方法，但由于空间限制，我们主要关注定位和映射精度方面的最新技术。

基于特征的视觉SLAM方法

Davison等人提出的单镜头定位系统[20]是最早使用单目摄像机的实时视觉定位系统之一。与缺乏实时性能的结构与运动（SfM）方法不同，MonoSLAM采用概率框架，为地图创建稀疏但一致的3D特征点。通过结合通用摄像机运动模型和特征初始化，MonoSLAM在标准PC上以30 Hz的实时性能实现了3D定位和映射。Monosram将纯视觉和自主机器人技术联系起来，并为增强现实（AR）提供了一些新的潜在应用。

然而，单斯拉姆系统中的跟踪和映射是紧密联系的，并在一个线程中操作。换句话说，6自由度相机姿态和3D地图点在每帧一起更新。由于使用了大量图像，该算法只能处理有限数量的稀疏特征。为了解决这个问题，Klein等人提出了一个并行跟踪和计算映射（PTAM）系统[1]，该系统将跟踪和映射分离为两个并行线程。映射线程根据关键帧更新，并使用计算昂贵的束调整技术执行。跟踪线程以帧速率更新，以基于构建的3D地图估计6自由度相机姿态。在小型环境中使用手持摄像机成功地进行了PTAM。

Mur Artal等人[3]提出的ORB-SLAM是目前最成功的基于特征的SLAM系统之一。他们首先提出了一种基于词袋（BoW）技术的具有ORB特征的地点识别系统[21]。ORB[22]是一种旋转不变和尺度感知特征，可以在高频下提取。所提出的位置识别算法可以高效运行，从而在视觉SLAM系统中实时实现重定位和闭环。然后，在ORB位置识别器[21]的基础上，他们提出了带有单目摄像机的ORB-SLAM[3]，这可以在大规模环境中执行，并证明了其优越的性能。之后，他们将ORB-SLAM从单目摄像机扩展到立体和RGB-D摄像机[23]。

Endres等人提出了基于特征点的RGB-D SLAM[2]。所提出的RGB-D SLAM可以生成密集和精确的3D地图。近年来，出现了一种新的传感器，称为事件摄像机或动态和主动像素视觉传感器（DA VIS）。针对6自由度运动跟踪和三维重建，提出了相应的SLAM算法[24][25]，这些算法在一些具有挑战性的场景中表现出令人印象深刻的性能。

在新兴的语义SLAM中也观察到从低级点特征到高级对象的转变。SalasMoreno等人[26]提出了一种平面SLAM系统，可以检测环境中的平面并生成平面图。他们还提出了一种称为SLAM++[27]的SLAM系统，该系统可以检测椅子和桌子等物体，然后利用这些物体进行定位。然而，提取的对象数量有限，如平面、桌子和椅子，需要特定的监督离线学习。

直接视觉SLAM方法

与上述基于特征的方法不同，直接方法不依赖于手动设计的稀疏特征。相反，他们使用图像中的大多数像素，通过对每个重叠图像对的一些光度误差进行惩罚来估计6自由度相机姿态。

Newcombe等人提出了一种密集跟踪和映射（DTAM）系统[4]。当估计图像中每个像素的深度时，DTAM为每个帧生成密集的3D地图。随后，Newcombe等人[28]提出了使用RGB-D摄像机的动态融合，该摄像机在密集配准和映射中得到了成功证明。KinectFusion依赖截断符号距离函数（TSDF）进行像素网格表示，并利用迭代最近点（ICP）对齐深度图像。DTAM和KinectFusion都在具有商用GPU的室内规模环境中运行，以实现实时性能。

Whelan等人提出了基于RGB-D摄像机的曲面表示的弹性融合[29]。通过使用帧模型跟踪和非刚性变形，ElasticFusion执行基于时间窗surfel的密集数据融合。在不需要姿态图优化或后处理步骤的情况下获得密集的全局一致映射。为了实现实时性能，摄像机跟踪和密集映射也需要GPU。

为了提高基于密度的方法的效率，Engel等人提出了在CPU上实时运行的半密度视觉里程计（SVO）[30]。SVO使用具有不可忽略图像梯度的像素，而不是图像中的所有像素。估计半密集逆深度图，并通过估计深度图的对齐来跟踪6自由度相机运动。Forster等人还提出了一种类似的方法，称为SVO[5]。Engel等人通过引入大规模直接单目SLAM（LSD-SLAM）[31]改进了SVO[30]，该系统可以在具有CPU的大规模环境中运行。LSD-SLAM采用sim（3）来检测尺度漂移，并提供概率解决方案来处理跟踪期间的噪声深度预测。最近，Engel等人进一步改进了直接法，并提出了直接稀疏里程计（DSO）[6]。DSO将光度误差与几何误差相结合，并联合优化所有模型参数。所证明的性能包括跟踪和映射的高精度，以及在某些无特征环境中的鲁棒性。

Pascoe等人提出了NID-SLAM[32]，这也是单目摄像机的直接方法。NID-SLAM选择归一化信息距离（NID）度量来估计摄像机运动，而不是像大多数直接方法那样惩罚光度误差。NID-SLAM在外观变化环境中表现出强大的性能。

总结

基于模型的视觉SLAM方法已经成功地证明了它们在姿态估计和3D地图构建方面的优越能力。特别是基于特征的代表性ORB-SLAM[3]和直接代表性DSO[6]都在大规模环境中实现了高精度，并使用商用CPU实现了实时性能。然而，当他们面对一些无特征的环境或其他挑战场景时，例如严重的图像模糊，他们的鲁棒性仍然会很困难。此外，他们不具备适应特定环境的学习能力。计算机视觉深度学习的成功为通过持续学习提高鲁棒性能提供了一些启示。

用于视觉SLAM的深度神经网络

基于模型的方法用人工设计的特征表示输入图像，并搜索与图像帧之间的特征匹配的最佳姿势。深度学习直接在多个级别学习输入图像的良好表示。对于大满贯问题，表示可以是未知的特征、深度，甚至是两帧之间的自我运动。

在本节中，简要说明了三种类型的深度神经网络（DNN），它们已经在深度学习SLAM方法中找到。有关深度学习的更多信息，请参阅[9]。

卷积神经网络（CNN）

是迄今为止最流行的深度神经网络结构之一。CNN主要由视觉层（例如，卷积层、激活层、池层）和公共层（例如完全连接层）组成，如图1a所示。还经常合并掉层和归一化层（例如批量归一化层）。损失函数，如Softmax和欧几里得损失，通过最小化预测和标签之间的差异来驱动训练。

RNN

Autoencoder

1深度学习的深度估计

深度估计是SLAM系统的基础。基于模型的SLAM方法通常利用来自多个图像的相机视差来估计深度。随着深度学习的发展，数据驱动方法为深度估计提供了一种替代方法。深度学习的深度估计可分为有监督方法和无监督方法。

监督方法

Eigen等人[50]设计了一个深度神经网络，用于对单个图像进行深度估计。这是一种有监督的方法，其中网络训练需要地面真相深度图。该网络由两部分组成：一部分用于全局结构预测，另一部分用于局部预测细化。尺度不变误差被定义为学习的成本函数。在不进行任何后处理的情况下恢复实际深度尺度。所提出的方法在纽约大学深度[41]和基蒂[35]数据集上都产生了良好的结果。根据透视几何，对象的大小与深度成反比。Ladicky等人[53]利用这一特性将图像转换为标准深度进行训练。他们还提出将语义分割和深度估计结合起来以提高性能。该方法也是一种基于单目图像的有监督深度估计方法。Liu等人[51]还提出了一种使用所谓的深度卷积神经场（DCNF）的单图像深度估计方法，该方法将连续条件随机场（CRF）集成到统一的深度CNN框架中。此外，在[34]中提出了超像素池方法和全卷积网络（FCN），以提高分割性能的准确性和效率，也可用于深度估计。Li等人也提出了类似的方法[54]。在[52]中尝试将深度估计与视觉SLAM结合起来，称为CNN-SLAM。这是一个单目SLAM系统，其中来自CNN的预测深度图是密集的，并且具有绝对比例。与基于模型的方法相比，仅从CNN估计深度，而其他部分，如姿态估计和图形优化，与基于特征的SLAM相同。所提出的方法在姿态估计和地图构建方面表现出鲁棒性和精确性。Ma等人提出了一种所谓的稀疏到稠密[55]方法来预测稠密深度图像，该方法可用作基于模型的SLAM方法的插件模块，以创建精确、稠密的点云。他们构造了两个CNN来融合RGB图像和稀疏深度图像。他们的稀疏深度图像可以是基于模型的SLAM或低成本激光雷达。Ummenhofer等人[56]提出的DeMoN通过监督深度学习实现了深度估计。监督方法需要大量的标记数据来训练网络。由于收集标记数据集的成本很高，其应用受到限制。

无监督方法

最近出现了使用无监督深度学习的深度估计方法。主要思想来自自动编码器的表示能力。编码器是预测左输入图像的深度图的CNN，解码器是从右输入图像和预测深度图合成重构左图像的卷绕函数。重建的误差被用作训练CNN的成本函数[48]（s e e F i g.2a）。

（不全）

摘要

表1简要总结了使用深度学习的深度估计方法。深度估计从有监督学习到无监督学习的进步是显著的，因为不需要标记数据，并且终身学习是可行的[48]。无监督学习深度估计在建立SLAM系统的密集图中也很重要。鉴于图像序列中的时间约束，可以使用无监督学习估计自我运动。下一节将对此进行审查。

2基于深度学习的姿态估计

3深度学习的自我运动估计

4语义映射与深度学习

5开放式挑战和未来机遇

结论

基于模型的SLAM在精度上的成熟导致寻求视觉SLAM系统中的鲁棒性和高级认知和感知。受各种视觉任务中深度学习的强大能力的启发，注意力逐渐转向深度学习解决方案。此外，具有学习或自适应能力的视觉SLAM系统是进一步探索的吸引因素。此外，深度学习解决方案还可以使视觉SLAM系统更灵活地产生各种有意义的估计结果，如姿态、深度、3D点云和语义地图。

我们提供了重要证据，表明正在从基于模型的方法向基于深度学习的方法演变。一些深度学习解决方案已经证明了在提高鲁棒性、集成语义信息和合并学习能力方面的性能。预计将继续取得更丰硕的成果。

基于模型的可视化SLAM知识在设计基于深度学习的方法的网络架构、损失函数和数据表示时非常重要。大规模数据集的可用性是深度学习方法广泛应用的关键。采用无监督学习的尝试有望进一步巩固深度学习对视觉SLAM的贡献。

Python爬虫实战：全方位爬取知乎学习板块问答数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫学习开发语言 scrapy 游戏
1.项目背景与爬取目标知乎是中国最大的知识问答社区，聚集了大量高质量的学习资源和经验分享。爬取知乎“学习”板块的问答数据，可以为学习资料整理、舆情分析、推荐系统开发等提供数据支持。本项目目标：爬取“学习”话题下的热门问答列表抓取每个问答的标题、作者、回答内容、点赞数、评论数等详细信息实现动态加载内容的抓取，包含图片和富文本避免被反爬机制限制，保证数据采集稳定结合数据分析，为后续应用打基础2.知乎“
Python实战：自动在知乎回答点赞并采集内容的高阶爬虫教程 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 okhttp 学习
✨写在前面：为什么做知乎自动化操作？知乎作为中国领先的知识问答平台，拥有大量结构化内容。对于研究舆情分析、情绪识别、用户画像，甚至产品舆情反馈采集的用户来说，如何自动获取知乎内容并进行交互行为（如点赞、回答），是一个非常实用的能力。本文将手把手带你用Python完成以下目标：✅自动登录知乎✅自动搜索某个关键词下的热门问题✅自动点赞高质量回答✅自动采集回答内容（文本、点赞数、评论数等）✅自动保存为本
Python爬虫实战：爬取知乎问答与用户信息 Python爬虫项目 python 爬虫 php 数据分析开发语言开源
简介随着网络信息量的爆炸，如何有效获取有价值的内容，成为了数据分析、机器学习等领域的基础之一。爬虫作为数据采集的基本工具之一，常常被用来获取互联网上的公开数据。在这篇博客中，我们将结合最新的Python爬虫技术，详细讲解如何爬取知乎问答与用户信息。本文将会介绍：Python爬虫的基础知识知乎问答网页结构分析使用Python进行知乎数据爬取爬取知乎问答内容与用户信息如何处理和存储爬取的数据使用最新的
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
python实战项目79：采集知乎话题下的所有回答 wp_tao Python副业接单实战项目 python 开发语言
python实战项目79：采集知乎话题下的所有回答一、项目介绍二、代码使用方法三、drissionpage的优缺点四、完整代码五、注意事项一、项目介绍需求是采集知乎某话题下的所有回答，这里以话题“大学宿舍相处之间遇到莫名其妙的冷落怎么办呢？”为例，网页链接为https://www.zhihu.com/question/1898156781215146265，其中189815678121514626
使用 pip 命令下载 whl离线安装包、安装三希 pip
使用pip命令直接从线上下载whl离线安装包并转存到离线环境的过程实际上是分两步进行的：第一步：在线环境下载whl包bash#在具有网络连接的环境中pipdownload--only-binary=:all:--wheel--platform--python-version这里的参数说明：：需要下载的Python包名称。--only-binary=:all:：只下载二进制包（即whl文件）。--w
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
【Python】如何使用.whl文件安装Python包？ civilpy python 开发语言
基本原理在Python的世界中，.whl文件是一种分发格式，它代表“Wheel”。Wheel是一种Python包格式，旨在提供一种快速、可靠且兼容的方式，用于安装Python库。与源代码包相比，Wheel文件是预编译的，这意味着它们已经包含了编译后的扩展模块，这使得安装过程更快，更简单。代码示例以下是使用.whl文件安装Python包的示例步骤：示例1：基本安装假设你已经下载了一个名为exampl
如何安装 `.whl` 文件（Python Wheel 包）喝醉酒的小白 Liunx Python模块 python 开发语言
目录标题如何安装`.whl`文件（PythonWheel包）安装前提安装方法（3种）方法1：直接使用pip安装（推荐）方法2：先进入文件目录再安装方法3：使用绝对路径（适合脚本中调用）⚠️常见问题解决问题1：版本不兼容错误问题2：缺少依赖问题3：权限不足验证安装进阶技巧如何安装.whl文件（PythonWheel包）.whl文件是Python的二进制分发格式（Wheel格式），用于快速安装Pyth
Python 数据挖掘实战：关联规则与聚类分析，解锁数据价值的钥匙清水白石008 python Python题库 python 数据挖掘动画
Python数据挖掘实战：关联规则与聚类分析，解锁数据价值的钥匙引言在数字化浪潮席卷全球的今天，数据已成为企业和组织最重要的战略资产。海量数据蕴藏着巨大的价值，等待我们去挖掘和发现。数据挖掘(DataMining)，作为从海量数据中提取有价值知识和模式的关键技术，正日益受到各行各业的重视。它如同探矿者的火眼金睛，能够穿透数据的迷雾，发现隐藏在背后的规律和趋势，为商业决策、科学研究和社会发展提供强有
PyWavelets shangjg3 PyTorch pytorch 人工智能 python
PyWavelets（pywt）是Python中用于小波变换的核心库，提供了丰富的信号处理和图像处理功能。以下是其核心功能的详细介绍：1.小波变换基础（1）离散小波变换（DWT）将信号分解为近似系数（Approximation）和细节系数（Detail）。importpywtimportnumpyasnp#示例信号signal=np.array([1
Anaconda插件开发 lyh1344 数据库开发
开发环境准备安装Anaconda或Miniconda，确保conda命令可用。推荐使用Python3.7及以上版本。创建独立的开发环境以避免依赖冲突：condacreate-nplugin_devpython=3.8condaactivateplugin_dev插件结构设计Anaconda插件通常采用Python包的标准结构。核心文件包括__init__.py和setup.py。典型目录结构如下：
Python3 数字(Number) froginwe11 开发语言
Python3数字(Number)引言在编程语言中，数字是构成程序的基础元素之一。Python3作为一种高级编程语言，提供了丰富的数字类型和操作方法。本文将详细介绍Python3中的数字类型，包括整数、浮点数、复数等，并探讨它们的特性和应用。整数（Integer）整数是Python3中最基本的数据类型之一，用于表示没有小数部分的数值。在Python3中，整数类型没有大小限制，可以表示任意大小的整数
Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
Web3前沿科技：开启数字资产交易新征程 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据 web3 科技 ai
Web3前沿科技：开启数字资产交易新征程关键词：Web3、数字资产交易、区块链、智能合约、去中心化金融摘要：本文聚焦于Web3前沿科技在数字资产交易领域的应用与发展。详细阐述了Web3的核心概念、相关技术原理，包括区块链、智能合约等。通过具体的算法原理和Python代码示例，深入剖析了数字资产交易在Web3环境下的运行机制。同时，结合实际项目案例，讲解了开发环境搭建、代码实现与解读。探讨了Web3
区块链技术概述：从比特币到Web3.0 闲人编程 Python区块链50讲区块链 web3 python 元宇宙比特币安全
目录区块链技术概述：从比特币到Web3.0引言：数字革命的下一篇章1.区块链技术基础1.1区块链定义与核心特征1.2区块链数据结构可视化2.比特币：区块链的开端2.1比特币的核心创新2.2比特币交易生命周期3.以太坊与智能合约革命3.1以太坊的核心创新3.2智能合约执行流程4.Web3.0：互联网的新范式4.1Web3.0的核心特征4.2Web3技术栈5.Python实现简易区块链系统5.1区块类
【Python常用模块】_Pandas模块3-DataFrame对象失心疯_2023 Python常用模块数据分析 pandas 数据挖掘 python 数据统计数据处理
课程推荐我的个人主页：失心疯的个人主页入门教程推荐：Python零基础入门教程合集虚拟环境搭建：Python项目虚拟环境(超详细讲解)PyQt5系列教程：PythonGUI(PyQt5)教程合集Oracle数据库教程：Oracle数据库教程合集MySQL数据库教程：MySQL数据库教程合集优质资源下载：资源下载合集
基于机器学习的智能文本分类技术研究与应用
在当今数字化时代，文本数据的爆炸式增长给信息管理和知识发现带来了巨大的挑战。从新闻文章、社交媒体帖子到企业文档和学术论文，海量的文本数据需要高效地分类和管理，以便用户能够快速找到所需信息。传统的文本分类方法主要依赖于人工规则和关键词匹配，这些方法不仅效率低下，而且难以应对复杂多变的文本内容。近年来，机器学习技术的快速发展为文本分类提供了一种高效、自动化的解决方案。一、机器学习在文本分类中的应用概述
《Python数据分析与挖掘实战》Chapter8中医证型关联规则挖掘笔记茫茫大地真干净机器学习 Python 数据挖掘
最近在学习《Python数据分析与挖掘实战》中的案例，写写自己的心得。代码分为两大部分：1.读取数据并进行聚类分析2.应用Apriori关联规则挖掘规律1.聚类部分函数分析：defprogrammer_1():datafile="C:/Users/longming/Desktop/chapter8/data/data.xls"processedfile="C:/Users/longming/Des
【机器学习与数据挖掘实战 | 医疗】案例18：基于Apriori算法的中医证型关联规则分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘 Apriori python 关联规则人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
利用chatGPT提取复杂json数据到excel文件中 z日火工具使用 excel chatgpt json
利用chatGPT提取复杂json数据到excel文件中1利用swagger导出json类型的接口数据2使用hiJson工具查看json结构3利用ChatGPT写python代码解析数据4复制代码到vscode运行任务说明：整理一个项目的所有接口，保存到excel文档中。在这里插入图片描述1利用swagger导出json类型的接口数据2使用hiJson工具查看json结构我需要json数据的"pa
【Python深度学习】零基础掌握Pytorch Pooling layers nn.MaxPool方法 Mr数据杨 Python 深度学习 python 深度学习 pytorch
在深度学习的世界中，MaxPooling是一种关键的操作，用于降低数据的维度并保留重要特征。这就像是从一堆照片中挑选出最能代表某个场景的那张。PyTorch提供了多种MaxPooling层，包括nn.MaxPool1d、nn.MaxPool2d和nn.MaxPool3d，它们分别适用于不同维度的数据处理。如果处理的是声音信号（一维数据），就会用到nn.MaxPool1d。而处理图像（二维数据）时，
根包含文件——Luaconf.h (src) LLLLLLLLLLLLLL265161 Inside Lua lua integer 编译器 alignment c++dll
Luaconf.h是配置的总集，定义了平台相关的设置，是所有文件都包含的，即RootlyIncluded。0.前言开始关注Lua也是06年六月的事情，《程序员》的2006年第六期中，我独独看中了Lua，而不是当时我已经比较熟悉的Python和Ruby，即使它们我都关注了好几年，但是都没有Lua给我的震撼大。于是那个夏天，稍微地尝试读了Lua的代码。开学后，我突然觉得自己有点受唆使，轻信了动态的福音
Python3获取5000个元素的单字符表 DechinPhy
技术背景此前考虑过一个问题，有没有办法获取到python里面所有定义好的单字符的表，比如我们获取5000个不一样的单字符，但是常用的chr(number)的方法里面包含了太多的非字母条目，比如缩进换行符等，也会被识别为长度为1的符号。因此需要在此基础上加一个isalpha()的判断。输出5000个字符示例先解释一下思路，我们还是遍历chr中所包含的字符，此时得到的是所有的长度为1的字符，再用str
【安装Stable Diffusion以及遇到问题和总结】岁月玲珑 AI stable diffusion AI编程 AI作画
在本地安装部署StableDiffusion，需要准备好硬件环境，安装相关依赖，然后配置模型。下面为你详细介绍安装部署的步骤：一、硬件要求显卡：需要NVIDIAGPU，显存至少6GB，推荐8GB及以上。系统：Windows10/11、Linux（Ubuntu等）或macOS（需要Rosetta2）。内存：至少16GBRAM。存储空间：准备10GB以上的可用空间。二、软件准备首先要安装Python和
力扣网C语言编程题：接雨水（双指针法）魏劭逻辑编程题 C语言 c语言 leetcode 算法
一.简介前面文章是以动态规划方法实现的，文章如下：力扣网C语言编程题：接雨水（动态规划实现）-CSDN博客本文继续针对力扣网的接雨水问题，以另一种解题思路（双指针）以C语言实现和Python实现。二.力扣网C语言编程题：接雨水（双指针法）题目：接雨水给定n个非负整数表示每个宽度为1的柱子的高度图，计算按此排列的柱子，下雨之后能接多少雨水。示例2：输入：height=[4,2,0,3,2,5]输出：
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
Python各版本发布时间和重要特性 mosquito_lover1 python
1.Python1.x:-Python1.0(1994年1月):第一个正式版本。-Python1.6(2000年9月):最后一个1.x版本。2.Python2.x:-Python2.0(2000年10月):引入了列表推导、垃圾回收等特性。-Python2.7(2010年7月):Python2.x系列的最后一个版本，长期支持至2020年1月1日。3.Python3.x:-Python3.0(2008
python中用matplotlib画图解决中文问题！！！！！！！终于ok了 luckylbb python 爬虫
在网上用了很多方法基本一样最后终于解决了，分享一下，前面几步似曾相识，但是依旧我发解决问题，重点在最后一步，亲测有效！！！！1、首先在Windons\Fonts下面找到simhei的字体没有就去下载，其实就是黑体，将它拖到桌面备用2、importmatplotlibprint(matplotlib.matplotlib_fname())输入命令查找到自己下载的matplotlib配置文件的位置我的
Python使用matplotlib绘制图像时，中文图例或标题无法正常显示问题独不懂 Python python matplotlib 开发语言
Python使用matplotlib绘制图像时，中文图例或标题无法显示问题解决方法一、问题描述二、解决方法欢迎学习交流！邮箱：z…@1…6.com网站：https://zephyrhours.github.io/一、问题描述Matplotlib库是Python中经常使用的绘图工具，但是有时候我们在使用plt绘制图像，需要将英文标题或者图例显示为中文样式，总会出现无法显示的问题，具体情况如下：imp
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h

视觉slam从几何到深度学习：挑战与机遇＜Ongoing Evolution of Visual SLAM from Geometry to Deep Learning: Challenge＞

你可能感兴趣的:(深度学习,机器学习,python)