自动驾驶之心

多模态最新Benchmark！aiMotive DataSet：远距离感知数据集

点击下方卡片，关注“自动驾驶之心”公众号

ADAS巨卷干货，即可获取

点击进入→自动驾驶之心【多传感器融合】技术交流群

后台回复【aiMotive】获取更多论文和数据集等更多信息！

摘要

自动驾驶是计算机视觉领域的一个研究热点。因为自动驾驶汽车对安全性要求很高，确保鲁棒性对现实世界的部署至关重要。虽然有几个公共多模态数据集可以访问，但它们主要包括两种传感器模态（照相机、激光雷达），它们不太适合不利的天气。此外，它们缺乏远程标注，这使得训练神经网络变得更加困难，而神经网络是自动驾驶汽车高速公路辅助功能的基础。因此，本文引入了一个多模态数据集，用于具有远程感知的鲁棒自动驾驶。该数据集由176个场景组成，具有同步和校准的激光雷达（Lidar)、相机和毫米波雷达(Radar)，覆盖360度视场。所收集的数据是在白天、夜间和下雨时在高速公路、城市和郊区捕获的，并使用具有跨帧一致标识符的3D边界框进行标注。此外，本文训练了用于三维目标检测的单模态和多模态基线模型。

介绍

在过去的几年里，大量用于自动驾驶(AD)中的三维目标检测的数据集已经发布[2,3,5,8,17,18]。大多数数据集都有一个共同的特性，即包含来自不同模态的传感器数据，包括摄像机和激光雷达。通过这种方式，360度的视野(FOV)可以覆盖到Ego交通工具的周围。三维目标检测数据集可以通过ego车辆周围的覆盖范围的维度和传感器冗余度分成不同的组。虽然许多数据集公开可用，但它们要么不提供传感器冗余（即至少两种传感器模态的覆盖），这对稳健的自动驾驶至关重要，要么只依赖于相机和激光雷达传感器，这些传感器在恶劣天气下并不完全适用（根据传感器覆盖和冗余分组的几种流行数据集的属性见表1）。这一问题可以通过使用毫米波雷达来解决，毫米波雷达是一种成本效益高的传感器，不受不利环境条件（例如雨或雾）的影响。此外，标注范围不超过80米（除了少数例外），这对于训练远程感知系统来说是不够的。标注范围的局限性可以解释为自动驾驶数据集主要集中在城市环境中，而确保检测远处目标的能力对高速公路辅助（assistant）至关重要，因此对自动驾驶来说也是如此。

为了克服上述限制，本文发布了一个多模态数据集，用于具有远程感知的鲁棒自动驾驶。收集的数据集包括176个场景，具有同步和校准的激光雷达、摄像机和毫米波雷达传感器，覆盖360度视场。这些数据是在不同的地理区域（高速公路、城市和郊区）以及不同的时间和天气条件（白天、夜晚、下雨）中捕获的。本文提供了3d bounding box，具有跨帧的一致标识符，这使得本文的数据集能够用于三维目标检测和多目标跟踪任务。建议的数据集是在CC BY-NC-SA 4.0 license下发布的，允许研究社区将收集的数据用于非商业研究目的。

主要贡献

本文发布了一个多模态自动驾驶数据集，具有冗余传感器覆盖，包括毫米波雷达和360°视场。

与现有的数据集相比，本文的数据集有一个扩展的标注范围，允许开发远程感知系统。

本文培训了单模态和多模态基线模型，并对其进行了基准测试。

数据集详解：Aimotive多模态数据集

本文的多模态数据集包括15s的长场景，具有同步和校准的传感器。该数据集使用冗余传感器布局提供360°视场，其中至少两个不同的传感器同时记录EGO车辆周围的区域。由于标注的3d bounding box具有跨帧一致的标识符，该数据集可以用于三维目标检测和多目标跟踪任务。另外，相当多的标注（约25%）位于关于自我载体的远距离区域(≥75m)。由于这种特性和冗余传感器的设置，本文的数据集可以促进多模态传感器融合和鲁棒的远程感知系统的研究。

1. 数据收集

这些数据是在两大洲的三个国家收集的，有四辆车，以提供一个多样化的数据集。录像发生在美国加州；奥地利；匈牙利，使用三辆丰田凯美瑞和一辆丰田普锐斯。录像的记录阶段跨越一年，以收集不同季节和天气条件的数据。因此，本文的数据集由一组不同的位置（高速公路、郊区、城市）、时间（白天、夜晚）和天气条件（太阳、云、雨、眩光）组成。数据收集方法满足了机构审查委员会批准的要求。

2. 传感器设置

多模态最新Benchmark！aiMotive DataSet：远距离感知数据集_第2张图片

传感器布局。这些数据是用一个屋顶安装（roof-mountend）、旋转的64波束激光雷达、四个摄像机和两个远程毫米波雷达记录的，提供了360度的传感器冗余覆盖。定位是基于高精度GNSS+INS传感器。更多细节可以在图1和Tab2找到。

同步。所有记录的传感器数据都是同步的。激光雷达和毫米波雷达共享相同的时间戳来源。本文的相机使用滚动快门方法捕捉图像，这种方法快速扫描环境，而不是在单个时刻捕捉整个场景的快照。由于所使用的相机逐行捕捉场景，所以相机时间戳大约是捕捉中间行时的曝光时间。

坐标系。该数据集使用五个坐标系，即全球坐标系、人体坐标系、雷达坐标系、摄像机坐标系和图像坐标系。本文使用ECEF[24]作为全局坐标系，并为每个标注帧提供了一个6-DOF的ego车辆姿态。用于定义带标注对象的参考坐标系称为车身坐标系，该坐标系附着在车身上。原点是在标称车身高度和零速度下，车辆后轴中心下的投影地平面点。雷达坐标系使用与人体坐标系相同的轴（X轴正向前进，Y轴正向左边，Z轴正向向上）。将激光雷达点云转换到人体坐标系作为预处理步骤。摄像机坐标系的原点是摄像机的视点，坐标轴的定义与OpenCV[9]摄像机坐标系相同（x轴向右，y轴向下，z轴向前）。摄像机到物体和毫米波雷达到物体的变换可以使用摄像机和毫米波雷达外参(extrinsic)矩阵来执行。本文利用OpenCV的图像坐标系来绘制标注，使用内参矩阵从摄像机坐标投影到图像坐标。

3. Ground Truth 生成

本文使用了两种方法来生成ground truth标签：一种专有的用于训练数据生成的自动标注方法和用于创建验证数据的手动标注方法。由于自动批注可能容易出错，一个额外的手工质量检查后处理已经被执行，以过滤标签错误。即使我们的目标是使用人工验证来最小化标签噪声，但数据集中仍可能包含一些标签噪声。通过这种方式，本文选择了标记足够准确的记录，并丢弃了大多数错误的标注。

在验证集的情况下，本文雇佣了手动标注者在记录的传感器数据上标记对象。在标注阶段，人类标注者使用激光雷达和相机传感器数据来拟合出现在相机图像上的任何感兴趣的目标上的长方体。对于长方体大小，标注者使用默认尺寸。如果点云或图像上的默认尺寸与给定目标的大小不匹配，标注者根据自己的决定调整给定长方体的不匹配尺寸。手工劳动还确保了一个长方体轴与目标方向对齐，精度在5度以内。

将14个类的手动或自动标注的对象表示为具有一些附加物理属性的3D长方体。每个标记的边界框都有一个3D中心点、3D范围（沿水平x轴的长度、沿垂直y轴的宽度、沿z轴的高度）、方向（表示为四元数）、相对速度和唯一的轨迹ID。此外，本文利用FCOS[26]检测器提供了2d bounding box。使用匈牙利算法[11]关联2D-3D标注，以允许利用2D-3D一致性或半标记[16]。

多模态最新Benchmark！aiMotive DataSet：远距离感知数据集_第3张图片

4. 数据集分析

该数据集包括26 583个带有多种模态传感器数据的标注帧，分为21个402训练帧和5个181验证帧（80/20 训练集/验证集分割）。这些场景是在不同的天气和环境条件下记录的。参见Tab3用于数据分发。

多模态最新Benchmark！aiMotive DataSet：远距离感知数据集_第4张图片

该数据集包含超过425k个对象，这些对象被组织成14个类别。图3中显示了类别分布。标注对象的距离分布在图4中被可视化。约24%的长方体在75米以上，Argoverse2约有14%，Waymo，nuScenes，一度不足1%。这一特性使得Longrange感知系统能够借助本文的数据集进行训练。在图2和图5中查看有关对象大小和方向分布的其他统计信息。

实验

多模态最新Benchmark！aiMotive DataSet：远距离感知数据集_第5张图片

本文使用公开可用的模型在本文的数据集上训练了几个三维目标检测基线。为了利用位于较远区域的标注，本文将目标网格定义为纵向[-204.8,204.8]m和横向[-25.6,25.6]m。本文将包含在数据集中的14个类别映射为四个类别（轿车、卡车/公共汽车、摩托车和行人），并在鸟瞰(BEV)空间以类别不可知的方式使用全点和11点插值平均精度(AP)度量[4]评估模型的性能。匈牙利方法[11]用于将ground truth和预测与0.3 IOU阈值联系起来。本文选择了一个小的IOU值作为关联阈值来处理BEV中在远距离区域特别频繁的位移误差。此外，利用平均方位相似度(AOS)[6]度量来评价模型在方位预测方面的性能。

1. 基线模型

本文的基线模型基于VoxelNet[30]、BevDepth[12]和BevFusion[14]用于激光雷达、相机和多模态模型。由于BevFusion不使用毫米波雷达传感器，本文为Lidar-Radar Fusion设计了一个简单的解决方案。也就是说，本文把毫米波雷达点云看作一个规则的激光雷达点云。经过点云合并步骤后，Voxelnet可以像处理常规激光雷达点云一样处理来自不同模态的数据。

Voxelnet具有直接在点云上操作的能力，由三个主要部分组成。体素特征编码器(VFE)负责在单个体素级别对原始点云进行编码。Voxelnet利用堆叠的VFE层，其输出由中间卷积神经网络(CNN)进一步处理，以聚集体素特征。执行3D目标检测的最后一个组件是区域建议网络[22]。

BevDepth是一个只需摄像头的三维目标检测网络，提供可靠的深度估计。作者的主要观察是，最近使用像素深度估计的仅摄像机的三维目标检测方案由于深度估计不足而产生次优结果。因此，显式深度监督编码的内参和外参被利用。此外，利用激光雷达点云的稀疏深度数据引入了深度校正子网络，为深度估计网络提供监督。

BEVFusion的主要贡献是利用BEV空间作为摄像机和激光雷达传感器融合的统一表示。BevFusion提出的图像主干显式地预测每个图像像素的离散深度分布，类似于BevDepth（没有深度校正子网络）。然后，对三维特征点云应用BEV池化算子，然后沿Z轴对其进行展平，得到BEV中的特征映射。激光雷达产生的点云的处理方式与Voxelnet的处理方式相同，两个BEV特征图由CNN融合。最后，将检测头附加到融合子网络的输出上。

2. 实施细节

基线模型的激光雷达组件使用HardSimpleVFE[28]作为体素特征编码器，使用SparseEncoder[28]作为中间编码器CNN。图像组件采用Lift-Splat-Shot[19]作为图像编码器，具有Resnet-50主干，随后是用于利用多尺度特征的特征金字塔网络[13]。一个额外的深度校正网络也是图像流的一部分，灵感来自BEVDepth。在多模态模型的情况下，不同模态的特征使用由卷积和挤压激励组成的简单融合子网络来融合[7]。最后，Centerpoint[29]头负责从单峰和多峰情况下的BEV特征中检测对象。

由于本文的目标不是在这项工作中开发最先进的模型，而是为了促进多模态目标探测研究，本文使用了BEVDEPTH提供的超参数，而没有进行任何繁重的参数调整。本文调整了网格分辨率，以支持远程检测，并使用批量大小4，训练模型，使用BEV特征空间中的翻转、旋转和缩放，以6.25e-5的学习速率进行16K迭代（3个 epochs）。本文使用了一个NVIDIA A100 TensorCore GPU进行神经网络训练。这些模型是用MMDetection3D实现的。

3. 实验结果

多模态最新Benchmark！aiMotive DataSet：远距离感知数据集_第6张图片

在Tab 4中描述了基线模型在不同度量上的性能比较。由于文献中有几个例子[14，20]说明了仅用激光雷达的单峰解优于仅用摄像机的模型，所以本文没有训练仅用摄像机的基线。正如表中所描述的，在非不利的天气和时间下，每个多模态模型在公路和城市环境中都超过了LIDAR-ONLY基线。在密集的城市环境中，附加的传感器信号显著提高了检测性能。然而，单峰基线在大雨中表现最好，人们会认为毫米波雷达信号应该有助于提高性能。这一现象表明，更复杂的毫米波雷达融合技术可能有利于增强多模态模型。

摄像机在方位预测方面起着至关重要的作用。没有RGB图像的模型难以始终如一地保持方向，尤其是在大型车辆的情况下。这种闪烁效应（ﬂickering effect）在使用相机传感器的模型中不太明显。使用所有模态的模型在AOS指标上表现最好。

令人惊讶的是，使用激光雷达+相机模态的模型在夜间和城市环境中的表现远远超过了所有其他模型。本文研究了学习曲线，发现增加训练步数有助于进一步提高性能。为了验证本文的假设，本文对本文的模型进行了5个额外的时间点的训练。不幸的是，使用相机传感器的模型在第三个epoch后变得不稳定，导致深度损失爆炸。Tab 5描述了使用11点插值AP度量的更长训练过程的结果。在所有环境中都可以看到坚实的改进，尤其是在雨天验证集（激光雷达和激光雷达+雷达模型分别为+10.8/+6.2AP)上。这可以用训练越长，探测热图越清晰的事实来解释。在第一组基线模型的情况下，模糊的热图导致AP指标较低。在大雨的情况下，由于雨滴的激光雷达反射，热图上的模糊效果在EGO汽车周围非常明显。

为了验证基线模型的远距离感知能力，本文对长期训练的模型进行了远距离目标检测的基准测试。在距离EGO汽车不到75米的地方，探测和ground truth被过滤掉。结果总结在Tab 6中（定性例子见图8）。两种模型在公路环境下的性能相似，没有显著差异。然而，在所有其他环境中，带有额外毫米波雷达信号的模型明显优于仅使用激光雷达的基线。事实上，如图7所示，毫米波雷达传感器即使在恶劣天气下也提供用于感知远处区域中的对象的可靠且准确的信号，可以被用于提高3D目标检测器的性能。在密集的城市环境中也可以观察到类似的效果，在这种环境中，毫米波雷达信号被多模态基线利用，从而导致远距离感知性能的显著提高(+5.5/+4.7全点/11点插值AP）。

训练结果表明，该数据集可以作为多模态远距离感知神经网络训练的基础。诸如测试时间延长或模型集成等先进的评估技术可以导致进一步的改进。但是，在评估方法的过程中，没有一个被应用。Tab 5表明需要进一步改进传感器融合方法以充分利用每一种模态，本文的朴素方法提供了一个次优解。尽管如此，本文希望研究界会发现本文的数据集是有用的，可以在本文基线的基础上进行构建，并显著提高其性能。

多模态最新Benchmark！aiMotive DataSet：远距离感知数据集_第7张图片

表6，远区(>75m)基线模型的比较。第一组：全点AP度量，第二组：11点插值AP度量，第三组：Val-set上平均的AOS度量。

多模态最新Benchmark！aiMotive DataSet：远距离感知数据集_第8张图片

多模态最新Benchmark！aiMotive DataSet：远距离感知数据集_第9张图片

图8。定性结果：激光雷达+毫米波雷达基线模型的检测。上排：激光雷达点云检测。中排：毫米波雷达目标检测，下排（从左到右）：左、前、右、后摄像头检测。

总结

本文提出了一个多模态数据集用于鲁棒的远程感知自动驾驶。本文在两大洲的三个国家记录的不同数据集包括来自激光雷达、毫米波雷达和摄像机的传感器数据，提供冗余的360度传感器覆盖。该数据集包含了大量远距离区域的标注对象，使得多模态远程感知神经网络的开发成为可能。此外，本文开发了几个单模态和多模态基线模型，并比较了它们在所提出的数据集上基于不同标准的性能。本文的数据集充分利用了记录的传感器模态的优势，可以用于训练、多模态、远程感知神经网络。在未来，本文的目标是扩展本文收集的数据集与额外的环境和天气条件。此外，本文还将对多模态神经网络的传感器融合进行更深入的实验。本文期望通过发布本文的数据集来促进多模态传感器融合和鲁棒的远程感知系统的研究。

参考

[1] Matuszka T, Barton I, Butykai Á, et al. aiMotive Dataset: A Multimodal Dataset for Robust Autonomous Driving with Long-Range Perception[J]. arXiv preprint arXiv:2211.09445, 2022.

往期回顾

多模态3D目标检测发展路线方法汇总！(决策级/特征级/点/体素融合)

【自动驾驶之心】全栈技术交流群

自动驾驶之心是首个自动驾驶开发者社区，聚焦目标检测、语义分割、全景分割、实例分割、关键点检测、车道线、目标跟踪、3D目标检测、BEV感知、多传感器融合、SLAM、光流估计、深度估计、轨迹预测、高精地图、规划控制、模型部署落地、自动驾驶仿真测试、硬件配置、AI求职交流等方向；

添加汽车人助理微信邀请入群

备注：学校/公司+方向+昵称

自动驾驶之心【知识星球】

想要了解更多自动驾驶感知（分类、检测、分割、关键点、车道线、3D目标检测、多传感器融合、目标跟踪、光流估计、轨迹预测）、自动驾驶定位建图（SLAM、高精地图）、自动驾驶规划控制、领域技术方案、AI模型部署落地实战、行业动态、岗位发布，欢迎扫描下方二维码，加入自动驾驶之心知识星球（三天内无条件退款），日常分享论文+代码，这里汇聚行业和学术界大佬，前沿技术方向尽在掌握中，期待交流！

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
走向以教育叙事为载体的教育叙事研究 666小飞鱼
今天我读了吴松超老师的《给教师的68条建写作建议》中的第23条《如何通过教育叙事走向研究》，吴老师在文中与我们分享了一个德育案例，这是一个反面的案例，意在告知我们在处理问题时，不能就考虑的点太窄，思考要全面。走向教育叙事研究，教师要有敏锐的“感知力”，这个感知力来自于背后专业知识的支撑，思维能力以及广阔的视野和见识等。所以对于同一件事处理方法不同，这个就是教师背后“敏锐力”的不同造成的，也就是说是
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
钢筋长度超限检测检数据集VOC+YOLO格式215张1类别 futureflsl 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：215标注数量(xml文件个数)：215标注数量(txt文件个数)：215标注类别数：1标注类别名称:["iron"]每个类别标注的框数：iron框数=215总框数：215使用标注工具：labelImg标注规则：对类别进
怎么做淘客赚钱(2022最新免费淘客盈利的方法) 高省_飞智666600
很多人都不知道什么是淘宝客，今天小编为大家解答一下吧。淘宝客，现在简称淘客，是时下比较流行的一个词语，特质为淘宝店推广商品获取提成的人，这些人没有自己的产品，只是在淘宝里面选择适合自己的产品，在自己比较熟悉的领域推广，把产品卖出去之后，会从淘宝店家那里获得百分之五到百分之五十左右的佣金。淘宝客付出的是什么呢？时间。你需要花时间去选适合自己推广的产品，需要花时间去选自己的推广方法，如果你打算自己做个
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
《大兴安岭猎人传说》今年最好看的东北鬼怪故事，很优秀一部电影
《大兴安岭猎人传说》是最新上映于愚人节的网剧，别看是网剧却远超出我的个人预料。该片由民俗故事改编，这点就很吸引人，因为民俗故事口口相传，比那些编造而成的鬼故事更具有了真实性，网大做的电影还不错哦，如果可以我打四星好评。大兴安岭的故事我们经常听老人提起，那里有原始大森林，物产丰富，更流传着精灵怪物的传说。什么红黄白柳灰，出马仙、人参娃娃的故事层出不穷，以大兴安岭为背景的故事真不少。可很多鬼片看到最后
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
最超值的Mac——Mac mini 初心么么哒
你知道最超值的Mac是什么吗？自2005年以来，Macmini一直是Apple台式机产品线中的主要产品。最初推出是为了让对Mac好奇的Mac进入Apple生态系统的一种简单方式，现在新的AppleSiliconMacmini可能是任何寻找新Mac的人的最有吸引力的购买。什么是AppleSiliconMacmini？M1Macmini是Apple最小的台式电脑，同时也是最快的台式电脑之一。最新型号由
大雄的新恐龙：养育生命，的确不易沧浪先生
哆啦A梦这个动画片，我小时候没有看过，长大了之后似乎对这种充满童真童趣的动画片也没有太多的喜爱，所以结果很明显，我并没有看过哆啦A梦这个动画片。但是近年来大屏幕的兴起，让各家影视剧制作者发现了电影化的好处，没错，电影不仅影响力更大，钱赚得也多。《哆啦A梦·大雄的新恐龙》是最新的一部大屏幕电影，大雄和柯南一样，都永远长不大，而且他和他的小伙伴日复一日、年复一年地和机器猫哆啦A梦在一起玩耍，永远的神奇
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
python tif转png Python与遥感 python 开发语言
importosfromosgeoimportgdalimportnumpyasnpfromPILimportImage#提取432三波段fromspectralimport*#输入文件夹路径defget_img(dataset_img):width=dataset_img.RasterXSize#获取行列数height=dataset_img.RasterYSizebands=dataset_i
数幸福D10 3c807316efec
王多妈妈幸福能力提升计划依靠皇上托举皇上做一个五半三平的小女人一：感知到的幸福和快乐1：点赞皇上①下班前皇上问我晚上吃饭准备怎么弄，我们买点菜回家做饭吧皇上问我想吃什么，我说多可以，皇上很用心的准备晚饭，一回到家皇上先回家做饭，我说后备箱还有我的行李，皇上说等一下我再下来拿好吗？语气特别好，眼神多是商量的，皇上现在总是有意识的考虑我的感受②吃完饭我们准备一起接女儿放学，皇上说碗他洗，我想着一起收拾
请用幸福影响他人，请不要看不惯别人吕氏春秋驴驴
这个世间包罗万象，这个世间丰富多彩，这个世间色彩缤纷。。。。。如果只一种模式，一种色彩，一种花朵，一样容颜，一种人，一个思想。。。。。多么无趣啊！不管怎样的思想和生活方式只要能够安慰自己的心灵，能克服自己的恐惧感受祥和，充满生命的活力。。。。就是正确的活法。读了金刚经你会感觉博大精深空灵之美，看见基督徒你会感知被爱，易经道德经你会定位人生不纠结，读了鲁米你会跟宇宙自然神灵做朋友，人生无意义会让你珍
Python多线程实现大规模数据集高效转移 sand&wich 网络 python 服务器
背景在处理大规模数据集时，通常需要在不同存储设备、不同服务器或文件夹之间高效地传输数据。如果采用单线程传输方式，当数据量非常大时，整个过程会非常耗时。因此，通过多线程并行处理可以大幅提升数据传输效率。本文将分享一个基于Python多线程实现的高效数据传输工具，通过遍历源文件夹中的所有文件，将它们移动到目标文件夹。工具和库这个数据集转移工具主要依赖于以下Python标准库：os：用于文件系统操作，如
Python实现下载当前年份的谷歌影像 sand&wich python 开发语言
在GIS项目和地图应用中，获取最新的地理影像数据是非常重要的。本文将介绍如何使用Python代码从Google地图自动下载当前年份的影像数据，并将其保存为高分辨率的TIFF格式文件。这个过程涉及地理坐标转换、多线程下载和图像处理。关键功能该脚本的核心功能包括：坐标转换：支持WGS-84与WebMercator投影之间转换，以及处理中国GCJ-02偏移。自动化下载：多线程下载地图瓦片，提高效率。图像
vue 创建项目报错：command failed: npm install --loglevel error 那鱼、会飞 vue.js vue-cli3
这个问题其实很好解决，只是很多种情况，逐一排除即可。稳下心来~vuecli3创建项目我的node版本是node14.15.0，（永远不要尝试最新版本）node各种版本下载地址：以往的版本|Node.js(nodejs.org)vue/[email protected]@vue/[email protected]（注意vue/cli2和vue/cli3的下载命名有所改变，2是-形式，3是/形式）其实报错
COCO 格式的数据集转化为 YOLO 格式的数据集 QYQY77 YOLO python
"""--json_path输入的json文件路径--save_path保存的文件夹名字，默认为当前目录下的labels。"""importosimportjsonfromtqdmimporttqdmimportargparseparser=argparse.ArgumentParser()parser.add_argument('--json_path',default='./instances
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
阿里云服务器4核8G配置购买及价格类文章汇总（10篇）阿里云最新优惠和活动汇总
阿里云服务器4核8G配置如何购买？价格是多少？4核8G配置的阿里云服务器可以通过云服务器产品页购买也可以通过阿里云活动去下单购买，一般通过活动购买的用户比较多，但是不同实例规格的阿里云服务器价格不一样，带宽不同价格也不一样，本文为大家汇总了10篇关于阿里云服务器4核8G配置购买教程文章和价格类文章，分为购买类文章和价格类文章，以供大家参考如何购买阿里云服务器4核8G配置和最新优惠价格是多少。阿里云
绝招曝光！3小时高效利用ChatGPT写出精彩论文 kkai人工智能 chatgpt 人工智能 ai 学习媒体
在这份指南中，我将深入解析如何利用ChatGPT4.0的高级功能，指导整个学术研究和写作过程。从初步探索研究主题，到撰写结构严谨的学术论文，我将一步步展示如何在每个环节中有效运用ChatGPT。如果您还未使用PLUS版本，可以参考相关教程。**初步探索与主题的确定**起初，我处于庞大的知识领域中，寻找一个可深入研究的领域。ChatGPT如同灯塔，通过深入分析最新研究趋势和领域热点，帮助我在广阔的学
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl