Re-赟

论文阅读 Self-Mimic Learning for Small-scale Pedestrian Detection

Self-Mimic Learning for Small-scale Pedestrian Detection

ABSTRACT

检测小尺度行人是行人检测中最具挑战性的问题之一。由于缺乏视觉细节，小尺度行人的 representations 往往难以与背景杂乱物区分开。本文深入分析了小尺度行人检测问题，揭示了小尺度行人 representations 较弱是分类器漏检的主要原因。为解决这一问题，我们提出了一种新颖的自我模仿学习（Self-Mimic Learning，简称SML）方法，以提高小尺度行人的检测性能。我们通过模仿大尺度行人的丰富 representations 来增强小尺度行人的 representations 。具体而言，我们设计了一种 mimic loss，强制小尺度行人的特征 representations 接近大尺度行人的特征representations。所提出的SML是一个通用组件，可以轻松集成到单阶段和两阶段检测器中，无需额外的网络层，并且在推断过程中不会增加额外的计算成本。在CityPersons和Caltech数据集上的大量实验证明，使用模仿损失训练的检测器对小尺度行人检测非常有效，并在CityPersons和Caltech数据集上取得了最先进的结果。

1 INTRODUCTION

行人检测在许多视觉应用中至关重要，如自动驾驶、机器人技术和视频监控。近年来，卷积神经网络（CNN）和物体检测方面的进展显著提高了行人检测的性能。当前的检测器在大尺度行人上表现良好，但在小尺度行人上的准确率有限，这是由于低分辨率图像和降采样操作导致的。事实上，许多行人检测场景中经常出现小尺度行人。例如，在Caltech数据集中，69%的行人高度在30-80像素之间，15%的行人高度低于30像素。因此，对于各种应用场景来说，检测远距离的小尺度行人至关重要。例如，自动驾驶汽车前方远处的行人应该能够被及时检测到，以便控制系统能够可靠而平稳地避免任何碰撞的可能性。

最近，一些研究工作试图通过利用大尺度对象的丰富representations 来解决小尺度目标检测问题。Li等人提出了感知生成对抗网络（Perceptual GAN），用于生成小尺度目标的超分辨率representations。尽管这种方法增强了小尺度目标的representations能力，但感知GAN中使用的生成器在推理过程中引入了相对较高的计算开销。为了减少不同尺度对象之间的特征差异，Kim等人提出了一个Scale Aware Network（SAN），将来自不同尺度的卷积特征映射到尺度不变子空间。然而，SAN仅仅对小对象的图像块进行上采样，这可能导致图像块模糊。在本文中，我们旨在设计一种简单有效的方法，以在推理过程中最小化计算开销的情况下增强小尺度行人的特征representations。

受到模型acceleration 和compression 中使用的模仿技术的启发，我们利用一种模仿方法来增强小尺度行人的representations。目标检测中的模仿学习的本质是，一个小模型可以通过模仿来自大模型的特征来学习更好的representations。基于这一观点，我们提出了一种自我模仿学习方法，它将模仿技术扩展到一个单一模型中，以在大尺度行人的帮助下学习小尺度行人的超分辨率representations，从而实现了模型的自我模仿学习。具体而言，我们通过一种模仿损失训练深度卷积神经网络（CNN），该损失旨在强制小尺度行人的特征分布近似模仿来自相同网络结构的大尺度行人的特征分布。

我们基于实例级别的特征实现了我们的模仿方法。如图1所示，大尺度行人的RoI特征（由RoI Align输出）通常保留比小尺度行人更多的有用信息。因此，我们将它们用作参考，帮助小尺度行人近似学习大尺度行人的特征分布。通过强制小尺度行人的特征接近大尺度行人的特征，可以为小尺度行人检测带来两方面好处。首先，小尺度行人的遗漏细节在特征空间中得到了补偿，从而增强了小尺度行人的representations。其次，行人特征的内部类间差异减小，使分类器更容易将小尺度行人与背景区分开来。

我们所提出的SML是一个通用组件，可以轻松集成到具有任何骨干网络的一阶段和二阶段检测器中。它仅通过模仿损失将大尺度行人的监督引入小尺度行人，而无需添加任何网络层。因此，在推理过程中不会产生任何额外的计算成本。为了验证SML的有效性，我们在Caltech和CityPersons行人检测数据集上使用ResNet-18和ResNet-50进行了全面的实验。SML有效地提高了小尺度行人的性能，并实现了最先进的检测性能。

2 RELATED WORK

略过

3 ANALYSIS OF SMALL-SCALE PEDESTRIAN DETECTION

Dataset 在现实世界的场景中，小尺度行人经常出现。我们对CityPersons数据集进行了分析，该数据集包含5,000张图像，包含35,000个行人和13,000个被忽略的区域注释。Reasonable subset 是用于评估行人检测器综合性能的常见设置，其中行人的身高要大于50像素，不遮挡超过35%。其中，小尺度行人仍然占很大比例。例如，身高在[50, 75]之间的行人的比例为24.3%，而原始图像的分辨率为1,024×2,048像素。

Missed Detection。我们以两阶段检测器为例，分析小尺度行人的误分类问题。在两阶段检测器中，例如Faster R-CNN ，检测一个对象有两个阶段。第一阶段是生成proposals 并使用它们提取RoI特征。在第二阶段，这些RoI特征被输入到头网络进行分类和边界框回归。为了覆盖不同尺度的对象，区域建议网络（RPN）在第一阶段生成大量proposals。然而，即使有大量proposals，检测器在第二阶段仍然倾向于错过小尺度行人。

为了深入研究小尺度行人的漏检问题，我们计算了两种类型的召回率，Pre-Recall和Post-Recall，用于不同尺度的行人。我们将Pre-Recall定义为与至少一个proposals 相关联的 groundtruth示例的百分比，将Post-Recall定义为与至少一个被正确分类的proposals 相关联的groundtruth示例的百分比（即分类得分≥0.5）。我们在本次实验中使用了基于Faster R-CNN的基线检测器（在第4.1节中描述），其中从RPN中生成了1,000个proposals 。如图2(a)所示，不同尺度的行人的Pre-Recalls接近，达到了95%以上的高值。然而，对于小尺度行人，基线的召回率从97.6%（Pre-Recall）下降到了83.3%（Post-Recall），而对于大尺度行人，从Pre-Recall到Post-Recall的下降仅为3.6%和2.9%。从图2(b)中还可以看出，在H小于100像素时，Pre-Recall和Post-Recall之间存在很大差距。图2的结果表明，尽管RPN检测到了大多数小尺度行人，但由于特征representations 较弱，许多小尺度行人在第二阶段没有被正确分类。

为了更好地理解小尺度行人的漏检问题，图3中可视化了一些漏检示例。我们观察到小尺度行人被RPN生成的准确proposals 所定位。然而，它们被头网络视为具有低于0.5的分类得分的背景区域。本节的分析表明，误分类主要导致小尺度行人的性能不佳。

4 SELF-MIMIC LEARNING

在本节中，我们首先概述基于两阶段检测器的方法，然后介绍模仿损失函数。随后，我们将介绍SML的实现方案。此外，我们还在补充材料中介绍了如何将我们的方法扩展到一阶段检测器。

4.1 Overview

Baseline Detector 在本文中，我们将Faster R-CNN 作为基准检测器，并使用ResNet-18或ResNet-50作为骨干网络，配合特征金字塔网络（Feature Pyramid Network，FPN）和可变形卷积（Deformable Convolution）来实现它。

Self-Mimic Learning 在先前的研究中，mimicking 技术主要用于模型加速和压缩。我们将模仿思想扩展到了来自同一神经网络数据样本的特征空间，使小尺度行人的特征分布接近于大尺度行人。

根据第3节的分析，大多数小尺度行人的区域可以通过RPN生成的 proposals 很好地定位。考虑到大尺度行人通常具有更丰富的特征representations，强制小尺度行人的特征分布模仿RoI特征空间中的大尺度行人是一个合理的想法，从而增强了小尺度行人的representations，概念上以更多的视觉细节编码，就像具有更高分辨率的行人一样。在SML中，身高在(0, H_S ] 像素范围内的行人被定义为小尺度行人，而身高在 (H_S , H_L] 像素范围内的行人被视为大尺度行人。我们不考虑超大尺度行人，其身高高于H_L像素，因为超大尺度和小尺度行人之间的representations 之间存在很大差距。

图4(a)展示了我们方法的框架。首先，将输入图像传入特征金字塔网络（FPN）以提取多尺度特征图。然后，RPN建立在这些特征图之上，生成具有不同大小的proposals。RoI Align操作将proposals和特征图作为输入，并输出维度为7×7×256的RoI特征。在这些RoI特征中，小尺度行人的特征模仿大尺度行人的特征。通过优化模仿损失（在第4.2节中定义），不仅小尺度行人从大尺度行人那里学到了超分辨率representations，而且类内方差也得到了减少。随后，具有更丰富和一致representations 的小尺度行人的RoI特征被送入头网络，以便进行更容易的分类和回归。

4.2 Mimic Loss

对于检测任务，特征图对于确定分类和定位的准确性都至关重要。我们在小尺度和大尺度行人的RoI特征上实现了所提出的模仿方法。SML的总损失函数定义如下：

在上述损失函数中，L^R_cls和L^R_box 分别是RPN的分类损失和边界框回归损失，L^H_cls和L^H_box 分别是头网络的分类损失和边界框回归损失。对于分类损失L^R_cls和L^H_cls，我们使用两个类别（行人和背景）的交叉熵损失。对于回归损失L^R_box和 L^H_box，我们使用平滑L1损失函数。L_m表示由α加权的模仿损失。

我们用F_L ∈ R^d表示大尺度行人（H_S < height ≤ H_L）的RoI特征，用F_S ∈ R^d表示小尺度行人（0 < height ≤ H_S）的RoI特征，d = 7 × 7 × 256是特征的维度。请注意，这里行人指的是与训练图像中至少一个 ground-truth行人示例具有IoU ≥ 0.5的proposal。在训练数据中，我们用L = {F¹_L, …, F^N_L}表示N个大尺度行人的RoI特征，用S = {F¹_S, …, F^M_S}表示M个小尺度行人的RoI特征。

理想情况下，我们的目标是强制S中的特征模仿L中的特征，使S和L在特征空间中具有类似的概率分布，即p(F_S) ≈ p(F_L)。然而，鉴于有限的训练样本，直接优化高维分布是困难的。通常情况下，行人特征的分布是多模态的，因此我们选择通过将S中每个小尺度行人的特征推向L中大尺度行人的特征的local centroids之一来近似实现模仿学习目标。因此，我们将模仿损失L_m定义为：

对于每个小尺度行人特征F^j_S，Q_j ⊆ L是它在L中的模仿特征的集合。当Q_j ⊂ L时，Q_j可以被视为训练集中所有大尺度行人样本的一个子模态，而C_j是L中的 local centroid 。相反，当Q_j = L时，C_j成为L中大尺度行人的全局均值特征。图4(b)说明了公式2的思想。我们将在下一节介绍如何为每个F^j_S选择本地中心C_j。

4.3 Implementation

我们介绍了两种选择每个小尺度行人样本的 local centroid C_j 的实现方案，如下所示：

Offline self-mimic learning 在此方案中，我们首先在数据集上训练一个基准检测器作为 reference detector，并收集所有大尺度行人的RoI特征。然后，我们使用 k-means 将这些RoI特征聚类成K个簇。我们计算每个小尺度行人F^j_S的RoI特征与每个簇的中心之间的距离。我们选择最近的簇中心作为F^j_S的C_j。离线SML是一种直接的方法，用于划分大尺度行人的特征空间，并利用它们的中心来引导小尺度行人的特征学习。

Online self-mimic learning 在这种方案中，我们仅训练网络一次，而不训练额外的 reference detector。对于每个F^j_S，我们将本地中心C_j 定义为在获得F^j_S 的同一图像中的大尺度行人的RoI特征的平均值。在训练过程中，我们不会反向传播大尺度行人的模仿损失的梯度，因为大尺度行人仅用作小尺度行人学习超分辨率representations 的参考。根据行人检测数据集的统计信息，超过75%的图像同时包含小尺度和大尺度的行人示例。因此，在线SML是高效且易于实现模仿学习的端到端方式。

离线SML考虑了所有大尺度行人样本的视觉特征的不同模态。而在线SML更关注图像上下文的模态（例如，光照和天气条件）。我们将在第6.2节中讨论并比较这两种方案。

5 DISCUSSION

SML带来了两个好处：1) 增强了小尺度行人的 representations，2) 减少了类内方差，共同促进了对小尺度行人的性能改善以及对所有尺度的整体性能改善。

1) Representation enhancement for small-scale pedestrians:
模仿损失迫使小尺度行人的特征接近大尺度行人的 local feature centroids，从而在特征空间中在一定程度上补偿了它们缺失的细节。这有效增强了小尺度行人的特征representations，因此提高了对小尺度行人的检测性能。为了验证这一点，我们使用与基准检测器相同的proposals集，并计算SML的Post-Recall。如图2 (1)所示，SML在小尺度行人的Post-Recall上表现优于基准检测器，小尺度行人的Post-Recall有显著提高，提高了小尺度行人的分类性能。在图2 (b)中，SML在不同高度范围内一致提高了基准检测器的Post-Recall，最大增益出现在[50, 60]的高度区间，增益为6.6%。图6显示了基准检测器和SML之间的定性比较。我们可以看到，使用SML后，特征图中的小尺度行人区域更具有区分性，响应更高，这是由于SML的特征补偿效果。这些定量和定性分析验证了SML增强小尺度行人特征表示的效果。

2) Intra-class variance reduction
我们计算了小尺度和大尺度行人之间的特征距离。我们使用了两种类型的distance metrics：欧氏距离和余弦距离。欧氏距离定义为D_Euclidean = ∥F_L − F_S ∥₂，描述了两个实例之间RoI特征的空间距离。余弦距离计算为D_cosine = 1 − F_L ·F_S / (∥F_L ∥ ∥F_S ∥)，描述了两个实例之间RoI特征的方向相似度。如图5所示，SML显著减小了特征空间中小尺度和大尺度行人之间的欧氏距离和余弦距离。因此，减小了类内方差，使头网络更容易分类行人和背景。这也有助于大尺度行人的检测，如图2所示。

6 EXPERIMENTS

略过

7 CONCLUSION

In this paper, we analyze the low recall and limited detection performance of small-scale pedestrian and reveal that the main cause is misclassification of small instances. Based on the analysis, we propose a Self-Mimic Learning method to enhance the representations for small-scale pedestrians and reduce intra-class feature variance by mimicking rich representations from large-scale pedestrians. To achieve this, we enforce the feature representations of small-scale pedestrians to approach those of large-scale pedestrians by making the RoI features of small-scale pedestrians mimic the local average RoI features of large-scale pedestrians. Our approach is a general component which can be efficiently applied to both one-stage and two-stage detectors with any backbone network to improve the feature representations of small-scale pedestrians. Exhaustive experiments on both Caltech and CityPersons datasets validate the effectiveness and superiority of our approach.

剖析AI人工智能领域Whisper的性能指标 AI大模型应用实战人工智能 whisper xcode ai
剖析AI人工智能领域Whisper的性能指标关键词：Whisper、语音识别、性能指标、ASR、AI模型评估、基准测试、语音转文本摘要：本文深入剖析OpenAI开发的Whisper语音识别系统的性能指标。我们将从技术原理、架构设计、性能基准测试等多个维度，全面分析Whisper在不同场景下的表现。文章将详细讲解Whisper的评估方法、关键性能指标解读、实际应用中的性能表现，以及与其他主流语音识别
探索AI人工智能领域多智能体系统的技术原理 AI大模型应用之禅人工智能网络 ai
探索AI人工智能领域多智能体系统的技术原理关键词：AI人工智能、多智能体系统、技术原理、智能体交互、分布式计算摘要：本文深入探索了AI人工智能领域多智能体系统的技术原理。首先介绍了多智能体系统的背景，包括其目的、预期读者、文档结构和相关术语。接着阐述了多智能体系统的核心概念与联系，通过文本示意图和Mermaid流程图进行清晰展示。详细讲解了核心算法原理，结合Python源代码进行说明，并给出了相关
YOLOv11 改进策略 | GFPN：超越 BiFPN，跳层与跨尺度连接重塑特征金字塔
YOLOv11改进策略|GFPN：超越BiFPN，跳层与跨尺度连接重塑特征金字塔！介绍颈部网络（Neck）在目标检测任务中扮演着至关重要的角色，它负责有效地融合来自骨干网络（Backbone）不同层级的特征图，为检测头部（Head）提供包含丰富语义和空间信息的多尺度特征。FPN、PANet和BiFPN等结构是特征金字塔融合的代表。BiFPN作为其中的佼佼者，通过双向连接和加权融合取得了优异的性能。
结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
【LangChain编程：从入门到实践】LangChain与其他框架的比较 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】LangChain与其他框架的比较1.背景介绍1.1人工智能发展现状在当今时代，人工智能(AI)已经成为科技领域中最热门和最具革命性的话题之一。随着计算能力的不断提升和算法的持续优化,AI系统正在不断扩展其应用范围,包括自然语言处理、计算机视觉、决策系统等各个领域。1.2LangChain概述在这种背景下,LangChain作为一个新兴的AI框架应运而生。L
重塑知识的圣殿：人工智能时代的教育革命与人文守护田园Coder 人工智能科普人工智能科普
教育，承载着文明火种传递的千年使命，其核心始终围绕两个永恒命题：如何让知识更有效地被获取？如何让个体潜能更充分地绽放？在信息爆炸、技能迭代加速的当代，传统教育模式——标准化课程、统一进度、有限师资、资源不均——正面临前所未有的压力。人工智能（AI）的崛起，如同一股强大的变革洪流，正以前所未有的深度和广度渗透教育生态的各个环节。从量身定制的学习路径到永不疲倦的智能导师，从虚拟现实的沉浸课堂到洞察学情
踏入真实：具身智能与物理世界的认知交响
当大型语言模型在文本的海洋中纵横捭阖，生成式AI在数字画布上挥洒创意时，人工智能仍有一个根本性的疆域尚未完全征服——真实的三维物理世界。理解一个苹果，不能仅靠词向量坐标；学会行走，无法通过阅读说明书达成；在拥挤的街道导航，远非处理符号逻辑那般简单。智能的进化，自生命诞生之初，便与具身性（Embodiment）和环境交互（Interaction）密不可分。我们的认知、学习、乃至意识的雏形，都源于身体
超详细yolov8/11-segment实例分割全流程概述：配置环境、数据标注、训练、验证/预测、onnx部署(c++/python)详解
因为yolo的检测/分割/姿态/旋转/分类模型的环境配置、训练、推理预测等命令非常类似，这里不再详细叙述，主要参考**【YOLOv8/11-detect目标检测全流程教程】**，下面有相关链接，这里主要针对数据标注、格式转换、模型部署等不同细节部分；【YOLOv8/11-detect目标检测全流程教程】超详细yolo8/11-detect目标检测全流程概述：配置环境、数据标注、训练、验证/预测、o
创新引入HAttention模块：提升YOLOv8小目标检测精度【YOLOv8】程序员Gloria YOLOv8 YOLO 目标跟踪人工智能目标检测
文章目录创新引入HAttention模块：提升YOLOv8小目标检测精度【YOLOv8】引言1.YOLOv8模型概述1.1YOLOv8架构1.2YOLOv8小目标检测的挑战2.HAttention模块：原理与设计2.1HAttention模块的动机2.2HAttention模块的结构3.HAttention模块在YOLOv8中的应用3.1引入HAttention模块3.2YOLOv8架构修改3.3
使用 C++/OpenCV 和 MFCC 构建双重认证智能门禁系统
使用C++/OpenCV和MFCC构建双重认证智能门禁系统引言随着物联网和人工智能技术的发展，智能门禁系统在安防领域的应用越来越广泛。相比于传统的钥匙、门禁卡或密码，生物识别技术（如人脸识别、指纹识别、虹膜识别等）提供了更高的安全性与便利性。然而，单一的生物识别方式在某些场景下可能存在安全隐患。例如，人脸识别可能被高清照片或视频欺骗（称为“欺骗攻击”），在光照、姿态变化剧烈时识别率也可能下降。为了
YOLOv11深度解析：Ultralytics新一代目标检测架构创新与实战指南芯作者 D2:YOLO YOLO 神经网络计算机视觉
2024年Ultralytics重磅推出YOLOv11**：在精度与速度的平衡木上再进一步，参数减少22%，推理速度提升2%，多任务支持全面升级！一、YOLOv11核心创新：轻量化与注意力机制的完美融合YOLOv11并非颠覆性重构，而是通过模块级优化实现“少参数、高精度、快推理”的目标。其三大创新点如下：1.1C3k2模块：动态卷积核的灵活设计取代YOLOv8的C2f模块，C3k2通过参数c3k动
SurveyForge：AI自动撰写综述论文的革命性工具，助力科研效率跃升花生糖@ AIGC学习资料库人工智能 AI论文 AI助手
在学术研究领域，综述论文（SurveyPaper）的撰写是一项耗时且复杂的任务，通常需要数周甚至数月的文献调研与内容整合。如今，上海人工智能实验室、复旦大学与上海交通大学联合开源的SurveyForge，通过创新的AI技术，将这一过程压缩至10分钟内，且生成质量接近人工水平，成为科研人员的得力助手。项目简介SurveyForge是一款基于大语言模型（LLM）的自动综述论文生成工具，专为计算机科学领
面向高校的人工智能通识教育课程实验设计方案武汉唯众智创人工智能人工智能通识教育课程实验人工智能通识教育人工智能通识课程人工智能通识
一、前言2018年，教育部发布《高等学校人工智能创新行动计划》，明确提出“重视人工智能与计算机、控制、数学、统计学、物理学、生物学、心理学、社会学、法学等学科专业教育的交叉融合，探索‘人工智能+X’的人才培养模式”。过去，人工智能教育多集中于研究生阶段，本科生接触机会相对有限。2019年，教育部批准35所高校增设“人工智能”本科专业，这标志着人工智能正式纳入本科教育体系。如今，人工智能课程大多是计
SpringBoot电商项目实战：从零搭建百万级架构
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot电商项目实战：从
ConvNeXT：面向 2020 年代的卷积神经网络
摘要视觉识别的“咆哮二十年代”始于VisionTransformer（ViT）的引入，ViT很快取代了ConvNet，成为图像分类任务中的最新最强模型。然而，vanillaViT在应用于目标检测、语义分割等通用计算机视觉任务时面临困难。HierarchicalTransformer（如SwinTransformer）重新引入了若干ConvNet的先验知识，使Transformer成为实用的通用视觉
人工智能赋能气象气候：从数据智能到预测创新的融合之路慌ZHANG 人工智能人工智能
个人主页：慌ZHANG-CSDN博客期待您的关注一、引言：气象气候与AI的“天然耦合”气象与气候系统是典型的复杂、多尺度、强非线性的自然系统，其建模、分析与预测依赖庞大观测数据和高性能计算资源。传统方法以数值天气预报（NWP）与物理建模为核心，虽然取得重要成就，但也面临计算代价大、精度不足、长期预测偏差大等瓶颈。与此同时，人工智能（AI），尤其是以深度学习为代表的机器学习方法，近年来在图像识别、自
目标检测新纪元：DETR到Mamba实战解析加油吧zkf 图像处理 python 分类人工智能目标检测
【实战分享】目标检测的“后DEⱯ”时代：DETR/DINO/RT-DETR及新型骨干网络探索（含示例代码）目标检测从YOLO、FasterR-CNN到Transformer结构的DETR，再到DINO、RT-DETR，近两年出现了许多新趋势：更高效的端到端结构、更少的手工设计（比如不再需要NMS）、以及新型轻量化骨干网络（比如Mamba、ConvNeXt、ViT等）被引入检测任务中。作为从事目标检
python模拟内置函数reversed_Python内置函数reversed weixin_39594895
{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里技术人对外发布原创技术内容的最大平台；社区覆盖了云计算、大数据、人工智能、IoT、云原生、数据库、微服务、安全、开发与运维9大技术领域。","link1":
面向智能医疗的6G物联网和人工智能 Allen_Lyb 医疗高效编程研发物联网人工智能健康医疗
AbstractTheconvergenceof6Gwirelesstechnology,theInternetofThings(IoT),andArtificialIntelligence(AI)ispoisedtorevolutionizehealthcaredeliverybyenablingunprecedentedlevelsofconnectivity,intelligence,and
OpenCV中DPM（Deformable Part Model）目标检测类cv::dpm::DPMDetector 村北头的码农 OpenCV opencv 目标检测人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述OpenCV中用于基于可变形部件模型（DPM）的目标检测器，主要用于行人、人脸等目标的检测。它是一种传统的基于特征的目标检测方法，不依赖深度学习，而是使用HOG特征+部件模型来进行检测。示例代码#include#include#includeusingnamesp
深度学习前置知识全面解析：从机器学习到深度学习的进阶之路
一、引言：人工智能时代的核心技术在当今这个数据爆炸的时代，人工智能(AI)已经成为推动社会进步的核心技术之一。作为AI领域最重要的分支，深度学习(DeepLearning)在计算机视觉、自然语言处理、语音识别等领域取得了突破性进展，彻底改变了我们与机器交互的方式。本教案将从机器学习的基础知识出发，系统性地介绍深度学习的核心概念、数学基础、网络架构和训练方法，为读者构建完整的知识体系框架。无论你是刚
《YOLO11的ONNX推理部署：多语言多架构实践指南》空云风语 YOLO 人工智能深度学习目标跟踪人工智能计算机视觉 YOLO
引言：YOLO11与ONNX的相遇在计算机视觉的广袤星空中，目标检测始终是一颗耀眼的明星，其在自动驾驶、智能安防、工业检测、医疗影像分析等诸多领域都有着举足轻重的应用。想象一下，自动驾驶汽车需要实时准确地检测出道路上的车辆、行人、交通标志；智能安防系统要快速识别出监控画面中的异常行为和可疑人员；工业生产线上，需要精准检测产品的缺陷；医疗影像分析中，辅助医生检测病变区域。这些场景都对目标检测技术的准
AI 加持下的智能家居行业：变革、挑战与机遇低代码老李人工智能智能家居
在当今科技迅猛发展的浪潮中，人工智能（AI）已深深融入智能家居领域，成为推动其蓬勃发展的关键力量，为人们的生活带来了诸多便利和创新体验，同时也面临着一系列亟待解决的问题。一、AI驱动的智能家居功能升级（1）智能语音交互与控制智能语音助手作为智能家居的核心交互方式，借助自然语言处理（NLP）技术，让用户仅通过简单的语音指令，就能轻松操控家中各类智能设备，如精准控制灯光的开关与亮度调节、窗帘的开合、电
逻辑结构学派一（五个基础理论）刘海东刘海东人工智能
逻辑结构学派一（五个基础理论）作者：刘海东，中国广东技术师范大学摘要本篇论文通过《逻辑结构学派的宗旨》、《逻辑结构学》、《逻辑工程学》、《逻辑方程结构图理论》、《仿生逻辑理论》五个领域的研究提出《逻辑结构学派的宗旨》、《主观能动性结构》、《主观能动性结构工程》、《赋予生命的逻辑方程结构图》、《仿生逻辑》五个基础经典理论，让人工智能、机器人、智能社会三个主体的基础研究有了方向、方法和判断标准。关键词
YOLOv5Lite模型量化与TFLite转换全流程指南神经网络15044 仿真模型深度学习神经网络 YOLO 神经网络人工智能深度学习网络机器学习
YOLOv5Lite模型量化与TFLite转换全流程指南1.引言在边缘计算和移动设备上部署目标检测模型时，模型大小和推理速度是关键考量因素。YOLOv5Lite作为YOLO系列的轻量级变种，专为资源受限环境设计。然而，要进一步优化模型性能，量化(Quantization)和转换为TFLite格式是必不可少的步骤。本文将详细介绍从训练好的YOLOv5Lite模型到量化TFLite模型的完整转换流程，
基于图神经网络的ALS候选药物预测模型设计与实现神经网络15044 MATLAB专栏神经网络深度学习神经网络人工智能深度学习机器学习
基于图神经网络的ALS候选药物预测模型设计与实现一、任务背景与意义肌萎缩侧索硬化症（ALS）是一种致命的神经退行性疾病，目前尚无有效治愈方法。传统药物发现流程耗时长、成本高，而人工智能技术为加速药物发现提供了新途径。本文设计并实现了一个基于图神经网络（GNN）的ALS候选药物预测模型，通过整合分子图结构信息和生物活性数据，实现对潜在治疗ALS化合物的高效筛选。二、系统架构设计
大模型黄金时代！IT人转行指南：有人薪资翻倍，35+仍吃香_转行大模型！
高薪背后，是百万人才缺口与IT人前所未有的转型机遇当传统IT岗位增长放缓，一个全新领域正以惊人的速度重塑技术人才格局：大模型算法岗平均月薪突破6.8万元，AI产品经理岗月薪近5万元，自动驾驶等AI岗位扩招幅度高达60%36。与此同时，人社部数据显示我国人工智能领域人才缺口超过500万，供需比例达1：106。曾经焦虑“35岁危机”的程序员们发现，那些深耕大模型领域的同行不仅未被淘汰，反而成为企业竞相
大模型卷出新高度|暴雨AI服务器M8878助解算力之困 BAOYUCompany 人工智能服务器运维
当今世界，作为新一轮科技革命和产业革命的重要驱动力，AI已经成为“兵家必争之地”。我国也在政府报告中首次将“人工智能+”行动纳入国家战略，开启了以人工智能为核心的数字经济高质量发展的新时代。当今世界，作为新一轮科技革命和产业革命的重要驱动力，AI已经成为“兵家必争之地”。我国也在政府报告中首次将“人工智能+”行动纳入国家战略，开启了以人工智能为核心的数字经济高质量发展的新时代。AI热度和话题持续火
探索AI时代：全国启动人工智能与未来公益讲座私域合规研究人工智能百度
人工智能与未来——AI赋能中小企业数字化升级公益讲座一、讲座背景随着科技的飞速发展，人工智能（AI）已经深入到了各行各业，为了推动AI技术在中小企业的广泛应用，助力企业拥抱新技术，迎接新机遇，拟申请联合组织AI赋能中小企业数字化升级公益讲座。讲座内容涵盖包括AI新媒体矩阵营销、AI智能跨境获客平台、AI+直播电商认证，AI+数字展厅、中检AI报关风险诊断及合规AI制单系统、AI+商品追溯、AI个人
MATLAB基础应用精讲-【人工智能】数据空间（概念篇）林聪木算法分类
目录前言算法原理发展历程什么是数据空间数据空间基本规律？数据共存方法Pay-as-you-go的进化方式跨域和异构数据源的需求技术实现服务提供数据空间的特点多元主体的开放参与多元角色的中间服务全面覆盖的认证机制丰富的数据联合利用机制数据空间技术框架国际数据空间组成部分使用控制数据场数据场的作用下，三种典型的数据要素价值释放模式数据空间的发展现状国内发展现状：国外发展现状：数据空间的基础设施数据空间
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_