自动驾驶之心

超轻目标检测 | 超越 NanoDet-Plus、YOLOv4-Tiny实时高精度！

点击下方卡片，关注“自动驾驶之心”公众号

ADAS巨卷干货，即可获取

点击进入→自动驾驶之心技术交流群

后台回复【2D检测综述】获取鱼眼检测、实时检测、通用2D检测综述！

超轻目标检测 | 超越 NanoDet-Plus、YOLOv4-Tiny实时高精度！_第1张图片

近年来，压缩高精度卷积神经网络(CNNs)在实时目标检测方面取得了显著进展。为了加快检测速度，轻量级检测器采用单路径主干，卷积层数较少。然而，在连续的池化和下采样操作中，单路径架构总是带来粗糙和不准确的特征图，这很不利于定位目标。另一方面，由于网络容量有限，目前的轻量级网络在表示大规模数据时往往表现得较差。

针对这些问题，本文提出了一种双路径网络 DPNet，该网络具有轻量级的实时目标检测注意力方案。双路径体系结构能够并行提取High-Level语义特征和Low-Level目标细节。虽然DPNet的形状与单路径检测器几乎相同，但计算成本和模型尺寸没有显著增加。为了增强表示能力，设计了一个轻量级的自相关模块(LSCM)来捕获全局交互，只有很少的计算开销和网络参数。在Neck LSCM被扩展为轻量级的交叉相关模块(LCCM)，捕获相邻尺度特征之间的相互依赖性。

对MS COCO和Pascal VOC 2007数据集进行了详尽的实验。实验结果表明DPNet在检测精度和实现效率之间实现了最先进的平衡。具体而言，DPNet在MS COCO测试开发平台上实现了30.5% AP，在Pascal VOC 2007测试集上实现了81.5% mAP，模型尺寸接近2.5M, GFLOPs 1.04，对两个数据集的320 × 320输入图像实现了164 FPS和196 FPS。

1、简介

目标检测是计算机视觉领域的一项基本且具有挑战性的任务。它旨在检测覆盖输入图像中感兴趣的目标的最小边界框，并同步分配相关的语义标签。通常，基于卷积神经网络（CNN）的最新方法可以大致分为两阶段和一个阶段检测器。两阶段检测往往是先使用区域提案网络生产候选框，随后将在下一阶段进行完善。因此，由于它们的多阶段性质，这些检测器性能始终不高。

相反，一阶段检测器直接预测目标类别并在卷积特征图上回归边界框。由于整个管道被简化，因此，一阶段检测器总是比两阶段检测器具有更快地推理速度。尽管取得了显著的进展，但绝大多数基于CNN的检测器涉及数百次甚至数千个卷积层和特征通道，其中模型大小和推理效率对于需要在线估算和实时预测的现实世界应用程序是不可接受的，例如自动驾驶，机器人和虚拟现实。

超轻目标检测 | 超越 NanoDet-Plus、YOLOv4-Tiny实时高精度！_第2张图片

为了适应现实世界的情况，已经提出了大量的轻型网络以进行实时目标检测。这些轻量级网络源自用于图像分类的使用，更喜欢在其 Backbone 中使用轻量级卷积直接继承单路径体系结构。例如，Mobilenet-SSD 将 Mobilenet 与 SSD Head 组合在一起。 ThunerNet 通过用 5×5 深度卷积代替 3×3 深度卷积，并采用 ShuffleNetV2 作为 Backbone。 PeleeNet 使用具有 Dense 结构的轻量化 Backbone，减少了 SSD Head 的输出尺度以节省计算成本。 Tiny-DSOD 在 Backbone 和特征金字塔网络（FPN）中引入深度卷积。Tiny-Yolo 系列减少了卷积层的数量或去除 Neck 的多尺度输出。尽管这些高级和高效的网络已取得了令人印象深刻的检测结果，但它们依然有以下局限性：

采用积极的下采样策略（例如， pooling 和 stride convolution），单路径体系结构在 Backbone 设计中占主导地位，以实现实时目标检测。由于细节从浅层到深卷积层逐步丢弃，因此产生的高级特征对准确定位目标无济于事。图1给出了两个视觉示例。第一行显示 ShuffleNetV2 更喜欢从输入图像的周围区域提取特征。尽管轻量化的检测器遵循采用 FPN 来缓解此问题，但只需通过元素相加或拼接来整合从浅层到深层的此类不准确的特征可能对检测物体有害。
由于网络容量有限，最近的轻量化检测器可能具有较弱的视觉数据表示能力。例如，在图1的第2行中，高通滤波器响应有时会分布在混乱的背景（例如树木和海洋）上，而包含感兴趣目标的区域则较少激活。根本的原因主要在于，由于受欢迎的领域有限，轻量化的卷积在编码全局依赖性方面非常有限。一些网络更喜欢利用大卷积核（例如31×31）或自注意力，但是它们始终涉及巨大的计算成本和不适合实时目标检测。

超轻目标检测 | 超越 NanoDet-Plus、YOLOv4-Tiny实时高精度！_第3张图片

为了解决这些缺点，本文设计了一个名为 DPNet 的双路径网络，并具有轻量化的注意力设计用于实时目标检测。如图2所示，DPNet 由3个组成部分组成：Backbone，Neck 和检测 Head。为了纠正丢失目标细节的问题，与以前的轻量化检测网络始终采用单路结构，DPNet 采用了平行路径架构，从而得到双分辨率 Backbone。

更具体地说，低分辨率路径（LRP）的分辨率像往常一样逐渐减少，其中 High-Level 语义信息被编码。相反，高分辨率路径（HRP）的分辨率保持不变，并在其中提取了 Low-Level 的空间细节。这两条路径对于轻量化目标检测都很重要。考虑到两个子网络的互补性，构建了双向融合模块（Bi-FM），以增强两条路径之间的通信，从而促进可变分辨率特征之间的信息流。尽管 DPNet 的 Backbone 相对于单路径结构几乎具有重复的形状，但计算复杂性和网络大小并未显著增加。

另一方面，为了提高整个 DPNet 的表示能力，开发了带有轻量化自相关模块（LSCM）的 ShuffleNetV2 UNit，从而产生了基于注意力的 shuffle unit（ASU）。类似于 CBAM，LSCM 也分别在空间和通道的注意力图中产生。但是，LSCM 采用了一种模仿自注意力的结构，而不是采用全局合并来代表元素的依赖性。

此外，LSCM 不用探索涉及大量计算的 pixel-to-pixel/channel-to-channel 相关性，而是研究了低维嵌入中的 pixel-to-region/channel-to-group-channel 依赖性，从而节省了大量的计算成本，同时仍保持强大的表示能力。在图2中，为了充分利用 Neck 不同分辨率的特征，LSCM 进一步扩展到轻量化交互相关模块（LCCM）。 LCCM 以双向方式工作：自上而下（LCCM-TD）和自下而上（LCCM-BU）。 LCCM-TD 引入了 High-Level 语义以指导 Low-Level 特征。相反，LCCM-BU 利用 Low-Level 细节来完善 High-Level 信息。

本文的主要贡献是 3 个方面：

与使用单路径的主流轻型检测器相反，DPNet 采用了双路径体系结构，该架构可以同步提取 High-Level 语义并保持 Low-Level 细节。此外，两条路径相互补充以进一步提高性能。
设计了一个基于注意力的模块 LSCM，该模块同时具有推理效率和表示能力。 LSCM 在计算上很便宜，因为其计算复杂性与输入特征分辨率呈线性关系。即便如此，它仍然通过研究全局空间和通道相互作用来实现强大的表示能力。作者还将 LSCM 扩展到 Neck 的LCCM，在与不同分辨率不同的相邻尺度特征之间很好地探索了相关的依赖关系。

2、本文方法

DPNet 的整体结构如图2所示。具体来说，DPNet 由 3 个组成部分：Backbone，Neck和检测Head组成。

超轻目标检测 | 超越 NanoDet-Plus、YOLOv4-Tiny实时高精度！_第4张图片

2.1、Backbone

表I中给出了 DPNet Backbone 的详细结构。更具体地，DPNet采用双分辨率 Backbone，分别使用并行路径体系结构：LRP和 HRP。这两条路径主要由一系列 ASUs 构建。与传统的单路径检测器相似，LRP 采用了 Stem + 多个 ASUS Stride=2，逐渐生成卷积特征图，其分辨率为1/2、1/4、1/8、1/16和1/32。注意 Stem 包括 Stride 为2的 3×3 卷积和最大池化，直接收缩输入分辨率的4倍。

另一方面，为了获得高质量的目标详细信息，HRP 保持了相对较高的 LRP 分辨率，维持未改变的特征分辨率，即输入图像大小的1/8。在2条路径中，使用2个 Bi-FM 来增强跨分辨率的特征集成和交互。

最后，如图2所示，组合特征，表示为{C1,C2,C3}，其形状为{40×40×128,20×20×20×256,10×10×512}，用作多个输入到 Neck 部分，这有助于信息的交互。

1、ASU

超轻目标检测 | 超越 NanoDet-Plus、YOLOv4-Tiny实时高精度！_第5张图片

如图3（a）所示，ASU 采用了 split-transform-merge 结构，该结构利用残差连接和轻量化特征提取。在每个ASU的开头，输入特征首先分为2个低维特征，即 transform 和 identity 分支，其中每个分支都有输入的一半通道。transform 后的分支充当残差特征，而 identity 分支则用于促进模型训练。transform 的分支不使用3×3深度卷积，而是依次采用较大的kernel-size（例如5×5）和提出的 LSCM，这两者都用于获得更强大的特征。

此后，使用拼接合并了2个分支的输出，以使通道的数量相对于输入保持相同。最后，将特征通道Shuflle为启用两个分支之间的信息交互。 Shuflle 后，下一个ASU开始。图3（b）还展示了ASU的 stride 版本，用于减少特征分辨率，其中5×5步长深度卷积分别用于 transform 和 identity 分支

2、bi-fm

超轻目标检测 | 超越 NanoDet-Plus、YOLOv4-Tiny实时高精度！_第6张图片

Bi-FM 充当桥梁在 Backbone 中进行 HRP 和 LRP 之间的通信。 Bi-FM 的详细结构如图3（c）所示。令和，是Bi-fm的输入，和分别为BI-FM的输出，其中H×W代表输入分辨率，C表示通道号。更具体地说，首先通过1×1卷积，然后以相等的尺寸进行更新，以遵循与融合。另一方面，为了产生，被馈入5×5 stride 卷积，然后以相等的尺寸降采样，以与集成下一个特征。

2.2、Neck

Neck（也称为FPN）是最先进的检测器中的基本组件，可汇总多尺度特征。先前的方法利用了简单的融合策略，该策略采用双线性插值和元素添加，通常忽略了具有不同分辨率的特征之间的相互依赖性。为此，LCCM 在 DPNet 的 Neck 部分采用，用于汇总不同卷积层的跨分辨率特征。

Neck 的详细体系结构如图2所示。注意 LCCM 以双向方式工作：自上而下和自下而上的方向，分别表示为 LCCM-TD 和 LCCM-BU。 LCCM-TD 旨在提取 High-Level 语义来进行类识别，而LCCM-BU希望加强目标定位的 Low-Level 细节。

更具体地说，接收由 Backbone 作为输入产生的{C1,C2,C3}，Neck 以1×1的卷积开始，产生具有相同通道数和各种分辨率的特征。这些中间特征（表示为{M1,M2,M3}）首先通过2个 LCCM-TDS 融合在自上而下的路径中，然后通过2个 LCCM-BUS 融合在自下而上的路径。最后，所产生的输出表示为{F1,F2,F3}，其中相邻刻度特征图之间相关的相互作用被很好地集成到轻量化检测head。

2.3、Head

超轻目标检测 | 超越 NanoDet-Plus、YOLOv4-Tiny实时高精度！_第7张图片

检测head会学习将特征映射到最终估计的预测。一些检测网络采用轻量化Backbone，但涉及SSD head太重而无法做出预测。替代方法设计了轻量化检测头，以降低模型尺寸。同样，DPNet 还采用了轻量化的检测头来加速推理速度。如图3（d）所示，DPNet不使用3×3深度卷积，而是利用具有较大核大小（例如5×5）的紧凑型卷积来扩大感受野，从而增加了非常有限的模型尺寸。检测头的详细体系结构如图2所示。从 Neck 部分产生的输入特征{F1,F2,F3}，经历了2个连续的交互。然后，使用1×1卷积来产生最终输出，从相关的 GT 中获得其监督。

3、LSCM and LCCM

超轻目标检测 | 超越 NanoDet-Plus、YOLOv4-Tiny实时高精度！_第8张图片

3.1、LSCM

上下文表述的任务是收获周围的信息，这始终是通过全局池化来完成的。尽管产生了代表整个图像的 High-Level 特征，但此类网络的表示形式无法提供 element-wise 交互。许多替代方法都用于使用密集的注意力图来捕获全局上下文，其中每个像素的重要性都由所有其他像素编码。但是，这些方法需要大量计算。

作为ASU的核心单元，LSCM充分利用了计算效率和表示能力。直观地说，有两种方法可以节省计算成本：减少元素的数量和减少特征维度。因此，介绍LSCM在这两个方面的工作原理。

LSCM 的详细结构如图4（a）所示。令为输入特征，其中W，H和C分别代表输入 F 的宽度，高度和通道数。为了减少图像元素，首先将池化操作应用于输入特征 F，产生紧凑的表示，其中R中的每个元素代表一个包括像素的图像区域然后，将两个特征 F 和 R flattened 为2个 2D 序列和，促进了后续空间注意力和通道注意力的计算。

在空间注意力中，首先学习2个线性投影，以将输入序列x和x'投射到2个低维嵌入和，其中r是控制特征压缩比的非负尺度因子：

之后，使用和之间的矩阵乘积计算空间像素到区域相关性，该矩阵乘积顺序依次经过线性投影，层归一化ln（·）和sigmoid函数σ（·），产生最终的空间注意力图：

在通道注意中，为了减少特征维度，首先学会了线性投影，以将输入序列x'映射到低维嵌入中，其中中的每个通道代表一组 X' 中的 r 通道。另一方面，另一个线性投影还将输入序列x'映射到：

接下来，类似于空间注意力，使用和之间的矩阵乘积计算通道到组通道相关性，该矩阵乘积依次经过线性投影，层归一化LN（·）和Sigmoid 函数σ（·），产生最终通道注意力图：

最后，利用学习到的空间注意力图和通道注意力图分别对输入序列X进行加权，然后使用元素相加进行融合，从而产生了融合特征特征：

其中和分别是元素的相加和相乘。请注意，两个注意力映射和分别以列重新加权和行重新加权的方式与输入序列X相乘。最终，产生的序列被reshape为，与输入特征 F 具有相等的维度。

超轻目标检测 | 超越 NanoDet-Plus、YOLOv4-Tiny实时高精度！_第9张图片

作者还分析了所提出的 LSCM 的计算复杂度，并将其与最近的自注意力网络进行了比较，因为它们在研究全局依赖性方面都具有强大的表示能力。表2报告了将包括空间注意力和通道注意力放在一起的比较结果。

为了清晰起见只考虑了空间注意力。以前的方法和 LSCM 都涉及两个计算步骤：计算元素上的相似性和重新加权输入特征。在自注意力中，计算密集的空间注意力和重写特征都需要操作，从而导致输入分辨率的二次复杂度。相反，LSCM只需要与输入分辨率呈线性关系的操作，因为使用全局池化已经大大减少了特征元素。此外，由于生成的注意力图非常简单，重新加权过程只需要操作，而不是自注意力中的。

3.2、LCCM

这里作者将 LSCM 扩展到多个输入版本（称为LCCM），在Neck中用于结合多尺度特征。LCCM 以双向方式工作：自上而下和自下而上，分别表示为 LCCM-TD 和 LCCM-BU。由于它们以类似的方式工作，因此只详细介绍LCCM-TD，然后指出其与 LCCM-BU 的主要差异。

LCCM-TD 的详细体系结构如图4（b）所示。通常，LCCM-TD 与 LSCM 共享相似的结构，但两个具有不同分辨率的输入。令和分别为高分辨率和低分辨率输入特征。此处，，因为和来自相邻的scale卷积层。

为了探索跨层相互作用并节省计算成本，必须使用全局池化在同一时间缩小和的分辨率，然后将2个2D序列和。注意。同时，输入特征也被flattened为2D序列，随后可以按照空间和通道注意力来参与计算。

在空间注意力中，输入特征和经过两个线性投影，分别得到两个低维嵌入和，其中，r是控制特征压缩比的非负比例因子：

之后，使用和之间的矩阵乘积结果计算空间跨层相互作用，这些矩阵乘积被依次馈送到线性投影和Sigmoid，产生最终空间注意力图：

在通道注意中，线性投影首先将输入序列映射到低维嵌入中。然后，另一个线性投影将输入序列映射到：

接下来，类似于空间注意力，使用和矩阵乘积计算跨层相关性，该矩阵乘积依次经过线性投影，层归一化LN和Sigmoid，产生最终通道注意力图：

此后，学习的空间注意力图和通道注意图分别对高分辨率输入进行甲醛，并使用元素相加来进行融合，从而产生融合特征：

整个重新加权过程是一种残差功能，以端到端的方式促进培训LCCM-TD：

请注意，等式（10）中的两个加权操作分别与LSCM相似。最终，生成的序列被reshape为，相对于输入特征，尺寸相等的尺寸，如图2所示。

关于LCCM-BU，其详细体系结构如图4（c）所示。对于LCCM-TD，只有一个差异：当计算空间注意力时，分辨率必须被降采样两次，以进行精确的重新加权和 identity 映射。

4、实验

4.1、SOTA对比

超轻目标检测 | 超越 NanoDet-Plus、YOLOv4-Tiny实时高精度！_第10张图片

4.2、可视化效果

超轻目标检测 | 超越 NanoDet-Plus、YOLOv4-Tiny实时高精度！_第11张图片

5、参考

[1].DPNet: Dual-Path Network for Real-time Object Detection with Lightweight Attention

往期回顾

史上最全综述 | 3D目标检测算法汇总！（单目/双目/LiDAR/多模态/时序/半弱自监督）

【自动驾驶之心】全栈技术交流群

自动驾驶之心是首个自动驾驶开发者社区，聚焦目标检测、语义分割、全景分割、实例分割、关键点检测、车道线、目标跟踪、3D目标检测、多传感器融合、SLAM、光流估计、轨迹预测、高精地图、规划控制、AI模型部署落地等方向；

加入我们：自动驾驶之心技术交流群汇总！

自动驾驶之心【知识星球】

想要了解更多自动驾驶感知（分类、检测、分割、关键点、车道线、3D目标检测、多传感器融合、目标跟踪、光流估计、轨迹预测）、自动驾驶定位建图（SLAM、高精地图）、自动驾驶规划控制、领域技术方案、AI模型部署落地实战、行业动态、岗位发布，欢迎扫描下方二维码，加入自动驾驶之心知识星球（三天内无条件退款），日常分享论文+代码，这里汇聚行业和学术界大佬，前沿技术方向尽在掌握中，期待交流！

你可能感兴趣的:(卷积,卷积神经网络,大数据,算法,计算机视觉)

Golang Fiber框架最佳实践：如何构建企业级应用 Golang编程笔记 Golang编程笔记 Golang开发实战 golang 开发语言后端 ai
GolangFiber框架最佳实践：如何构建企业级应用关键词：Golang、Fiber框架、企业级应用、最佳实践、Web开发摘要：本文聚焦于GolangFiber框架在企业级应用构建中的最佳实践。详细介绍了Fiber框架的背景、核心概念、算法原理、数学模型等基础知识，通过具体的代码案例展示了如何搭建开发环境、实现和解读源代码。同时探讨了Fiber框架在实际应用场景中的应用，推荐了相关的学习资源、开
代码随想录算法训练营第52天| 101. 孤岛的总面积、102. 沉没孤岛、103. 水流问题、104.建造最大岛屿扛过今天777 算法深度优先
101.孤岛的总面积卡码题目链接：101.孤岛的总面积学习链接：代码随想录题解：法一：count=0defdfs(grid,x,y):globalcountgrid[x][y]=0count+=1directions=[[1,0],[0,1],[-1,0],[0,-1]]fori,jindirections:next_x=x+inext_y=y+jifnext_x=len(grid)ornext_
深入研究 Golang 领域的 Fiber 框架架构 Golang编程笔记 golang 架构网络 ai
深入研究Golang领域的Fiber框架架构关键词：Golang、Fiber框架、架构、高性能、Web开发摘要：本文将深入探讨Golang领域的Fiber框架架构。我们会先介绍背景知识，包括目的、预期读者等。接着用通俗易懂的方式解释核心概念，如Fiber框架的各个组成部分，以及它们之间的关系。然后详细阐述核心算法原理、数学模型，通过实际代码案例展示其应用。还会介绍Fiber框架的实际应用场景、推荐
如何在FastAPI中打造坚不可摧的Web安全防线？
url:/posts/9d6200ae7ce0a1a1a523591e3d65a82e/title:如何在FastAPI中打造坚不可摧的Web安全防线？date:2025-06-28T08:37:03+08:00lastmod:2025-06-28T08:37:03+08:00author:cmdragonsummary:Web安全三要素包括机密性、完整性和可用性。机密性通过加密算法保护数据传输和
算法竞赛备考冲刺必刷题（C++） | 洛谷 P8814 解密热爱编程的通信人算法 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：P8814[CSP-J2022]解密-洛
Java Fork/Join 框架详解 empti_ 数据结构与算法 java
JavaFork/Join框架详解Fork/Join框架是Java7引入的一个并行编程框架，专门设计用来高效地实现分治算法（Divide-and-Conquer）。它通过工作窃取（Work-Stealing）算法来最大化多核处理器的利用率。一、核心概念1.基本组成ForkJoinPool：特殊的线程池，管理工作线程ForkJoinTask：表示任务的抽象类，有两个重要子类：RecursiveAct
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
游戏寻路之A*算法（GUI演示） jforgame 从零开始搭建游戏服务器框架 java A星自动寻路
一、A*算法介绍A*算法是一种路径搜索算法，用于在图形网络中找到最短路径。它结合了Dijkstra算法和启发式搜索的思想，通过综合利用已知的最短路径和估计的最短路径来优化搜索过程。在游戏自动寻路得到广泛应用。二、A*算法的基本思想在图形网络中选择一个起点和终点。维护两个列表：开放列表和关闭列表。开放列表用于存储待考虑的节点，关闭列表用于存储已考虑过的节点。将起点加入开放列表。循环以下工作当open
疲劳检测与行为分析：工厂智能化实践智驱力人工智能安全智慧城市行为识别人员属性识别疲劳检测抽烟检测徘徊检测
视觉分析算法赋能工厂疲劳与安全管理一、背景与需求在制造业中，疲劳作业是导致安全事故和效率下降的核心因素之一。传统人工巡检存在覆盖面不足、响应滞后等问题，而基于视觉分析的智能监控系统通过多算法协同，可实现全天候、高精度的疲劳检测与行为管理。本文围绕疲劳检测算法、人员计数算法、抽烟检测算法及徘徊检测算法，探讨其在工厂场景中的技术实现与应用价值。二、技术实现疲劳检测算法原理：基于PERCLOS（眼睑闭合
大数据面试必备：Kafka性能优化 Producer与Consumer配置指南
Kafka面试题-在Kafka中，如何通过配置优化Producer和Consumer的性能?回答重点在Kafka中，通过优化Producer和Consumer的配置，可以显著提高性能。以下是一些关键配置项和策略：1、Producer端优化:batch.size：批处理大小。增大batch.size可以使Producer每次发送更多的消息，但要注意不能无限制增大，否则会导致内存占用过多。linger
010 【入门】链表入门题目-合并两个有序链表要天天开心啊算法专栏链表数据结构
合并两个有序链表|[算法]-[中级]-[链表]▶JDK8+|⏱️O(m+n)核心代码实现packageclass010;//将两个升序链表合并为一个新的升序链表并返回//新链表是通过拼接给定的两个链表的所有节点组成的//测试链接:https://leetcode.cn/problems/merge-two-sorted-lists/publicclassMergeTwoLists{//链表节点定义
008 【入门】算法和数据结构简介要天天开心啊算法专栏算法数据结构
算法与数据结构系统概览|[算法]-[基础]-[通用]一、算法分类与应用1.硬计算类算法|[算法]-[中级]-[通用]特点应用场景复杂度特征-精确求解问题-可能带来较高计算复杂度-大厂笔试/面试-ACM竞赛-所有程序员岗位必考⏱️通常为O(n)~O(n²)//[示例]快速排序算法-分治思想核心实现publicvoidquickSort(int[]arr,intleft,intright){if(le
Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
莫队算法 —— 将暴力玩出花秒啦算法
莫队算法——将暴力玩出花一、为什么需要莫队？——暴力法的瓶颈我们已经学会了用分块处理一些在线的区间问题。现在，我们来看一类特殊的离线区间查询问题。“离线”意味着我们可以把所有查询先读进来，再按我们喜欢的顺序去处理它们。思考一个问题：给定一个长度为N的数组，M次询问。每次询问一个区间[l,r]，问区间内有多少种数字至少出现了2次？那我们回到最朴素的暴力。纯暴力：对于每个询问(l,r)，都for一遍，
图扑软件智慧云展厅，开启数字化展馆新模式智慧园区可视化 5g 人工智能大数据安全云计算
随着疫情的影响以及新兴技术的不断发展，展会的发展形式也逐渐从线下转向线上。通过“云”上启动、云端互动、双线共频的形式开展。通过应用大数据、人工智能、沉浸式交互等多重技术手段，构建数据共享、信息互通、精准匹配的高精度“云展厅”，突破时空壁垒限制。图扑软件运用HT强大的渲染功能，数字孪生“云展位”，1:1复现实际展厅内部独特的结构造型和建筑特色。也可以第一人称视角漫游，模拟用户在展厅内的参观场景，在保
Web3前沿科技：开启数字资产交易新征程 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据 web3 科技 ai
Web3前沿科技：开启数字资产交易新征程关键词：Web3、数字资产交易、区块链、智能合约、去中心化金融摘要：本文聚焦于Web3前沿科技在数字资产交易领域的应用与发展。详细阐述了Web3的核心概念、相关技术原理，包括区块链、智能合约等。通过具体的算法原理和Python代码示例，深入剖析了数字资产交易在Web3环境下的运行机制。同时，结合实际项目案例，讲解了开发环境搭建、代码实现与解读。探讨了Web3
高斯混合模型GMM&K均值（十三-1）——K均值是高斯混合模型的特例 phoenix@Capricornus 模式识别与机器学习均值算法机器学习算法
EM算法与K均值算法的关系K均值可以看成是高斯混合模型的特例。对K均值算法与EM算法进行比较后，可以发现它们之间有很大的相似性。K均值算法将数据点硬（hard）分配到聚类中，每个数据点唯一地与一个聚类相关联，而EM算法基于后验概率进行软（soft）分配。事实上，可以从EM算法推导出K均值算法。考虑一个高斯混合模型，其中混合分量的协方差矩阵由σ2I{\sigma^2}Iσ2I给出，其中σ2{\sig
Practical TLA+ 项目中的Dekker算法形式化验证焦习娜Samantha
PracticalTLA+项目中的Dekker算法形式化验证practical-tla-plusSourceCodefor'PracticalTLA+'byHillelWayne项目地址:https://gitcode.com/gh_mirrors/pr/practical-tla-plus概述本文分析PracticalTLA+项目中关于Dekker互斥算法的形式化规范。Dekker算法是解决多线
【C++算法竞赛】前缀和+桶数组 YLCHUP C++算法技巧算法 c++开发语言数据结构哈希算法 c语言笔记
文章目录1.前缀和基础2.算法原理3.例题讲解[P1114“非常男女”计划](https://www.luogu.com.cn/problem/P1114)[P11965[GESP202503七级]等价消除](https://www.luogu.com.cn/problem/P11965)[P10724[GESP202406七级]区间乘积](https://www.luogu.com.cn/pro
【机器学习与数据挖掘实战 | 医疗】案例18：基于Apriori算法的中医证型关联规则分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘 Apriori python 关联规则人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
提示词编程语言设计艺术探索 AI天才研究院计算 AI人工智能与大数据 AI大模型企业级应用开发实战 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《提示词编程语言设计艺术探索》关键词：提示词编程语言，设计艺术，编程语言设计，核心算法，实例分析，项目实战摘要：本文旨在深入探讨提示词编程语言的设计艺术，从基础概念到核心算法，再到实际应用和未来趋势，全面解析这一领域的关键技术和设计理念。通过具体的实例分析和项目实战，帮助读者更好地理解和掌握提示词编程语言的设计与实现。引言与概述1.1提示词编程语言的背景和重要性提示词编程语言（Prompt-Bas
误差的回响：反向传播算法与神经网络的惊天逆转田园Coder 人工智能科普人工智能科普
当专家系统在20世纪80年代初期大放异彩，成为人工智能实用化的耀眼明星时，另一股曾经被宣判“死刑”的力量——连接主义（神经网络）——正在寒冬的冻土下悄然涌动，孕育着一场惊天动地的复苏。马文·明斯基和西摩·帕尔特在1969年《感知机》专著中那精准而冷酷的理论批判，如同沉重的封印，将多层神经网络的研究禁锢了近二十年。他们指出的核心死结——缺乏有效算法来训练具有隐藏层的网络——仿佛一道无法逾越的天堑。单
vue大数据量列表渲染性能优化：虚拟滚动原理 Java小卷 Vue3开源组件实战 vue3 自定义Tree 虚拟滚动
前面咱完成了自定义JuanTree组件各种功能的实现。在数据量很大的情况下，我们讲了两种实现方式来提高渲染性能：前端分页和节点数据懒加载。前端分页小节：Vue3扁平化Tree组件的前端分页实现节点数据懒加载小节：ElementTreePlus版功能演示：数据懒加载关于扁平化结构Tree和嵌套结构Tree组件的渲染嵌套结构的Tree组件是一种递归渲染，性能上比起列表结构的v-for渲染比较一般。对于
C++ Lambda表达式详解：从入门到精通 Jay_515 c++Lambda
Lambda表达式是C11引入的最重要特性之一，它彻底改变了我们在C中编写函数对象的方式。本文将带你全面掌握Lambda表达式的使用技巧！1.什么是Lambda表达式？Lambda表达式是C++11引入的一种匿名函数对象，它允许我们在需要函数的地方内联定义函数，无需单独命名。Lambda的出现极大简化了代码，特别是在使用STL算法时。为什么需要Lambda？简化代码：避免为简单操作单独编写函数对象
redis的scan使用详解，结合spring使用详解黑皮爱学习 redis自学笔记 redis spring 数据库
Redis的SCAN命令是一种非阻塞的迭代器，用于逐步遍历数据库中的键，特别适合处理大数据库。下面详细介绍其使用方法及在Spring框架中的集成方式。SCAN命令基础SCAN命令的基本语法：SCANcursor[MATCHpattern][COUNTcount]cursor：迭代游标，初始为0，每次迭代返回新的游标值。MATCHpattern：可选，用于过滤键的模式（如user:*）。COUNTc
Tiktok App 登录账号、密码、验证码 XOR 加密算法
抖音App登录账号、密码、验证码XOR加密算法%E9n+z,\&R1a4b.^流程分析登录TiktokAPP时，通过抓包发现账号密码是非明文传输的。getUserProfile($userId,$secUid);echo"\n\n视频列表：\n";echo$tiktok->getMixList($userId);//示例：加密后的密码hex字符串$encrypted_hex="7472607771
mongodb和redis的区别： huangbfeng mongodb redis 数据库
1、内存管理机制Redis数据全部存在内存，定期写入磁盘，当内存不够时，可以选择指定的LRU算法删除数据。MongoDB数据存在内存，由linux系统mmap实现，当内存不够时，只将热点数据放入内存，其他数据存在磁盘。2、支持的数据结构Redis支持的数据结构丰富，包括hash、set、list等。MongoDB数据结构比较单一，但是支持丰富的数据表达，索引，最类似关系型数据库，支持的查询语言非常
数据库系统工程师简要概括笔记 Mint_Datazzh 数据库系统工程师数据库笔记数据库系统工程师
文章内容仅为粗略总结知识，便于个人复习思考原文链接:数据库系统工程师简要概括笔记–笔墨云烟数据库系统工程师—1.1计算机硬件基础知识数据库系统工程师—1.2计算机体系结构与存储系统数据库系统工程师—1.3安全性、可靠性与系统性能评测基础知识数据库系统工程师—2.程序语言基础知识数据库系统工程师—3.1~3.4线性结构、数组和矩阵、树和二叉树、图数据库系统工程师—3.5排序算法数据库系统工程师—3.
结构化数据增强的生成式算法案例：客户交易数据增强 python游乐园数据深度学习大数据算法学习
1基础信息1.1案例背景这是一个用于增强结构化客户交易数据的生成式算法。这种类型的数据增强在金融、电子商务等领域非常有用，可以帮助解决数据不平衡问题或在小数据集上提高模型性能。1.2问题定义给定原始交易数据集D={x₁,x₂,...,xₙ}，其中每条记录包含：交易金额交易时间客户年龄客户收入水平交易类别地理位置是否为欺诈交易(标签)目标：生成与原始数据分布相似但多样化的新样本，同时保持字段间的合理
LLMs基础学习（八）强化学习专题（7）汤姆和佩琦 NLP 学习 Actor-Critic 算法
LLMs基础学习（八）强化学习专题（7）文章目录LLMs基础学习（八）强化学习专题（7）Actor-Critic算法基础原理算法流程细节算法优缺点分析算法核心总结视频链接：https://www.bilibili.com/video/BV1MQo4YGEmq/?spm_id_from=333.1387.upload.video_card.click&vd_source=57e4865932ea6c
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本