怎么全是重名

YOLOv4: Optimal Speed and Accuracy of Object Detection（2020.4）

文章目录

Abstract
Introduction
Related work
- Object detection models
- Bag of freebies
- Bag of specials
Methodology
- Selection of architecture
- Selection of BoF and BoS
- Additional improvements
- YOLOv4
Experiments
Results
- 表8列出了使用Maxwell GPU的帧率对比结果
- 表9列出了使用Pascal GPU的帧率对比结果
表10列出了使用Volta GPU的帧率对比结果
Conclusions

原文链接
源代码

Abstract

据说有大量的特征可以提高卷积神经网络(CNN)的准确性。需要在大型数据集上对这些特征的组合进行实际测试，并对结果进行理论论证。一些特征只对某些模型和某些问题起作用，或者只对小规模数据集起作用;而一些特征，如批归一化和残差连接，适用于大多数模型、任务和数据集。我们假设这些通用特征包括加权残差连接(WRC)、跨阶段部分连接(CSP)、跨小批归一化(CmBN)、自对抗训练(SAT)和Mish-激活。
我们使用了新的特征:WRC、CSP、CmBN、SAT、Mish-激活、Mosaic数据增强、CmBN、DropBlock正则化和CIoU损失，并将其中一些特征结合起来获得了最先进的结果:MS COCO数据集在Tesla V100上以~ 65 FPS的实时速度获得了43.5%的AP(65.7%的AP50)

Introduction

大多数基于cnn的目标检测器很大程度上只适用于推荐系统。最精确的现代神经网络不是实时运行的，需要大量的gpu来进行大量的mini-batch大小的训练。提高实时对象检测器的准确性，不仅可以将它们用于提示生成推荐系统，还可以用于独立流程管理和减少人工输入。

我们通过创建一个在传统GPU上实时运行的CNN来解决这些问题，并且训练只需要一个传统GPU
本工作的主要目标是在生产系统中设计一个快速运行的目标检测器，并优化并行计算，而不是低计算量理论指标(BFLOP)
我们希望所设计的对象易于训练和使用。例如，任何使用传统GPU进行训练和测试的人都可以获得实时、高质量和令人信服的目标检测结果，如图1所示的YOLOv4结果
（在性能相当的情况下，YOLOv4的运行速度比EfficientDet快两倍。改进YOLOv3的AP和FPS分别提高10%和12%）
我们的贡献总结如下：

我们开发了一个高效、强大的目标检测模型。它使得每个人都可以使用1080 Ti或2080 Ti GPU来训练超级快速准确的目标检测器
我们在检测器训练过程中验证了最先进的Bag-of- Freebies和Bag-of- specials方法对目标检测的影响
我们修改了最先进的方法，使它们更有效，更适合单GPU训练，包括CBN， PAN， SAM等

Related work

Object detection models

现代检测器通常由两部分组成，在ImageNet上进行预训练的主干和用于预测对象类别和边界框的头部

对于那些运行在GPU平台上的检测器，它们的主干可以是VGG[68]、ResNet[26]、ResNeXt[86]或DenseNet[30]
对于那些运行在CPU平台上的检测器，它们的主干可以是SqueezeNet b[31]、MobileNet[28,66,27,74]或ShuffleNet[97,53]。

对于头部部分，通常分为两种，即一阶段目标检测器和两阶段目标检测器。最具代表性的两阶段目标检测器是R-CNN系列，包括Fast R-CNN、Faster R-CNN、R-FCN和Libra R-CNN。也有可能使两阶段对象检测器成为无锚点对象检测器，如RepPoints
对于单级目标检测器，最具代表性的型号有YOLO、SSD和RetinaNet

近年来发展了无锚单级目标探测器。这类检测器有CenterNet、CornerNet、FCOS等。近年来发展起来的目标检测器通常在主干和头部之间插入一些层，这些层通常用于收集不同阶段的特征图。我们可以称之为物体探测器的颈部
通常，一个颈由几个自下而上的路径和几个自上而下的路径组成。采用这种机制的网络包括Feature Pyramid Network (FPN)、Path aggregation Network (PAN)[49]、BiFPN[77]和NAS-FPN

除了上述模型外，一些研究者强调直接建立一个新的主干(DetNet[43]， DetNAS[7])或一个新的整体模型(SpineNet [12]， HitDe- tector[20])来进行目标检测
综上所述，一个普通的目标检测器由几个部分组成：

Bag of freebies

通常，目标检测器是离线训练的。因此，研究人员一直喜欢利用这一优势，开发更好的训练方法，使目标检测器在不增加推理成本的情况下获得更高的精度，我们把这些只改变训练策略或只增加训练成本的方法称为 “bag of freebies”

目标检测方法中经常采用的一种方法是数据增强，这种方法符合 “bag of freebies”的定义。数据增强的目的是增加输入图像的可变性，使所设计的目标检测模型对来自不同环境的图像具有更高的鲁棒性

其他一些 “bag of freebies”方法致力于解决数据集中的语义分布可能存在偏差的问题。在处理语义分布偏差问题时，一个非常重要的问题是不同类别之间存在数据不平衡的问题，这一问题通常通过两阶段对象检测器中的硬负例挖掘[72]或在线硬例挖掘[67]来解决

最后一类“bag of freebies”是边界盒(Bounding Box, BBox)回归的目标函数。传统的目标检测器通常使用均方误差(Mean Square Error, MSE)直接对BBox的中心点坐标和高度、宽度进行回归，即{x中心，y中心，w, h}，或者左上点和右下点，即{x左上，y左上，x右下，y右下}。基于锚点的方法是估计相应的偏移量，例如{x中心偏移量，y中心偏移量，w偏移量，h偏移量}和{x左上偏移量，y左上偏移量，x右下偏移量，y右下偏移量}

Bag of specials

对于那些只增加少量推理成本，却能显著提高目标检测精度的插件模块和后处理方法，我们称之为“bag of specials”。一般来说，这些插件模块是为了增强模型中的某些属性，如扩大接受野、引入注意机制或增强特征集成能力等，后处理是对模型预测结果进行筛选的一种方法

通常用于目标检测的注意模块主要分为通道型注意和点型注意，这两种注意模型的代表分别是挤压-激发(Squeeze-and-Excitation, SE)[29]和Spatial注意模块(SAM)[85]

基于深度学习的目标检测中常用的后处理方法是NMS，它可以过滤掉那些对同一目标预测不好的bbox，只保留响应较高的候选bbox

Methodology

根本目标是神经网络在生产系统中的快速运行和并行计算的优化，而不是低计算量的理论指标(BFLOP)。我们提出了两种实时神经网络的选择：
对于GPU，我们在卷积层中使用少量组(1 - 8):CSPResNeXt50 / CSPDarknet53
对于VPU -我们使用分组卷积，但我们避免使用挤压和兴奋(SE)块-具体包括以下模型:EfficientNet-lite / MixNet [76] / GhostNet [21] / Mo- bileNetV3

Selection of architecture

我们的目标是在输入网络分辨率、卷积层数、参数数(filter_size² * filters * channel / groups)和输出层数(过滤器)之间找到最佳平衡

下一个目标是为不同的检测器级别(如FPN, PAN, ASFF, BiFPN)选择额外的块来增加接受野和来自不同骨干级别的参数聚合的最佳方法

对于分类来说最优的参考模型对于检测器来说并不总是最优的。与分类器不同，检测器需要满足以下条件：
1. 更高的输入网络大小(分辨率)-用于检测多个小尺寸目标
2. 更多的层-用于更高的接受域，以覆盖增加的输入网络大小
3. 更多参数-为了提高模型在单个图像中检测不同大小的多个目标的能力

我们可以假设应该选择一个具有更大的接受野大小(具有更多的卷积层数3 × 3)和更多参数的模型作为主干。表1显示了CSPResNeXt50、CSPDarknet53和Effi- cientNet B3的信息，这一理论证明，连同我们的大量实验，表明CSPDarknet53神经网络是两者的最佳模型作为一个检测器的骨干

不同大小感受野的影响总结如下:
1. 达到目标大小-允许查看整个目标
2. 达到网络大小-允许查看目标周围的上下文
3. 超过网络大小-增加图像点和最终激活之间的连接数

我们在CSPDarknet53上添加了SPP块，因为它显着增加了接受野，分离出最重要的上下文特征，并且几乎没有导致网络运行速度的降低。我们使用PANet作为不同检测级别的不同骨干级别的参数聚合方法，而不是YOLOv3中使用的FPN

最后，我们选择CSPDarknet53骨干、SPP附加模块、PANet路径聚合颈和YOLOv3(基于锚点的)头作为YOLOv4的架构

Selection of BoF and BoS

为了改进目标检测训练，CNN通常使用以下方法：
对于训练激活函数，由于PReLU和SELU较难训练，而ReLU6是专门为量化网络设计的，因此我们将上述激活函数从候选列表中删除
我们毫不犹豫地选择DropBlock作为我们的正则化方法，对于归一化方法的选择，由于我们关注的是只使用一个GPU的训练策略，所以没有考虑syncBN

Additional improvements

为了使所设计的检测器更适合在单GPU上进行训练，我们进行了额外的设计和改进如下：
1.本文介绍了一种新的数据增强方法Mosaic, and Self-Adversarial Training (SAT)
2.采用遗传算法选择最优超参数
3.我们修改了一些现有的方法，使我们的设计适合于有效的训练和检测-改进的SAM，改进的PAN和交叉小批量正态化(CmBN)

（Mosaic是一种新的数据增强方法，它将4张训练图像混合在一起，因此混合了4种不同的上下文，而CutMix只混合了2个输入图像。这使得在正常环境之外的对象检测变得容易。此外，批处理规范化计算每层上4个不同图像的激活统计信息。这大大减少了对大型mini-batch大小的需求

**自对抗训练(SAT)**也代表了一种新的数据增强技术，它分为两个向前和向后的阶段。在第一阶段，神经网络改变原始图像，而不是改变网络权重。通过这种方式，神经网络对其自身进行对抗性攻击，改变原始图像以制造图像上没有期望对象的欺骗。在第二阶段，对神经网络进行训练，对修改后的图像进行正常的目标检测）

CmBN表示CBN的修改版本，如图4所示，定义为Cross mini-Batch Normalization (CmBN)。这只收集单个批内的小批之间的统计信息
我们将SAM从空间注意改为点注意，将PAN的快捷连接改为串联，分别如图5和图6所示

YOLOv4

YOLO v4 uses
Bag of Freebies (BoF) for backbone：CutMix和Mosaic数据增强，DropBlock正则化，类标签平滑
Bag of Specials (BoS) for backbone：Mish激活，跨级部分连接(CSP)，多输入加权残差连接(MiWRC)

Bag of Freebies (BoF) for detector：CIoU-loss, CmBN, DropBlock正则化，Mosaic数据增强，自对抗训练SAT，消除网格敏感性，使用多个锚点为一个ground truth，余弦退火调度程序[52]，最优超参数，随机训练形状
Bag of Specials (BoS) for detector：Mish激活，SPP-block, SAM-block, PAN路径聚合block, DIoU-NMS

Experiments

我们在ImageNet (ILSVRC 2012 val)数据集上测试了不同训练改进技术对分类器精度的影响，然后在MS COCO (test-dev 2017)数据集上测试了不同训练改进技术对检测器精度的影响

Results

与其他最先进的目标探测器获得的结果的比较如图8所示。我们的YOLOv4位于帕累托最优曲线上，在速度和精度方面都优于最快和最准确的检测器

表8列出了使用Maxwell GPU的帧率对比结果

可以是GTX Titan X (Maxwell)或Tesla M40 GPU

(MS COCO数据集上不同目标检测器的速度和精度比较(test- dev 2017)。(此处高亮显示FPS为30或更高的实时检测器。我们将结果与batch=1进行比较，而不使用tensorRT)

表9列出了使用Pascal GPU的帧率对比结果

可以是Titan X (Pascal)、Titan Xp、GTX 1080 Ti、Tesla P100 GPU

表10列出了使用Volta GPU的帧率对比结果

可以是Titan Volta或者Tesla V100 GPU

Conclusions

我们提供了一个最先进的检测器，比所有可用的替代检测器更快(FPS)和更准确(MS COCO AP 50…95和AP 50)。所描述的检测器可以在具有8-16 gb vram的传统GPU上进行训练和使用，这使得其广泛使用成为可能。基于一阶段anchor的检测器的原始概念已被证明是可行的，我们已经验证了大量的特征，并选择使用这些特征来提高分类器和检测器的准确性，这些特性可以作为未来研究和开发的最佳实践

ResNet（Residual Network）不想秃头的程序神经网络语音识别人工智能深度学习网络残差网络神经网络
ResNet（ResidualNetwork）是深度学习中一种经典的卷积神经网络（CNN）架构，由微软研究院的KaimingHe等人在2015年提出。它通过引入残差连接（SkipConnection）解决了深度神经网络中的梯度消失问题，使得网络可以训练极深的模型（如上百层），并在图像分类、目标检测、语义分割等任务中取得了突破性成果。以下是ResNet的详细介绍：一、核心思想ResNet的核心创新是
onnx-web + yolov8n 在视频流里做推理 CHEN_RUI_2200 人工智能 YOLO
顺着我上一篇文章使用onnxruntime-web运行yolov8-nano推理继续说，有朋友在问能不能接入视频流动，实时去识别物品。首先使用getUserMedia获取摄像头视频流getUserMediaAPI可以访问设备的摄像头和麦克风。你可以使用这个API获取视频流，并将其显示在页面上的标签中。注意事项：浏览器支持：getUserMedia被现代浏览器大多数支持，但在一些旧版浏览器上可能不兼
使用YOLOv5-ONNX-PyQT-EXE: 全栈式对象检测应用的构建与部署
使用YOLOv5-ONNX-PyQT-EXE:全栈式对象检测应用的构建与部署去发现同类优质开源项目:https://gitcode.com/在计算机视觉领域，实时对象检测是一个至关重要的任务。是一个开源项目，它将流行的YOLOv5对象检测模型集成到ONNX(OpenNeuralNetworkExchange)中，并通过PyQT构建了一个可执行的应用程序，使得非开发人员也能轻松地进行对象检测。项目简
基于YOLOv8的桃子成熟度检测系统，支持图片、视频、摄像头输入，PyQt5界面检测。识别并分类桃子的成熟度（未熟、半熟、成熟） QQ67658008 YOLO 音视频 qt 桃子成熟水果成熟度检测系统
基于YOLOv8的桃子成熟度检测系统，支持图片、视频、摄像头输入，PyQt5界面检测。识别并分类桃子的成熟度（未熟、半熟、成熟）文章目录调用示例加载预训练模型开始训练加载训练好的模型在验证集上评估加载训练好的模型文字及代码仅供参考。桃子成熟度分类检测数据集，主要用于桃子成熟度分类检测应用任务数据背景：模拟实际田间条件，涵盖多种可能影响桃子检测准确性的因素，如变化的自然光照强度、多果粘连现象以及由枝
YOLOv5-7.0解决报错 wandb: Network error (TransientError), entering retry loop. Paper Clouds Yolo目标检测 YOLO 人工智能机器学习 python pytorch 深度学习目标检测
前言最近在复习yolov5目标检测代码时用了yolov5的最新7.0版本，之前用的是5.0版本，这一新版本相对于之前做了一些提升，对于package的兼容也要好了很多，但也不是说下载了直接就能运行，实际使用过程中还是遇到了许多新的问题，下面就我自己碰到的问题提出解决方法。问题wandb是非常好用的可视化工具，但是国内的话，使用时常常会无法同步数据，需要借助魔法来连接服务器，而yolov5的源码恰恰
C++ OpenCV4 实现鱼眼镜头矫正朝风工作室 c++开发语言
一、为什么需要鱼眼镜头矫正？鱼眼镜头通过特殊的光学设计实现180°甚至更广的视野，广泛应用于全景相机、自动驾驶、安防监控等领域。但这种广角特性会引入严重的桶形畸变：直线边缘会向内弯曲（如图像边缘的门框变成弧线），物体尺寸在边缘区域会被拉伸。矫正的核心目标：将鱼眼镜头拍摄的畸变图像还原为接近人眼视觉的正常图像，便于后续的目标检测、图像拼接等处理。矫正前后效果对比（此处可插入图片）矫正前图像（鱼眼畸变
使用随机森林实现目标检测司南锤 python基础学习 AI 随机森林
核心实现思路滑动窗口策略：在图像上滑动固定大小的窗口，对每个窗口进行分类多维特征提取：结合统计特征、纹理特征、边缘特征、形状特征等随机森林分类：训练二分类器判断窗口是否包含目标后处理优化：使用非极大值抑制减少重复检测特征工程的重要性LBP纹理特征：捕捉局部纹理模式灰度共生矩阵：描述纹理的统计特性边缘密度：反映目标边界信息形状描述符：圆形度、面积比等几何特征实际应用建议数据收集：收集大量正负样本进行
基于 opencv+yolov8+easyocr的车牌追踪识别（ECUT）Edward-tan 人工智能--CV python进阶全栈开发 opencv yolov8 ocr python
（本项目所有代码打包至我的资源中，大家可在我的文章底部选择下载）目录需求实现效果学习视频大致思路代码实现资源下载需求通过车辆识别技术，识别视频中每个车辆及其车牌号，车辆应进行追踪，避免重复计数量。实现效果车牌识别学习视频使用Python、Yolov8和EasyOCR自动识别车牌计算机视觉教程_哔哩哔哩_bilibili大致思路通过opencv将视频转换为帧，对帧应用车辆识别模型，并使用model.
深度学习应用于情感识别：利用YOLOv8进行AffectNet情感分类 YOLO实战营深度学习 YOLO 分类人工智能目标检测目标跟踪数据挖掘
引言情感识别（EmotionRecognition）是计算机视觉和自然语言处理中的一个重要研究方向，广泛应用于人机交互、智能客服、心理健康监测、视频分析等领域。随着深度学习技术的发展，情感识别取得了显著进展，特别是在面部表情识别方面。面部表情作为人类情感的自然表现之一，能在很大程度上反映个体的情感状态。AffectNet数据集是一个广泛使用的情感识别数据集，它包含了大量带有标注情感标签的面部表情图
如何使用YOLOv8对遥感图像中的滑坡-泥石流进行分割深度学习遥感图像滑坡泥石流分割数据集的训练及应用计算机C9硕士_算法工程师 YOLO 深度学习人工智能
如何使用YOLOv8对遥感图像中的滑坡-泥石流进行分割深度学习遥感图像滑坡泥石流分割数据集的训练及应用文章目录遥感图像滑坡-泥石流分割数据集情况数据集概述类别统计总体统计注意事项✅一、安装CUDA驱动（Linux示例）✅二、安装Anaconda（Linux示例）✅三、创建Python虚拟环境并安装依赖✅四、数据集结构示例（遥感图像滑坡-泥石流分割）✅五、创建data.yaml文件（用于训练）✅六、
深度学习目标检测中使用YOLOv8训练树冠检测数据集，从环境设置、数据准备、模型训练、推理和结果可视化计算机C9硕士_算法工程师深度学习目标检测 YOLO
深度学习目标检测中使用YOLOv8训练树冠检测数据集，从环境设置、数据准备、模型训练、推理和结果可视化文章目录1.环境设置2.数据准备3.模型训练4.推理与结果可视化推理代码示例5.构建可视化界面PyQt5GUI代码示例总结以下文字及代码仅供参考。树冠检测数据集的训练及推理1使用YOLOv8训练树冠检测数据集，从环境设置、数据准备、模型训练、推理和结果可视化等方面进行详细介绍。1.环境设置首先确保
学习昇腾开发的第8天派晟电子工作室学习昇腾
1、目标检测样例：MindXSDK应用开发入门-Atlas200IDKA2开发者套件23.0.RC3-昇腾社区配置环境变量。：./usr/local/Ascend/mxVision/set_env.sh2、修改IP地址：以root用户名登录开发者套件。打开配置文件。Ubuntu操作系统：执行cd/etc/netplan命令进入“netplan”目录，执行ll命令查看目录下是否有类似“xxxx-ne
DFT ATPG中core chain 和wrap chain区别芯作者 DFT技术分享智能硬件硬件工程
在DFT（可测试性设计）中，CoreChain（核心扫描链）和WrapChain（封装扫描链）是两种不同的扫描链结构，分别服务于内部逻辑测试（Intest）和互连测试（Extest）。它们的核心区别如下：一、本质区别特性CoreChain（核心扫描链）WrapChain（封装扫描链）作用对象芯片内部逻辑单元（如寄存器、组合逻辑）芯片I/O端口（输入/输出引脚）测试目标检测内部故障（Stuck-At
Python 人工智能Ai视觉模型 YOLOv8 GHY云端大师 python AI 大模型视觉训练人工智能 YOLO
YOLOv8简介：Python中的高效AI视觉模型YOLOv8是Ultralytics公司开发的最新目标检测模型，属于YOLO(YouOnlyLookOnce)系列的最新版本，以其高效和准确著称。核心特点高性能：在速度和精度之间取得了更好的平衡多功能：支持目标检测、实例分割和图像分类用户友好：简化了API设计，更易于使用可扩展性：支持从移动端到云端的多种部署场景主要改进更高的检测精度更快的推理速度
Yolov5 ONNX Runtime 的 Python 部署爱钓鱼的歪猴 #目标检测模型部署 YOLO
这里使用的yolov56.2，使用export.py很方便地得到onnx格式的模型。然后用onnxruntime推理框架在Python上进行部署。主要是为了测试模型的准确，模型部署的最终是用C++部署，从而部署在嵌入式设备等。整个代码分为四个部分：1、对输入进行预处理；2、onnxruntime推理得到输出；3、对输出进行后处理4、画预测框代码的难点是nms处理。代码尚存在的缺陷是，将输入图像处理
一[3.0]、 yolov8 工作原理他人是一面镜子，保持谦虚的态度车道检测研究 YOLO
目录YOLOv8简介什么是YOLOv8？yaml配置文件解析YOLOv8架构图Yolov8有什么新功能？YOLO模型彻底改变了计算机视觉领域。识别物体是计算机视觉中的一项关键任务，可应用于机器人、医学成像、监控系统和自动驾驶汽车等多个领域。YOLO模型的最新版本YOLOv8是一种先进的实时物体检测框架，引起了研究界的关注。在所有流行的物体识别机器学习模型（如FasterR-CNN、SSD和Reti
轻量化与性能双提升：YOLOv8中的Slim-Neck特征融合创新【YOLOv8】程序员Gloria YOLO 目标跟踪 YOLOv8
本专栏专为AI视觉领域的爱好者和从业者打造。涵盖分类、检测、分割、追踪等多项技术，带你从入门到精通！后续更有实战项目，助你轻松应对面试挑战！立即订阅，开启你的YOLOv8之旅！专栏订阅地址：https://blog.csdn.net/mrdeam/category_12804295.html文章目录轻量化与性能双提升：YOLOv8中的Slim-Neck特征融合创新YOLOv8的Neck结构Slim
AI人工智能目标检测在体育赛事中的应用 AI大模型应用之禅人工智能目标检测计算机视觉 ai
AI人工智能目标检测在体育赛事中的应用关键词：目标检测、计算机视觉、深度学习、体育分析、YOLO、运动员追踪、比赛统计摘要：本文深入探讨了AI目标检测技术在体育赛事中的创新应用。我们将从计算机视觉基础出发，详细分析目标检测的核心算法原理，特别是YOLO系列模型在运动员和球类追踪中的实现方式。文章包含完整的数学模型解释、Python实战项目演示，以及在实际体育场景中的应用案例分析。最后，我们展望了这
【推理加速】TensorRT C++ 部署YOLO11全系模型 gloomyfish c++开发语言
YOLO11YOLO11C++推理YOLO11是Ultralytics最新发布的目标检测、实例分割、姿态评估的系列模型视觉轻量化框架，基于前代YOLO8版本进行了多项改进和优化。YOLO11在特征提取、效率和速度、准确性以及环境适应性方面都有显著提升，达到SOTA。TensorRTC++SDK最新版本的TensorRT10.x版本已经修改了推理的接口函数与查询输入输出层的函数，其中以YOLO11对
YOLO + OpenVINO 在英特尔平台部署实战：性能调优与跨架构加速全流程指南
YOLO+OpenVINO在英特尔平台部署实战：性能调优与跨架构加速全流程指南关键词：YOLOv5、YOLOv8、OpenVINO、英特尔部署、IR模型、异构加速、CPU推理、VPU、GPU、多设备调度、边缘计算摘要：本篇文章聚焦如何使用OpenVINO在英特尔平台高效部署YOLO系列目标检测模型，结合当前主流的YOLOv5与YOLOv8架构，详解模型格式转换、推理接口调用、多设备异构调度与性能优
深度解析YOLOv8：CSPHet卷积结构如何实现极致轻量化向哆哆 YOLO创新涨点系列 YOLO yolov8 架构目标检测机器学习
文章目录一、背景介绍1.1YOLOv8的现状1.2降参数的必要性二、相关技术介绍2.1Dual思想2.2HetConv三、CSPHet结构设计3.1CSP模块的改进3.2结合HetConv3.3参数量的下降四、CSPHet的代码实现五、实验结果六、总结与展望在目标检测领域，YOLO系列算法一直以其卓越的速度和准确率受到广泛关注。随着深度学习技术的不断发展，研究人员不断探索如何进一步优化YOLO算法
【深度学习加速探秘】Winograd 卷积算法：让计算效率 “飞” 起来 heimeiyingwang 算法深度学习算法人工智能
一、为什么需要Winograd卷积算法？从“卷积计算瓶颈”说起在深度学习领域，卷积神经网络（CNN）被广泛应用于图像识别、目标检测、语义分割等任务。然而，卷积操作作为CNN的核心计算单元，其计算量巨大，消耗大量的时间和计算资源。随着模型规模不断增大，传统卷积算法的计算效率成为限制深度学习发展的一大瓶颈。Winograd卷积算法的出现，犹如一把利刃，直击传统卷积计算的痛点。它通过巧妙的数学变换，大幅
深入研究YOLO算法改进中的注意力机制周立-ric
本文还有配套的精品资源，点击获取简介：YOLO算法因其高效和准确而在实时目标检测领域备受青睐。注意力机制的引入对YOLO算法的性能提升起到了关键作用，尤其是通过关注图像关键区域来提高检测精度。注意力机制可以细分为通道注意力、空间注意力、自注意力、多尺度注意力和位置感知注意力等类型，每种类型的注意力机制都旨在优化模型对图像特征的理解和处理。本文档提供了一个包含实现这些注意力机制的代码的压缩包，并介绍
YOLO11改进|注意力机制篇|引入注意力机制Shuffle Attention 如果能为勤奋颁奖 YOLO11改进专栏 YOLO
目录一、【ShuffleAttention】注意力机制1.1【ShuffleAttention】注意力介绍1.2【ShuffleAttention】核心代码二、添加【ShuffleAttention】注意力机制2.1STEP12.2STEP22.3STEP32.4STEP4三、yaml文件与运行3.1yaml文件3.2运行成功截图一、【ShuffleAttention】注意力机制1.1【Shuff
yolov11转ncnn model2005 YOLO ncnn
yolo模型pt格式文件转ncnn，以适用于移动端的部署。原先要经过onnx，onnxsim等转换，cmake编译，现直接可生成(如何从YOLO11导出到NCNN以便顺利部署)。fromultralyticsimportYOLO#LoadtheYOLO11modelmodel=YOLO("yolo11s.pt")#ExportthemodeltoNCNNformatmodel.export(for
目标检测——YOLOX算法解读
论文：YOLOX:ExceedingYOLOSeriesin2021(2021.7.18)作者：ZhengGe,SongtaoLiu,FengWang,ZemingLi,JianSun链接：https://arxiv.org/abs/2107.08430代码：https://github.com/Megvii-BaseDetection/YOLOXYOLO系列算法解读：YOLOv1通俗易懂版解读、
目标检测——YOLO11算法解读 lishanlu136 #目标检测目标检测 YOLO11 YOLO系列算法解读
作者：Ultralytics公司代码：https://github.com/ultralytics/ultralyticsYOLO系列算法解读：YOLOv1通俗易懂版解读、SSD算法解读、YOLOv2算法解读、YOLOv3算法解读、YOLOv4算法解读、YOLOv5算法解读、YOLOR算法解读、YOLOX算法解读、YOLOv6算法解读、YOLOv7算法解读、
（二十一）YOLO 全解析：从实时目标检测到多任务视觉智能只有左边一个小酒窝深度学习 YOLO 目标检测人工智能深度学习计算机视觉
1YOLO的发展脉络与技术定位1.1发展脉络YOLOv1（2015年）：将目标检测重新定义为单一回归问题，把输入图像划分为S×S网格，每个网格单元负责预测固定数量的边界框及对应的类别概率，直接从像素回归预测物体的边界框坐标和类别概率。但存在小目标检测能力弱、定位精度不足等局限。YOLOv2（2016年）：引入批量归一化、锚框、维度集群等技术，还提出了高分辨率分类器、直接位置预测、细粒度特征融合、多
使用预训练权重在YOLO模型上训练新数据集的完整指南马里马里奥- YOLO 目标跟踪人工智能
使用预训练权重在YOLO模型上训练新数据集的完整指南引言在目标检测领域，迁移学习已成为提升模型性能的关键技术。本文将详细介绍如何利用预训练权重在YOLO（YouOnlyLookOnce）框架上训练自定义数据集，帮助您节省训练时间并提高检测精度。为什么使用预训练权重？加速收敛：预训练模型已学习通用特征，训练时间可缩短30%−70%30\%-70\%30%−70%小样本适配：在数据量有限时（n<100
Python与C++检测框过滤差异分析马里马里奥- python c++开发语言人工智能
Python与C++检测框过滤差异分析在目标检测任务中，检测框过滤是后处理的关键环节。本文将从实现方式、性能表现和适用场景三个维度，对比分析Python与C++在检测框过滤中的差异。检测框过滤基本原理检测框过滤的核心是非极大值抑制(NMS)算法，其数学表达式为：NMS(B,S,θ)={bi∣∀bj,area(bi∩bj)area(bi∪bj)0:i=order[0]keep.append(i)xx
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不