羞儿

【读点论文】PP-YOLOE: An evolved version of YOLO，面向友好部署的模型设计，为项目后续产业落地提供了更加有效的参考

PP-YOLOE: An evolved version of YOLO

Abstract

在本报告中，我们介绍了PP-YOLOE，一种具有高性能和友好部署的工业最先进的目标探测器。我们在之前的PP-YOLOv2的基础上进行优化，采用无锚模式，更强大的骨干和颈部配备CSPRepResStage, ET-head和动态标签分配算法TAL。我们为不同的实践场景提供s/m/l/x模型。结果，pp - yoloe - 1在COCO测试开发上实现了51.4 mAP，在Tesla V100上实现了78.1 FPS，与之前的先进工业车型PP-YOLOv2和YOLOX相比，分别实现了(+1.9 AP， +13.35%提速)和(+1.3 AP， +24.96%提速)的显著提升。在TensorRT和fp16精度下，PP-YOLOE推理速度达到149.2 FPS。我们还进行了大量的实验来验证我们设计的有效性。源代码和预训练模型可在PaddleDetection PaddlePaddle/PaddleDetection: Object Detection toolkit based on PaddlePaddle. It supports object detection, instance segmentation, multiple object tracking and real-time multi-person keypoint detection. (github.com)。
论文地址：[2203.16250] PP-YOLOE: An evolved version of YOLO (arxiv.org)
首先PP-YOLOE-l 在COCO数据集上达到了51.4mAP。相比较PP-YOLOv2提升1.9AP和13.35%的速度，相比较YOLOX提升1.3AP和24.96%的速度。PP-YOLOE中主要的改进点是：anchor-free，powerful backbone and neck，TAL动态label assign，ET-head。
该检测器的设计机制包括：Anchor free无锚盒机制，可扩展的backbone和neck，由CSPRepResStage(CSPNet+RMNet)构成，使用Varifocal Loss(VFL)和Distribution focal loss(DFL)的头部机制ET-head，动态标签分配算法Task Alignment Learning（TAL）

Introduction

单级目标检测器由于具有良好的速度和精度平衡，在实时应用中很受欢迎。单级探测器中最突出的结构是YOLO系列。自YOLOv1以来，YOLO系列目标检测器在网络结构、标签分配等方面发生了巨大的变化。目前，YOLOX在Tesla V100上以68.9 FPS的速度实现了50.1 mAP的速度和精度的最佳平衡。
YOLOX引入了先进的无锚方法，配备了动态标签分配，提高了探测器的性能，在精度上明显优于YOLOv5。受YOLOX的启发，我们进一步优化了之前的作品PP-YOLOv2。PP-YOLOv2是一款高性能一级探测器，在特斯拉V100上具有49.5 mAP, 68.9 FPS的速度。在PP-YOLOv2的基础上，提出了YOLO的演进版本，命名为PP-YOLOE。PP-YOLOE避免使用可变形卷积和矩阵NMS等算子，以便在各种硬件上得到很好的支持。此外，PPYOLOE可以轻松扩展到具有不同计算能力的各种硬件的一系列模型。这些特点进一步推动了PP-YOLOE在更广泛的实际场景中的应用。
如图所示，PP-YOLOE在速度和精度权衡方面优于YOLOv5和YOLOX。具体而言，pp - yoloe - 1以 78.1 FPS的速度在640 × 640分辨率的COCO上实现了51.4 mAP，比pp - yolo2 和yolox - 1分别高出1.9%和1.3% AP。此外，PP-YOLOE有一系列型号，可以像YOLOv5一样通过宽度乘倍器和深度乘倍器进行简单配置。我们的代码已经在PaddleDetection上发布，支持TensorRT和ONNX。
- PP-YOLOE与其他先进型号的比较。pp - yoloe - l在COCO测试开发上实现了51.4 mAP，在Tesla V100上实现了78.1 FPS，比pp - yoloe - v2获得了1.9 AP和9.2 FPS的提升。
PP-YOLOv2的总体情况包括：（1）backbone：具有可变形卷积的ResNet50-vd；（2）neck：具有SPP层的PAN，DropBlock；（3）head：轻量级的IoU感知；（4）激活函数：在backbone中使用ReLU激活，neck中使用Mish激活；（5）标签分配：为每个ground truth目标分配一个anchor box；（6）损失：分类损失、回归损失、目标损失，IoU损失和IoU感知损失；
PP-YOLOE是基于PP-YOLOv2的卓越的单阶段Anchor-free模型，超越了多种流行的YOLO模型。PP-YOLOE有一系列的模型，即s/m/l/x，可以通过width multiplier和depth multiplier配置。PP-YOLOE避免了使用诸如Deformable Convolution或者Matrix NMS之类的特殊算子，以使其能轻松地部署在多种多样的硬件上。
PPYOLOE中的anchor free方法，主要就是将之前anchor base中预测相较于anchor的xywh，改进为预测ltrb(left,top,right,bottom)，并将ltrb结果乘上当前特征图的stride。

Method

在本节中，我们将首先回顾我们的基线模型，然后从网络结构、标签分配策略、头部结构和损失函数等方面详细介绍PP-YOLOE的设计(下图)。
- 我们PP-YOLOE的模型架构。主干是CSPRepResNet，颈部是Path Aggregation Network (PAN)，头部是Efficient Task-aligned head (ET-head)。

A Brief Review of PP-YOLOv2

PP-YOLOv2的整体架构包括具有可变形卷积的ResNet50-vd 主干、具有SPP层和DropBlock的PAN主干和轻量级IoU感知头。在PPYOLOv2中，主干使用ReLU激活函数，颈部使用mish激活函数。继YOLOv3之后，PP-YOLOv2只为每个 GT 值对象分配一个锚框。除了分类损失、回归损失和对象损失外，PP-YOLOv2还使用IoU损失和IoU感知损失来提高性能。

Improvement of PP-YOLOE

Anchor-free。如上所述，PP-YOLOv2以基于锚点的方式分配基础真理。然而，锚定机制引入了许多超参数，并且依赖于手工设计，这可能不能很好地推广到其他数据集。基于以上原因，我们在PP-YOLOv2中引入无锚法。根据FCOS[26]在每个像素上贴合一个锚点，我们为三个检测头设置上下限，将ground truth分配给相应的feature map。然后，计算边界框的中心，选择最接近的像素作为正样本。根据YOLO序列，预测一个四维向量(x, y, w, h)进行回归。这个修改使模型更快了一点，损失了0.3 AP，如表2所示。虽然根据PPYOLOv2的锚点尺寸仔细设置了上界和下界，但基于锚点和无锚点的赋值结果仍然存在一些小的不一致，这可能导致精度下降不大。PPYOLOE解析1 Backbone - 飞桨AI Studio (baidu.com)
Backbone and Neck。残差连接和密集连接在现代卷积神经网络中得到了广泛的应用。残差连接引入了解决梯度消失问题的捷径，也可以看作是一种模型集成方法。密集连接集合了具有不同接收域的中间特征，在目标检测任务中表现出良好的性能。CSPNet利用跨级密集连接来降低计算负担而不损失精度，这种方法在YOLOv5、YOLOX等有效的目标检测器中很流行。VoVNet和随后的TreeNet在对象检测和实例分割方面也表现出优异的性能。受这些作品的启发，我们提出了一种结合残差连接和密集连接的新型RepResBlock，用于我们的Backbone and Neck。
源自TreeBlock，我们的RepResBlock在训练阶段如下图(b)所示，在推理阶段如下图©所示。首先，我们对原始TreeBlock进行简化(下图(a))。然后，我们用元素相加操作代替连接操作(下图(b))，因为RMNet在某种程度上显示了这两种操作的近似。因此，在推理阶段，我们可以将RepResBlock重新参数化为ResNet-34以RepVGG风格使用的基本残差块(下图©)。
- 我们的RepResBlock和CSPRepResStage的结构
我们使用所提出的RepResBlock来构建Backbone and Neck。与ResNet类似，我们的主干名为CSPRepResNet，包含一个由三个卷积层组成的主干，以及由我们的RepResBlock堆叠的四个后续阶段，如上图(d)所示。在每一步中，采用跨阶段部分连接，避免了大量 3 × 3 卷积层带来的大量参数和计算负担。ESE(有效挤压和提取)层也用于在构建主干时在每个CSPRepResStage中施加信道注意。我们在PP-YOLOv2之后使用所提出的RepResBlock和CSPRepResStage构建颈部。与主干不同的是，主干去掉了RepResBlock中的残差链接和CSPRepResStage中的ESE层。
我们使用宽度乘法器α和深度乘法器β像YOLOv5一样对基本 Backbone and Neck 进行联合缩放。因此，我们可以得到一系列具有不同参数和计算量的检测网络。基本骨干宽度设置为[64,128,256,512,1024]。除主干外，基本主干的深度设置为[3,6,6,3]。基本颈宽设置为[192,384,768]，深度设置为3。下表给出了不同模型的宽度乘法器α和深度乘法器β的规格。
- 宽度乘法器α和深度乘法器β规范的一系列网络
这样的修改使AP性能提高了0.7%，即49.5%，如下表所示。
- pp - yoloe - l在COCO val上的烧蚀研究。我们使用640×640分辨率作为输入，采用fp32精度，在特斯拉V100上进行测试，不进行后处理。
任务一致性学习(TAL)。为了进一步提高准确性，标签分配是另一个需要考虑的方面。YOLOX使用SimOTA作为标签分配策略来提高性能。然而，为了进一步克服分类和定位的错位，在 TOOD 中提出了任务对齐学习(task alignment learning, TAL)，它由动态标签分配和任务对齐损失组成。动态标签分配意味着预测/损失意识。根据预测，为每个真值分配动态的正锚点个数。通过显式地对齐这两个任务，TAL可以同时获得最高的分类分数和最精确的边界框。在PP-YOLOE训练时，前5个epoch是使用ATSS中的分配方式，后续的epochs才使用TAL作为label assign方式。主要原因是TAL需要模型具有一定表现的基础上，才能具有比较好的分配效果。
比较值得注意的是，往常我们在计算class分支的loss时候，使用BCEloss时候，输入分别是pred_score和label_one_hot向量。而在PP-YOLOE中，将label_one_hot向量替换成了TAL分配时的alignment metric。alignment metric中分数越高，就意味着越是高质量样本，模型希望高质量样本拥有更高的class score。
对于与任务对齐的损失，TOOD使用一个归一化的 t，即 $\hat{t}$ 来代替损失中的目标。它采用每个实例中最大的IoU作为规范化。分类的二进制交叉熵(Binary Cross Entropy, BCE)可以重写为:
- $L_{cls-pos}=\sum_{i=1}^{N_{pos}}BCE(p_i,\hat{t_i}),(1)$
我们研究了使用不同标签分配策略的性能。本文以CSPRepResNet为骨干，在上述改进的模型上进行了实验。为了快速得到验证结果，我们只在COCO train2017上训练了36个epoch，并在COCO val上进行验证，如下表所示，TAL达到了最佳的45.2% AP性能。我们使用TAL替代标签分配，如FCOS样式，并实现0.9% AP改进- 50.4% AP，如上表所示。
- 不同的标签分配在基本模型上。我们使用CSPRepResStage作为主干和颈部，一个1×1 conv层作为头部，在COCO train2017上只训练了36个epoch。
高效任务对齐头(ET-head)。在目标检测中，分类与定位之间的任务冲突是一个众所周知的问题。许多文献都提出了相应的解决方案。YOLOX的解耦头吸取了大多数一级和二级检测器的经验，并成功应用于YOLO模型，提高了精度。但是，解耦的头部可能会使分类和定位任务分离和独立，缺乏针对任务的学习。在TOOD的基础上，我们改进了头，提出了以速度和精度为目标的ET-head。如图上所示，我们使用ESE取代了tod中的层关注，将分类分支的对齐简化为shortcut，将回归分支的对齐替换为分布焦损(distributed focal loss, DFL)层。通过上述变化，ET-head在V100上增加了0.9ms。
对于分类和定位任务的学习，我们分别选择了变焦损失(VFL)和分布焦损失(DFL)。PP-Picodet成功地将VFL和DFL应用于目标检测器，并获得了性能提升。对于VFL，与[Generalized focal loss]中的质量焦点损失(quality focal loss, QFL)不同，VFL使用目标分数来加权阳性样本的损失。这种实现使得高IoU的阳性样本对损失的贡献相对较大。这也使得模型在训练时更加关注高质量的样本，而不是那些低质量的样本。相同的是，两者都使用IACS作为预测的目标。这可以有效地学习分类分数和定位质量估计的联合表示，使训练和推理之间具有较高的一致性。对于DFL，为了解决边界框表示不灵活的问题，[Generalized focal loss]提出使用一般分布来预测边界框。我们的模型由损失函数监督:
- $Loss=\frac{\alpha·Loss_{VFL}+\beta ·Loss_{GIOU}+\gamma ·Loss_{DFL}}{\sum^{N_{pos}}_i\hat t},(2)$
- 其中， $\hat t$ 表示归一化目标得分，见式(1)。如上表所示，ET-head获得0.5% AP改善- 50.9% AP
分类分支：VFL提出了非对称的加权操作。正负样本有不平衡的问题，同样在正样本中也有不等权的问题，意思就是要更多的发现有价值的正样本。在为负样本的时候，不同的负样本的weight主要由当前pred_score决定，pred_score越大，weight越大，loss越大。而在为正样本的时候，weight为gt_score，而gt_score来源于TAL assign时。这也就达到了①正样本和负样本权重计算方式不同，②每个正负样本在计算loss时的权重都是不同的，达到了非对称的加权操作。
回归分支：目标检测任务中做回归一般是直接预测某个回归值，或者预测相较于anchor的比例，而distribution focal loss (DFL)作者认为之前的bbox regression 采用的表示不够灵活，没有办法建模复杂场景下的uncertainty。用直接回归一个任意分布来建模框的表示可以有更好的效果。在PP-YOLOE中，将回归看作是一个分布预测任务。

Experiment

在本节中，我们给出了实验的细节和结果。所有实验都在MS COCO-2017训练集上进行训练，该训练集有80个类，118k张图像。对于消融研究，我们在5000张图像的MS COCO-2017验证集上使用具有单一尺度的标准COCO AP度量。我们使用MS COCO-2017 test-dev报告最终结果。

Implementation details

我们使用随机梯度下降(SGD)，动量= 0.9，权重衰减= 5e-4。我们使用余弦学习率计划，总epochs为300次，热身次数为5次，基本学习率为0.01。在8 × 32 G V100 GPU设备上，总批大小默认为64个，我们遵循线性缩放规则来调整学习率。在训练过程中也采用衰减= 0.9998的指数移动平均(EMA)策略。我们只使用一些基本的数据增强，包括随机裁剪、随机水平翻转、颜色失真和多尺度。特别地，输入大小均匀地从320绘制到768，步幅为32。

Comparsion with Other SOTA Detectors

下表显示了MS-COCO测试分裂与其他最先进的目标检测器的结果比较。我们使用官方代码库重新评估YOLOv5和YOLOX，因为它们有非预定的更新。我们比较了批处理大小= 1(没有数据预处理和非最大抑制)的模型推理速度。而PP-YOLOE系列采用桨叶推理引擎。此外，为了公平比较，我们还在相同的环境下测试了基于tensorRT 6.0的FP16精度速度。应该强调的是，PaddlePaddle2正式支持用于模型部署的tensorRT。因此，PPYOLOE可以直接使用带有tensorRT的桨叶推理，其他测试遵循官方指南。
- 不同目标检测器在COCO 2017测试开发中的速度和精度比较。标注“+”的结果为官方发布的更新结果。用“*”标记的结果在我们的环境中使用官方代码库和模型进行测试。在验证和速度测试中，YOLOv5的输入大小不是640 × 640的平方，所以我们在表中跳过它。默认精度的速度是FP32的无trt和FP16的有trt。此外，我们为YOLOX w/o trt场景提供了FP32和FP16, FP32的速度在分割线的左侧，FP16的速度在右侧。PP-YOLOE+使用在Objects365数据集上预训练的模型。

Conclusion

在本报告中，我们提出了PPYOLOv2的几个更新，包括可扩展的主干颈架构，高效的任务对齐头，先进的标签分配策略和改进的目标损失函数，形成了一系列高性能的目标检测器，称为PP-YOLOE。同时，我们提出了s/m/l/x模型，可以覆盖不同的实际场景。此外，在PaddlePaddle官方支持下，这些模型可以顺利过渡到部署。我们希望这些令人鼓舞的设计可以为开发人员和研究人员提供灵感。
Backbone 翻译为主干网络的意思，既然说是主干网络，就代表其是网络的一部分，那么是哪部分呢？翻译的很好，主干部分，哈哈哈哈，文字游戏了哈。这个主干网络大多时候指的是提取特征的网络，其作用就是提取图片中的信息，共后面的网络使用。这些网络经常使用的是resnet VGG等，而不是我们自己设计的网络，因为这些网络已经证明了在分类等问题上的特征提取能力是很强的。在用这些网络作为backbone的时候，都是直接加载官方已经训练好的模型参数，后面接着我们自己的网络。让网络的这两个部分同时进行训练，因为加载的backbone模型已经具有提取特征的能力了，在我们的训练过程中，会对他进行微调，使得其更适合于我们自己的任务。(14 封私信 / 80 条消息) 深度学习网络中backbone是什么意思? - 知乎 (zhihu.com)

SAHI：超大图片中对小目标检测的切片辅助超推理库

目标检测和实例分割是迄今为止计算机视觉中最重要的应用领域。然而，小物体的检测和大图像的推理仍然是实际使用中的主要问题。切片推理的概念基本上是；对原始图像的较小切片执行推理，然后合并原始图像上的切片预测。可以用下图表示：
为了提高你的模型在小目标上的性能，推荐以下技术：medium.com
- 提高图像采集的分辨率
- 增加模型的输入分辨率
- tile你的图像
- 通过增强生成更多数据
- 自动学习模型anchors
- 过滤掉无关的类别
检测小物体的另一个重要策略是将图像切割后形成batch，这个操作叫做tile，作为预处理步骤。tile可以有效地将检测器聚焦在小物体上，但允许你保持所需的小输入分辨率，以便能够运行快速推断。

企业级知识库私有化部署：腾讯混元+云容器服务TKE实战大熊计算机 #腾讯云语言模型
1.背景需求分析在金融、医疗等数据敏感行业，企业需要构建完全自主可控的知识库系统。本文以某证券机构智能投研系统为原型，演示如何基于腾讯混元大模型与TKE容器服务实现：千亿级参数模型的私有化部署金融领域垂直场景微调高并发低延迟推理服务全链路安全合规方案1.1典型技术挑战#性能基准测试数据（单位：QPS）|场景|裸机部署|容器化部署|优化后||--------------------|--------
Memfault 简介及在Nordic nRF91 系列 DK的应用
1：Memfault是一个云平台，它允许您和您的团队持续监控设备、调试固件问题，并将OTA更新部署到您的设备群，从而以软件的速度交付硬件产品。Memfault以嵌入式优先：支持运行在任何实时操作系统（RTOS）或Android、Linux等操作系统上的嵌入式系统和设备它适用于任何设备：从功能强大的SoC一直到功能受限的MCU，Memfault都能适配您设备的可用闪存、RAM和带宽我们的SDK是专为
GitHub Actions与AWS OIDC实现安全的ECR/ECS自动化部署 ivwdcwso 运维与云原生 github aws 安全 ecr ecs oldc CI/CD
引言在现代云原生应用开发中，实现安全、高效的CI/CD流程至关重要。本文将详细介绍如何利用GitHubActions和AWSOIDC（OpenIDConnect）构建一个无需长期凭证的安全部署管道，将容器化应用自动部署到AmazonECR和ECS服务。架构概述整个解决方案的架构包含三个主要部分：GitHub端：代码仓库和GitHubActions工作流AWS端：OIDC身份验证、ECR容器仓库和E
AWS Lambda与RDS连接优化之旅 t0_54manong 编程问题解决手册 aws 云计算个人开发
在云计算的时代，AWSLambda与RDS的结合为开发者提供了高效且灵活的解决方案。然而，在实际应用中，我们常常会遇到一些性能瓶颈。本文将通过一个真实案例，探讨如何优化AWSLambda与RDS之间的连接，以提高API的响应速度。背景介绍最近，我们在AWS上部署了一个使用Dotnet6开发的API，它通过APIGateway暴露给外部，并连接到同VPC内的MySQLAuroraRDS数据库。部署前
Spring Cloud 微服务架构部署模式 Java技术栈实战架构 spring cloud 微服务 ai
SpringCloud微服务架构部署模式：从单体到云原生的进化路径关键词：SpringCloud、微服务架构、部署模式、容器化、Kubernetes、服务网格、DevOps摘要：本文系统解析SpringCloud微服务架构的核心部署模式，涵盖传统物理机部署、容器化部署、Kubernetes集群编排、服务网格集成等技术栈。通过技术原理剖析、实战案例演示和最佳实践总结，揭示不同部署模式的适用场景、技术
Redis配置与优化 ?ccc? redis 数据库缓存
目录一：Redis介绍1：关系数据库与非关系型数据库2：Redis基础2.1Redis简介2.2Redis安装部署2.3配置参数3：Redis命令工具3.1redis-cli命令行工具3.2redis-benchmark测试工具4：Redis数据库常用命令4.1key相关命令4.2多数据库常用命令二：Redis持久化1：RDB和AOF的区别2：RDB和AOF的优缺点3：Redis持久化配置三：性能
三阶落地：腾讯云Serverless+Spring Cloud的微服务实战架构大熊计算机 #腾讯云架构腾讯云 serverless
云原生演进的关键挑战（1）传统微服务架构痛点资源利用率低（非峰值期资源闲置率>60%）运维复杂度高（需管理数百个容器实例）突发流量处理能力弱（扩容延迟导致P99延迟飙升）（2）Serverless的破局价值腾讯云SCF（ServerlessCloudFunction）提供：毫秒级计费粒度（成本下降40%~70%）百毫秒级弹性伸缩（支持每秒万级并发扩容）零基础设施运维同步调用异步事件用户请求API网
为什么90%企业的AI数据分析都失败了？奥威BI给出破局方案 qq_43696218 人工智能数据分析数据挖掘
一、引言：AI数据分析在数字化转型中的核心地位在当今企业全面数字化转型的背景下，‌AI数据分析已成为解锁业务增长潜力的关键钥匙。然而，市场上众多AI数据分析产品常陷入“伪需求场景”，看似前沿却难以真正落地。本文将深入探讨奥威BI如何通过其AI数据分析能力，突破伪需求，实现数据价值的最大化。二、AI数据分析：伪需求场景的挑战伪需求场景的定义与表现AI数据分析领域的伪需求场景，指的是那些表面创新实则难
Spring AI Alibaba 支持国产大模型的Spring ai框架程序员老陈头面试学习路线阿里巴巴 spring 人工智能 java
总计30万奖金，SpringAIAlibaba应用框架挑战赛开赛点此了解SpringAI：java做ai应用的最好选择过去，Java在AI应用开发方面缺乏一个高效且易于集成的框架，这限制了开发者快速构建和部署智能应用程序的能力。SpringAI正是为解决这一问题而生，它提供了一套统一的接口，使得AI功能能够以一种标准化的方式被集成到现有的Java项目中。此外，SpringAI与原有的Spring生
别再为通信发愁！机床厂PROFIBUS DP转EtherNet/IP网关应用指南，低成本实现智能升级 JIANGHONGZN PROFIBUS DP 工业通讯协议网关 ETHERNET/IP
在现代机床制造工厂中，设备间的无缝通信是实现高效、柔性生产的关键。西门子PLC（如S7-300/1500系列）作为核心控制器广泛采用PROFIBUSDP现场总线，而高端机器人系统（如FANUC、KUKA）则普遍支持EtherNet/IP协议。在这类异构网络共存的环境中，协议转换网关成为打通数据壁垒的核心枢纽。网关的核心作用与工作流程角色定位：网关作为“翻译官”，部署在西门子PLC（PROFIBUS
Nginx服务部署与配置月堂 nginx 运维
目录HTTPS访问配置（又称自签名）1、SSL简介2、HTTPS工作流程（重要）3、自留签名证书location配置作用匹配规则匹配优先级rewrite配置HTTPS访问配置（又称自签名）1、SSL简介SSL(SecureSocketsLayer）安全套接层。是由Netscape（网景）公司于1990年开发，用于保障WordWideWeb（WWW）通讯的安全。主要任务是提供私密性，信息完整性和身份
基于摩尔线程 S80 显卡在 Ubuntu 系统下双卡交火部署 DeepSeek 流量留 Deepseek 人工智能
以下是基于摩尔线程S80显卡在Ubuntu系统下双卡交火部署DeepSeek的详细教程：###一、环境准备1.**操作系统**：推荐使用Ubuntu22.04。2.**显卡驱动**：-访问摩尔线程官网，登录账号后进入产品页面，找到软件部分下载MUSASDK。-安装显卡驱动，确保驱动版本与MUSASDK兼容。3.**安装Ollama**：-官方推荐使用命令安装Ollama，但下载速度可能较慢，可前往
GitHub Actions 的深度解析与概念介绍青草地溪水旁 linux 环境配置开发管理 github linux ubuntu docker
GitHubActions核心定义GitActions是GitHub原生提供的自动化工作流引擎，允许开发者在代码仓库中直接创建、测试、部署代码。其本质是通过事件驱动（Event-Driven）的自动化管道，将软件开发中的重复任务抽象为可编排的流程。架构核心四要素工作流（Workflow）仓库中的自动化流程蓝图（.yml文件）存储在.github/workflows目录单仓库可包含多个独立工作流事件
Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
【安装Stable Diffusion以及遇到问题和总结】岁月玲珑 AI stable diffusion AI编程 AI作画
在本地安装部署StableDiffusion，需要准备好硬件环境，安装相关依赖，然后配置模型。下面为你详细介绍安装部署的步骤：一、硬件要求显卡：需要NVIDIAGPU，显存至少6GB，推荐8GB及以上。系统：Windows10/11、Linux（Ubuntu等）或macOS（需要Rosetta2）。内存：至少16GBRAM。存储空间：准备10GB以上的可用空间。二、软件准备首先要安装Python和
java毕业设计房产中介系统mybatis+源码+调试部署+系统+数据库+lw 兮兮科技 java mybatis 开发语言
java毕业设计房产中介系统mybatis+源码+调试部署+系统+数据库+lwjava毕业设计房产中介系统mybatis+源码+调试部署+系统+数据库+lw本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQL5.7/8.0源码地址
Three.js + Vue 处理glb文件过大问题（DRACOLoader加载压缩glb） printf_824 vue 与 three javascript vue.js 前端
起因，three.jsediter导出的glb文件过于庞大，导致部署后文件加载过久解决方法：第一步（得有个blender），压缩：导出时把压缩勾选上这时候我们会得到一个glb文件，但与three.jsediter导出不同的的是，这个文件引入代码中会报如下错误这个警告表明在使用THREE.GLTFLoader时，没有提供DRACOLoader实例。DRACOLoader是用于加载Draco压缩格式的
16.2 Docker多阶段构建实战：LanguageMentor镜像瘦身40%，支持500+并发1.2秒响应！少林码僧 docker langchain windows 人工智能语言模型 llama 运维
LanguageMentorAgent容器化部署与发布：Docker镜像创建与测试关键词：Docker容器化部署,多阶段构建,镜像分层优化,环境一致性,私有化模型集成1.Dockerfile最佳实践架构设计通过多阶段构建策略实现开发与生产环境分离：
Java/Kotlin 主线程IO操作全方位监控指南（实战代码+性能优化）时小雨 Android实战与技巧 android kotlin
本文涵盖从基础监控到高级诊断的全套解决方案，包含10+个可直接落地的代码示例一、为什么需要监控主线程IO？主线程IO阻塞会导致界面卡顿、响应延迟等严重问题。典型场景：文件读写阻塞UI渲染网络请求未使用异步线程数据库查询未优化日志输出同步阻塞二、代码级监控方案（Kotlin实现）1.装饰器模式监控流操作classMonitoredInputStream(privatevalorigin:InputS
DeepSeek-V3混合精度推理（FP8/BF16）原理与实战全解析 CarlowZJ DEEPSEEK-V3
目录摘要混合精度推理的背景与意义DeepSeek-V3混合精度架构设计FP8与BF16核心原理详解混合精度推理核心实现实践案例：FP8权重转BF16与推理部署常见问题与注意事项最佳实践与扩展建议总结参考资料附录：可视化图表1.摘要本文系统梳理DeepSeek-V3在FP8/BF16混合精度推理方面的架构设计与工程实现，结合源码与实际案例，帮助开发者深入理解其混合精度推理原理、工程落地方法与性能优化
一套源码搞定教育平台搭建？Web端网校系统开发详解万岳科技程序员小金教育平台开发 APP开发软件开发在线教育系统源码教育APP开发网校平台搭建 PHP uniapp
曾经线下授课、纸质教材为主的传统教育模式，逐步被智能化、在线化、个性化的“云课堂”所替代。而Web端网校系统，正成为搭建在线教育平台的核心载体。许多教育机构、企业培训部甚至个体讲师都在思考一个问题：是否可以通过一套完整的网校系统源码，就快速搭建出属于自己的在线教育平台？答案是肯定的，但背后涉及的技术、架构与运营逻辑，却远非“买个源码一部署”这么简单。今天，就以笔者在Web端网校系统开发中的实践经验
Seo新手入门，网络编辑如何写好文章（写文章技巧）魔仙堡捏泥巴 SEO
Seo新手入门，网络编辑如何写好文章（写文章技巧）概述刚入SEO门的小白在进行网站编辑的时候一定很头痛，SEO的标题怎么写？文章关键词怎么部署？注意要点都有什么？这一系列的问题，今天就让小编我来为您解答吧，文章技巧得这样写！SEO标题的重要性SEO标题就是网页的标题title在浏览器最左边最顶部显示的地方，他也是被搜索引擎当做是确定当前网页主体最主要的参数之一。为了吸引蜘蛛爬行，你的网站的标题是需
互联网医院系统源码解析：如何实现视频问诊、电子处方等核心功能？万岳科技程序员小金在线问诊APP开发智慧医疗APP 数字药店系统源码 PHP 源码互联网医院系统源码医院软件开发智慧医疗小程序医院APP开发电子处方小程序
时下，互联网医院已经不再是“新鲜词”，而是医疗机构提升服务质量、优化运营模式的重要技术手段。从挂号排队到视频问诊，从智能开方到电子处方的全流程闭环，背后的核心支撑，正是互联网医院系统源码的“底层逻辑”。那么，一套高可用、可拓展、安全合规的互联网医院系统源码，是如何实现“视频问诊”“电子处方”等关键功能的？作为软件开发行业的从业者，我们今天不妨从技术与场景双视角，聊聊这其中的实现机制与落地难点。一、
Docker 安装与配置详解——AI教你学Docker LuckyLay AI教你学Docker docker 容器运维
1.2Docker安装与配置详解本节围绕Docker的安装方法及常见配置，帮助你在不同平台上顺利部署Docker，并理解其关键配置项。一、Docker安装1.支持的操作系统Linux（主流发行版：Ubuntu、CentOS、Debian、Fedora、openSUSE等）Windows（Windows10/11Pro/Enterprise、WindowsServer2016及以上）macOS（In
Docker基本概念——AI教你学Docker LuckyLay docker 容器运维
1.1Docker概念详解1.Docker是什么？Docker是一个开源的应用容器引擎，它让开发者可以将应用及其依赖打包到一个可移植的容器（Container）中，并在任何支持Docker的Linux、Windows或macOS系统上运行。这样做极大地提升了应用的可移植性、一致性和部署效率。2.核心概念2.1镜像（Image）镜像是一个只读的模板，包含了运行容器所需的程序、库、环境变量和配置文件等
基于SpringBoot实现MQTT消息收发萧雲漢 SpringBoot spring boot spring java 中间件 iot
基于SpringBoot实现MQTT消息收发实验环境SpringBoot2.2.2.RELEASE:项目框架EMQXcommunitylatest:MQTT服务端Docker18.0.~:部署容器POM引入依赖包#pom.xmlorg.springframework.bootspring-boot-starter-integration2.2.2.RELEASEorg.springframewor
HarmonyOS开发——鸿蒙Flutter项目适配猫猫码代码 harmonyos 移动开发鸿蒙开发 flutter
随着鸿蒙HarmonyOSNext的快速发展，越来越多的开发者开始尝试将Flutter项目迁移至鸿蒙生态。本文将基于实际开发经验，从环境搭建到应用部署，详细讲解适配HarmonyNext的完整流程，并记录常见问题及解决方案。一、环境准备：搭建鸿蒙Flutter开发环境1.鸿蒙开发工具安装下载DevEcoStudio（鸿蒙官方IDE），支持Windows、macOS系统。安装完成后需登录华为开发者账
【ASP.NET Core】配置应用程序地址的N多种方法 pythonxxoo 计算机 asp.net flask python 计算机
优质资源分享学习路线指引（点击解锁）知识定位人群定位Python实战微信订餐小程序进阶级本课程是pythonflask+微信小程序的完美结合，从项目搭建到腾讯云部署上线，打造一个全栈订餐系统。Python量化交易实战入门级手把手带你打造一个易扩展、更安全、效率更高的量化交易系统下面又到了老周误人子弟的时间，今天要误大伙的话题是：找找有多少种方法可以设置ASP.NETCore应用的地址，即URL。精
小模型和大模型的区别在哪里？我非常不满意人工智能深度学习机器学习
小模型和大模型在多个方面存在显著差异，主要体现在参数量、训练与运行速度、处理数据的准确性及应用场景上。参数量：大模型通常包含数十亿甚至数万亿个参数，这使得它们能够捕捉更复杂的数据模式和关系。相比之下，小模型的参数数量相对较少，通常在几百万到几千万之间，这限制了它们处理复杂任务的能力，但同时也意味着它们可以更快地训练和部署。训练与运行速度：由于参数数量的差异，小模型的训练和推理速度通常比大模型快。这
10个基于Python的计算机视觉实战项目云博士的AI课堂基于Python计算机视觉 python 计算机视觉机器视觉人工智能
10个基于Python的计算机视觉实战项目，涵盖多个领域和应用场景，每个项目均附有GitHub地址、概述、解决的问题及应用场景：1.PCV图像处理与计算机视觉库GitHub地址:jesolem/PCV概述:提供计算机视觉基础算法的Python实现，包括图像分割、直方图均衡化、图像增强等。解决的问题:简化图像处理流程，支持快速实现算法原型。应用场景:学术研究、教学实验、图像预处理任务。2.基于朴素贝
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

【读点论文】PP-YOLOE: An evolved version of YOLO，面向友好部署的模型设计，为项目后续产业落地提供了更加有效的参考

PP-YOLOE: An evolved version of YOLO

Abstract

Introduction

Method

A Brief Review of PP-YOLOv2

Improvement of PP-YOLOE

Experiment

Implementation details

Comparsion with Other SOTA Detectors

Conclusion

SAHI：超大图片中对小目标检测的切片辅助超推理库

你可能感兴趣的:(论文笔记,YOLO,部署落地,计算机视觉)