心无旁骛~

基于YOLOv5、v7、v8的竹签计数系统的设计与实现

文章目录

前言
效果演示
一、实现思路
- - ① 算法原理
  - ② 程序流程图
二、系统设计与实现
三、模型评估与优化
- - ① Yolov5
  - ② Yolov7
  - ③Yolov8
四、模型对比

前言

该系统是一个综合型的应用，基于PyTorch框架的YOLOv5、YOLOv7和YOLOv8，结合了Django后端和Vue3前端，为竹签生成工厂和串串香店铺提供了一套全面而强大的实时监测与分析解决方案。系统主要特色在于实时目标检测和位置追踪，支持用户通过上传图片、视频或摄像头进行推理，实时获取竹签的位置和数量。这一功能的实现基于高度精准的YOLO模型，为生产过程提供了即时可用的信息，助力企业合理安排生产计划、优化库存管理。
与此同时，系统还引入了三种模型训练结果的可视化分析，为用户提供了深入了解模型训练过程的手段，包括损失曲线、性能评估和目标检测结果的可视展示。这使用户能够更好地了解模型的行为，进行精细的参数调优以提高模型的性能和适应性。实时训练监控与性能评估功能使用户能够实时跟踪模型训练进度，并得到准确的性能评估指标，为模型优化提供了有力的支持。
用户友好的前端界面则进一步简化了系统的使用体验，使上传图像、视频或连接摄像头等操作更加直观轻松。系统提供了交互式的界面，允许用户深入分析特定时间段或场景的竹签检测结果，从而更好地理解生产现场的实时情况。系统注重灵活性与拓展性，能够迎合竹签生成工厂和串串香店铺的多样化需求，并为未来业务变化提供了良好的适应性。综合而言，该系统不仅提供了实时监测功能，更通过全面的数据分析和模型性能评估工具，提升了生产效率和决策能力，为企业在竹签管理上提供了强大的支持。

效果演示

前端推理界面

单张照片推理界面

视频推理界面

摄像头推理界面

结果可视化页面

一、实现思路

① 算法原理

YOLOv8算法原理

YOLOv8 是 ultralytics 公司在 2023 年 1月 10 号开源的 YOLOv5 的下一个重大更新版本，目前支持图像分类、物体检测和实例分割任务，在还没有开源时就收到了用户的广泛关注。

具体到 YOLOv8 算法，其核心特性和改动可以归结为如下：

提供了一个全新的 SOTA 模型，包括 P5 640 和 P6 1280 分辨率的目标检测网络和基于 YOLACT 的实例分割模型。和
YOLOv5 一样，基于缩放系数也提供了 N/S/M/L/X 尺度的不同大小模型，用于满足不同场景需求
骨干网络和 Neck 部分可能参考了 YOLOv7 ELAN 设计思想，将 YOLOv5 的 C3 结构换成了梯度流更丰富的 C2f
结构，并对不同尺度模型调整了不同的通道数，属于对模型结构精心微调，不再是无脑一套参数应用所有模型，大幅提升了模型性能。不过这个 C2f
模块中存在 Split 等操作对特定硬件部署没有之前那么友好了
Head 部分相比 YOLOv5 改动较大，换成了目前主流的解耦头结构，将分类和检测头分离，同时也从 Anchor-Based 换成了
Anchor-Free
Loss 计算方面采用了 TaskAlignedAssigner 正样本分配策略，并引入了 Distribution Focal Loss
训练的数据增强部分引入了 YOLOX 中的最后 10 epoch 关闭 Mosiac 增强的操作，可以有效地提升精度

YOLOv8 是一个 SOTA 模型，它建立在以前 YOLO 版本的成功基础上，并引入了新的功能和改进，以进一步提升性能和灵活性。具体创新包括一个新的骨干网络、一个新的 Ancher-Free 检测头和一个新的损失函数，可以在从 CPU 到 GPU 的各种硬件平台上运行。

不过 Ultralytics 并没有直接将开源库命名为 YOLOv8，而是直接使用 Ultralytics 这个词，原因是 Ultralytics 将这个库定位为算法框架，而非某一个特定算法，一个主要特点是可扩展性。

YOLOv8的算法原理可以概括为以下几个步骤：

分割图片：YOLOv8首先将输入图片分割为a×a个grid，每个grid的大小相等。不同于之前的滑窗法让每个框只能识别出一个物体，且要求这个物体必须在这个框之内，YOLOv8只要求物体的中心落在这个grid中，这使得算法不需要设计非常大的框来框住占用较多像素块的目标。
基于grid生成bounding box：每个grid都预测出B个bounding box，每个bounding box包含5个值，分别是物体的中心位置(x,y)、高(h)、宽(w)以及这次预测的置信度。每个grid还要负责预测这个框中的物体是什么类别的，这里的类别用one-hot编码表示。
损失函数的设计：YOLOv8的损失函数由两部分构成，一部分是坐标预测的损失，也就是预测出的bounding box中心位置和大小的损失；另一部分是类别预测的损失，也就是预测出的物体类别的损失。
预测阶段：在预测阶段，YOLOv8将输入的图片经过一次神经网络的前向传播，就可以得到每个grid预测的bounding box和类别概率，然后通过非极大值抑制（NMS）算法去除多余的框，得到最终的预测结果。

YOLOv5算法原理
YOLOv5与历代YOLO算法相似，使用了网格的概念，将图像划分为多个网格，每个网格负责预测一个或多个物体，简单来说每个网格都可以产生预测框。网格可以产生预测框的原因也很简单。网格内存有几个（一般为三个）预测框的模板，也就是"anchor"每个anchor都有预设的宽高、坐标以及置信度。置信度表示网格内存在物体的概率。在训练过程中，真实的人工标注框的中点落在哪个在网格内，哪个网格内的anchor就会朝着这个真实框疯狂“生长”或者“萎缩”，并将置信度设为1因为其存在物体，表示anchor所在的网格有物体，其他没有预测框的anchor置信度则为0。如果把anchor与真实框之间宽高的差、坐标的差看成是损失，把二元交叉熵作为置信度的损失，那么目标检测问题就会大大简化为简单的回归预测和分类问题。

YOLO v5的网络结构分为三部分：backbone骨干网络、neck颈部结构、head头部结构。在yolov5s.yaml文件中，作者将head与neck放在了一起。YOLOv5的网络结构为全卷积网络，即网络结构全由卷积、批归一化层等构成，不包含全连接层。YOLOv5中的Focus结构是一种用于特征提取的卷积神经网络层，用于将输入特征图中的信息进行压缩和组合，从而提取出更高层次的特征表示。Focus结构是YOLOv5中的一种特殊卷积操作，它被用作网络中的第一个卷积层，用于对输入特征图进行下采样，以减少计算量和参数量。YOLOv5模型结构如下图所示。

Focus结构
.YOLOv5中的Focus结构是一种用于特征提取的卷积神经网络层，用于将输入特征图中的信息进行压缩和组合，从而提取出更高层次的特征表示。Focus结构是YOLOv5中的一种特殊卷积操作，它被用作网络中的第一个卷积层，用于对输入特征图进行下采样，以减少计算量和参数量。
具体来说，Focus结构可以将输入特征图划分成四个子图，并将这四个子图进行通道拼接，从而得到一个更小的特征图。假设输入特征图的大小为N×N×C，其中N为特征图的尺寸，C为通道数，则Focus结构的计算过程可以分为以下几个步骤：

a.将输入特征图进行通道分离，得到两个大小为N×N×C/4的特征图，记为x和y。
b.对x和y分别进行横向和纵向的步长为2的卷积操作，得到两个大小为N/2×N/2×C/4的特征图，记为x’和y’。
c.将x’和y’进行通道拼接，得到一个大小为N/2×N/2×C/2的特征图，记为z。
d.对z进行横向和纵向的步长为2的卷积操作，得到一个大小为N/4×N/4×C/2的特征图，即为Focus结构的输出。

由于Focus结构对输入特征图进行了下采样，因此可以有效地减少计算量和参数量，同时保留了输入特征图中的重要信息，有助于提高模型的特征提取能力。在YOLOv5中，Focus结构被广泛用于各个卷积块的第一个卷积层，以实现对输入特征图的下采样和特征压缩。

YOLOv5的代码中有时会将Focus结构替换为卷积层，Focus结构在实现上比较复杂，需要进行通道分离、卷积、通道拼接等操作，导致计算量较大，不利于模型的训练和推理。为了简化网络结构并提高运行效率，YOLOv5的作者采用了一种策略，即将Focus结构替换为标准的卷积层，从而减少计算量和参数量。

YOLOv5中的卷积层是以步长为2的方式进行下采样的，与Focus结构类似，它可以实现对输入特征图的压缩和下采样。因此，将Focus结构替换为卷积层可以在一定程度上提高模型的训练和推理效率，同时减少代码的复杂度和开发难度。

CSP结构
CSP（Cross Stage Partial）结构是YOLOv5中的一个重要组成部分，用于构建骨干网络（backbone）。CSP结构最初在CVPR 2020中提出，可以有效地减少网络参数和计算量，同时提高特征提取的效率。

CSP结构的核心思想是将输入特征图分成两部分，一部分经过一个小的卷积网络（称为子网络）进行处理，另一部分则直接进行下一层的处理。然后将两部分特征图拼接起来，作为下一层的输入。
具体来说，CSP结构包括以下几个步骤：

a.将输入特征图分成两部分，一部分进行子网络的处理，另一部分直接进行下一层的处理。
b.在子网络中，先使用一个卷积层将输入特征图进行压缩，然后进行一系列卷积操作，最后再使用一个卷积层进行扩张。这样可以提取出相对较少的高层次特征。
c.在下一层中，将经过子网络处理的特征图与直接处理的特征图进行拼接，然后再进行一系列卷积操作。这样可以将低层次的细节特征和高层次的抽象特征结合起来，提高特征提取的效率。

CSP结构在YOLOv5中被广泛应用，包括骨干网络中的多个阶段以及头部网络（head）中的一些模块。它可以显著地减少网络的参数和计算量，同时提高特征提取的效率，从而加快模型的训练和推理速度。

Yolov7算法算法原理

YOLOv7是一种最先进的实时目标检测器，它在速度和准确性方面都超过了所有已知的目标检测器，范围从5 FPS到160 FPS1。它在GPU V100上达到了30 FPS或更高的30% AP的最高准确率2。

在 YOLOv7 中，模型重参数是指将模型的层数和参数量减少，同时保持模型性能不变或提高模型性能。YOLOv7 的模型重参数是通过以下步骤实现的：

CSPNet 网络结构：YOLOv7 采用了 CSPNet 网络结构，它将一个较大的卷积层分成两个较小的卷积层，从而减少了模型的参数数量。yolov7总体结构由Input、Backbone、Head、Detect四部分组成。Input为6406403的数据输入。Backbone为骨干网络由CBS、ELAN、MP-1组成。Head由CBS、SPPCSPC、E-ELAN、MP-2、RepConv组成。Detect为三个检测头。此外，
CSPNet 还采用了跨阶段连接技术，使得网络可以在不增加参数数量的情况下获得更高的性能。
剪枝：YOLOv7 采用了通道剪枝技术，将网络中一些不重要的通道删除，从而减少模型的参数数量。通道剪枝技术可以通过对每个通道的重要性进行评估来实现。具体而言，可以使用结构感知剪枝（Structural-Aware Pruning）或自适应剪枝（Adaptive Pruning）等技术来评估每个通道的重要性。
SPP 网络结构：YOLOv7 中使用了 SPP 网络结构，该结构可以在不增加参数数量的情况下增加感受野，从而提高网络的性能。具体而言，SPP 网络结构通过使用不同尺寸的池化核来提取不同大小的特征图，然后将这些特征图拼接在一起，从而形成一个具有更大感受野的特征图。
模型微调：在模型训练过程中，YOLOv7 采用了模型微调技术，通过微调模型的参数来进一步提高模型的性能。具体而言，YOLOv7 通过在较小的数据集上进行微调，使得模型可以更好地适应新的数据集。

同时，YOLOv7 的模型重参数是一种有效的模型优化方法，可以减少模型的参数量和计算量，同时提高模型的推理速度和性能。增强CNN的学习能力，能够在轻量化的同时保持准确性，降低计算瓶颈，降低内存成本。

模型缩放

模型缩放方法通常使用不同的缩放因子，如resolution（输入图像的大小）、深度（层数）、宽度（通道数）和阶段（特征pyramid的数量），以便对网络参数量、计算、推理速度和ac-curacy进行良好的权衡。

论文提到，所有基于串联的模型，如DenseNet或VoVNet，当此类模型的深度被缩放时，会改变一些层的输入宽度。由于提出的架构是基于串联的，我们必须为这个模型设计一个新的复合缩放方法。

多尺度训练：YOLOv7 采用了多尺度训练技术，即在训练过程中使用不同尺度的图像来训练模型。这可以让模型学习到不同尺度的目标，从而提高模型的鲁棒性和泛化能力。具体而言，YOLOv7 使用了 3 个不同的尺度来训练模型，分别为 640x640、960x960 和 1280x1280。

PANet 网络结构：YOLOv7 中采用了 PANet 网络结构，它可以将不同尺度的特征图融合在一起，从而提高模型的检测精度。具体而言，PANet 网络结构通过自顶向下和自底向上的方式来进行特征融合，使得模型可以更好地处理不同尺度的目标。

E-ELAN

yolov7的基础模块ELAN，论文还提出了ELAN的扩展E-ELAN（扩展的高效层聚合网络），将两个并行的ELAN，输出按位置相加，E-ELAN只在yolov7-e6中使用。

E-ELAN利用expand、shuffle、merge cardinality来实现不破坏原来梯度路径的情况下不断增强网络学习能力的能力。它使用组卷积来增加特征的基数（cardinality），并以shuffle和merge cardinality的方式组合不同组的特征。这种操作方式可以增强不同特征图学到的特征，改进参数的使用和计算效率。

重参数化卷积

RepConv在VGG上取得了出色的表现，但直接将其应用于ResNet和DenseNet以及其他架构时，其准确性将大大降低。，比如不带残差的3×3卷积可以直接替换成重参数化卷积，但是对于resnet的残差模块，本来就有一个恒等连接，再替换成重参数化卷积效果只会更差，RepConv中的身份连接破坏了ResNet中的残差和DenseNet中的拼接，为不同的特征映射提供了更多样化的梯度。基于上述原因，使用无单位连接的RepConv (RepConvN)来设计规划的重新参数化卷积的体系结构。当一个带有残差或串联的卷积层被重新参数化的卷积所取代时，应该没有恒等连接。

标签分配方法

深度监督：在模型训练的过程中，除了最终的检测头（Lead Head）外，给中间的一些层也增加一些辅助头（Aux Head），辅助检测头也会参与损失值的计算。

标签分配：把输入图像中的标注框和最终预测的预测值对应起来，便于进一步求损失值，硬标签和软标签（trian中的OTA算法）

过去，在深度网络的训练中，标签赋值通常是直接参考ground truth，根据给定的规则生成硬标签。然而，近年来，以物体检测为例，研究人员往往利用网络输出的预测质量和分布，然后与ground truth一起考虑，使用一些计算和优化方法来生成可靠的软标签。例如，YOLO使用边界盒回归预测的IoU和地面真实作为物体的软标签。在本文中，我们把把网络预测结果和地面实况一起考虑，然后分配软标签的机制称为 “标签分配器”。

② 程序流程图

二、系统设计与实现

该系统采用了PyTorch框架的YOLOv5、YOLOv7和YOLOv8，结合Django后端和Vue3前端，致力于为竹签生成工厂和串串香店铺提供高效的实时监测解决方案。通过实时目标检测和位置追踪，系统确保对竹签的高精准度识别，并通过用户友好的前端界面展示实时检测结果。同时，引入了三种模型训练结果的可视化分析，包括损失曲线、性能评估等，以协助用户优化模型参数。系统还集成了实时训练监控模块，使用户能够随时追踪模型训练的进度。这一设计旨在提高竹签管理的效率和决策能力，注重核心功能的实时性和用户体验。

在串串香店内，我正着手收集大量竹签，为构建一个严谨的数据集做准备。此数据集将专注于竹签的多角度拍照标注，旨在为后续研究和应用提供基础资料。每个竹签都将以高清图像记录，以确保数据集的质量和多样性。这一收集过程不仅仅局限于数量，我还将特别注重竹签的形状、长度和其他相关特征。

模型设计方面，我首先采用的是最主流的深度学习框架PyTorch，检测算法模型采用的是最新的YOLOv8。YOLOv8和YOLOv5是同一个作者，YOLOv8 主要参考了最近提出的诸如 YOLOX、YOLOv6、YOLOv7 和 PPYOLOE 等算法的相关设计，本身的创新点不多，偏向工程实践，主推的还是 ultralytics 这个框架本身。

YOLOv8的网络结构设计，在暂时不考虑Head情况下，对比YOLOv5和YOLOv8的yaml配置文件可以发现改动较小：

左侧为 YOLOv5-s，右侧为 YOLOv8-s。
骨干网络和 Neck 的具体变化为：

第一个卷积层的 kernel 从 6x6 变成了 3x3
所有的 C3 模块换成 C2f，结构如下所示，可以发现多了更多的跳层连接和额外的 Split 操作
去掉了 Neck 模块中的 2 个卷积连接层
Backbone 中 C2f 的 block 数从 3-6-9-3 改成了 3-6-6-3
查看 N/S/M/L/X 等不同大小模型，可以发现 N/S 和 L/X 两组模型只是改了缩放系数，但是 S/M/L 等骨干网络的通道数设置不一样，没有遵循同一套缩放系数。如此设计的原因应该是同一套缩放系数下的通道设置不是最优设计，YOLOv7 网络设计时也没有遵循一套缩放系数作用于所有模型

Head 部分变化最大，从原先的耦合头变成了解耦头，并且从 YOLOv5 的 Anchor-Based 变成了 Anchor-Free。其结构如下所示：

从上面两张图可以看出，yolov8不再有之前的 objectness 分支，只有解耦的分类和回归分支，并且其回归分支使用了 Distribution Focal Loss 中提出的积分形式表示法。

三、模型评估与优化

① Yolov5

F1曲线

PR图

yolov5训练结果图

② Yolov7

F1曲线

PR图

yolov7训练结果图

③Yolov8

F1曲线

PR图

yolov8训练结果图

四、模型对比

Extreme values modelling 绪论 Liam_ml
极端值建模和估算是各种应用领域的重要挑战，例如环境，水文，金融，精算科学。样本的极端部分可能非常重要。也就是说，它可能表现出更大的潜在风险，例如高浓度的空气污染物，洪水，极端索赔规模。一般而言，极端之建模有三个方面：UnivariateExtremeValueTheory:单变量极值理论。BivariateExtremeValueTheory:双变量极值理论MultivariateExtremeV
STC15单片机实战笔记一未来电子机械工程师单片机STC15实战单片机
新建工程一、新建工程前的准备1、添加型号与头文件到keil第一次新建STC工程时，需要将STC的型号与头文件添加到keil软件中。打开STC-ISP下载工具，切换至keil仿真设置栏，按提示添加即可。2、新建工程文件夹①、在新建工程目录下新建软件开发文件夹用于存放工程文件；②、在软件开发目录下新建user文件夹，用于存放main，public等文件；③、在软件开发目录下新建app文件夹，用于存放应
【Bluedroid】蓝牙启动之 btm_acl_device_down 流程源码解析 byte轻骑兵 Android C++Bluedriod Andriod
本文详细分析Android蓝牙协议栈在设备故障时的处理流程。当蓝牙设备发生硬件故障或系统异常时，协议栈通过btm_acl_device_down触发多层次的资源清理和状态重置，包括ACL连接终止、L2CAP通道释放、SCO连接清理、BLE拓扑更新、设备数据库重置等关键操作，确保系统安全恢复。一、概述1.1蓝牙核心控制块与故障处理框架蓝牙协议栈通过全局控制块tBTM_CB实现跨模块状态管理，其整合了
西游记花上的露珠
孙悟空是石猴出世的，在它出生时，把玉皇大帝都惊动了，它又当上了美猴王。它出门求学，要学一个长生不老之术，它在班里面不安静，师傅敲了三下，三更半夜跑到师傅那，师傅教了它七十二变。因悟空卖弄被师傅赶出家门。图片发自百度悟空去龙王那里索取兵器。龙王不好推辞就给了他一把大刀，悟空不会使刀，又给了一个九股叉来，悟空觉得特别轻，不要。又给了一个方天戟，悟空觉得不趁手，又不要，又给了金箍棒，悟空才要。图片发自A
大型语言模型的智能本质是什么 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力语言模型人工智能自然语言处理
大型语言模型的智能本质是什么基于海量数据的统计模式识别与生成系统，数据驱动的语言模拟系统，其价值在于高效处理文本任务（如写作、翻译、代码生成），而非真正的理解与创造大型语言模型（如GPT-4、Claude等）的智能本质可概括为基于海量数据的统计模式识别与生成系统，其核心能力源于对语言规律的深度学习，但缺乏真正的理解与意识。以下从本质特征、技术机制、典型案例及争议点展开分析：一、智能本质的核心特征统
Python 算法基础篇之线性搜索算法：顺序搜索、二分搜索挣扎的蓝藻 Python算法初阶：入门篇 python 算法开发语言
Python算法基础篇之线性搜索算法：顺序搜索、二分搜索引用1.顺序搜索算法2.二分搜索算法3.顺序搜索和二分搜索的对比a)适用性b)时间复杂度c)前提条件4.实例演示实例1：顺序搜索实例2：二分搜索总结引用在算法和数据结构中，搜索是一种常见的操作，用于查找特定元素在数据集合中的位置。线性搜索算法是最简单的搜索算法之一，在一组数据中逐一比较查找目标元素。本篇博客将介绍线性搜索算法的两种实现方式：顺
《红楼梦》之杨藏本（梦稿本）（之五）青埂峰下有情郎zjy
《红楼梦》之杨藏本（梦稿本）（之五）青埂峰下有情郎zjy文化领域创作者此处所谓“改本”及“兰墅定本”，应是相指1791年以后的程、高排印本而言，后面将再提到此点。在第103回第二页，有红笔勾抹一处，并添一“后”字。这是杨藏本中第三次出现红笔字。此外抄本中很多地方都有“杨继振”或“又云”的印鉴。这些印鉴多半都是表示在各册中原抄本起讫之处。检视杨藏本通篇文字，原抄本最初似乎是经过两道工序。第一道是一行
中原焦点团队网络中级第19期吕娟坚持分享第333天我心安然无恙
2020年3月24号约练收获本周第一，二次，总第26，27次。初21课程复盘咨询流程:关系，目标，资源，一小步。平常多读书，有些知识也许短时间用不上，但是，可以先储存着。知识有时候用不上，属功利心太强了。生活中并不缺少美，只是缺少发现美的眼睛。授之以鱼，不如授之以渔，不如授之以欲。有些家长是灭欲的。(自以为是，还不愿承认)有时候家长会说:我吃的盐比你吃的米都多。问题是你吃的盐是多年前的盐，不是现在
出国不出国之公民教育海豚沁M
今天看了公民教育的一部分内容，完全颠覆了我对北美国家对于尊重认识，原来一句玩笑话:你的屁真臭，在北美的公民教育体系中就是不尊重的表现，要接受time-out惩罚，而且还是算比较严重的惩罚。回望我们身边，别说孩子，大人都有时候会说这样的玩笑话，可是在北美教育体系中，这就是品德教育的核心内容。
《皮皮鲁和鲁西西之罐头小人》豆瓣评分7.2；你认同成绩好就是好学生吗？以书之名
多年以后，当我回忆起那个背着双肩包的小女孩独自一人踩着布满落叶的季节的水泥地时，我的脑海里就会浮现那样一幅真实的画面：绑着一根长长的头发，身材高挑瘦小（经常被同龄人羡慕身材苗条，却被长辈们误以为家里穷没得饭吃饿瘦的），然而却并非如此。身材苗条是因为天生丽质，天生丽质难自弃。有些东西有些事情有些品格就是生来就有的，或者是上天赐予的，或者是幸运女神眷顾的，或者是命运早已安排好的。一如热映的喜剧欢乐电影
人不为吃，天诛地灭仍需历验
人不为吃，天诛地灭。但吃钱的来源，却是五花八门。正如“君子爱财，取之有道”之说。倘若，嗟（借）来之食，贷款之食，赊账之食，啃老之食……这个中的“美味”究竟有多少，也只有吃货们心知肚明。图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App
工服误检率高达40%？陌讯改进YOLOv7实战降噪50% 2501_92487859 YOLO 算法视觉检测目标检测计算机视觉
开篇痛点：工业场景的视觉检测困境在工地、化工厂等高危场景，传统视觉算法面临三重挑战：环境干扰：强光/阴影导致工服颜色失真目标微小：安全帽反光标识仅占图像0.1%像素遮挡密集：工人簇拥时漏检率超35%（数据来源：CVPR2023工业检测白皮书）行业真相：某安监部门实测显示，开源YOLOv5在雾天场景误报率高达41%技术解析：陌讯算法的三大创新设计1.多模态特征融合架构#伪代码示例：可见光+红外特征融
渣土车识别漏检率高？陌讯算法实测降 90% 2501_92487936 目标跟踪人工智能计算机视觉目标检测算法智慧城市
在城市建筑垃圾运输管理中，渣土车的合规性监测一直是行业痛点。传统视觉算法在复杂工况下常常出现误判——阴雨天车牌识别模糊、夜间车灯眩光导致车型误分类、不同品牌渣土车混检时准确率骤降。某市政管理局的统计显示，采用传统方案时，日均漏检率高达23%，由此引发的违规倾倒投诉占比超60%。技术解析：从单模态到多特征融合的突破传统渣土车识别多依赖单一目标检测模型（如FasterR-CNN），其核心缺陷在于：特征
考场/工厂违规用机难捕捉？3维度优化方案部署成本直降40% 2501_92487762 视觉检测计算机视觉算法目标检测
开篇痛点工业场景中传统玩手机识别面临三重挑战：小目标检测（手机平均像素占比<0.5%）、遮挡干扰（人手/物体遮挡率超60%）、实时性要求（需200ms内响应）。某安检企业反馈，开源YOLOv5在车间场景误报率高达34%。技术解析：双流特征融合架构陌讯算法创新性融合双路径特征（图1）：#陌讯核心代码逻辑（简化版）defdual_path_fusion(backbone):shallow_path=C
复杂场景检测失效？陌讯多模态算法在千万级监控网的落地实战 2501_92473061 算法视觉检测安全计算机视觉
开篇痛点：安防监控的检测困境"明明人就在画面里，系统却毫无反应！"——这是某智慧园区安防负责人的吐槽。传统目标检测模型在安防监控场景面临三大死穴：漏报：夜间、遮挡场景下召回率骤降（实测ResNet50漏报率>40%）误报：树叶晃动、光影变化引发的误报占比超35%延迟：1080P视频流检测延迟普遍>100ms，难以满足实时响应需求技术解析：陌讯算法的三阶优化架构陌讯视觉算法采用多模态特征金字塔（MM
复杂场景检测老翻车？陌讯算法实测提升 40% 2501_92453489 算法视觉计算机视觉视觉检测
在工业质检、安防监控等计算机视觉落地场景中，工程师常面临棘手问题：传统算法在光照突变、目标遮挡等复杂环境下，漏检率高达20%以上，泛化能力不足成为项目落地的最大阻碍。而陌讯AI视觉算法通过架构创新，正在重新定义复杂场景下的检测精度标准。技术解析：从单模态到多模态的跨越传统目标检测模型多依赖单一RGB图像输入，在特征提取阶段容易受环境干扰。以经典的FasterR-CNN为例，其区域提议网络（RPN）
lesson17：Python函数之递归、匿名函数与变量作用域
目录引言一、递归函数：用自身解构复杂问题1.递归的基本结构2.递归的典型应用场景3.递归的优缺点与优化二、匿名函数：用lambda实现“一句话函数”1.lambda与普通函数的区别2.lambda的典型应用3.lambda的局限性三、变量作用域：理解LEGB规则1、LEGB规则的深度解析（1）Local（局部作用域）（2）Enclosing（嵌套作用域）（3）Global（全局作用域）（4）Bui
深度学习超参数优化（HPO）终极指南：从入门到前沿
摘要：在深度学习的实践中，模型性能的好坏不仅取决于算法和数据，更在一半程度上取决于超参数的精妙设置。本文是一篇关于超参数优化（HyperparameterOptimization,HPO）的综合性指南，旨在带领读者从最基础的概念出发，系统性地梳理从经典到前沿的各类优化方法，并最终落地于实用策略和现代工具。无论您是初学者还是资深从业者，都能从中获得宝贵的见解。第一部分：夯实基础——HPO的核心概念1
六项精进打卡11天王尚涛
每日打卡模板姓名：王尚涛公司：为福投资控股集团【日精进打卡第11天】【知～学习】《六项精进》纲要读1遍，共17遍《大学》读1遍共11遍《论语》第12-24页【经典名句分享】付出不亚于任何人的努力；要谦虚不要骄傲；每天都要反省；活着，就要感谢；积善行，思利他；不要有感性的烦恼；若无相欠，怎会相见；人不知而不愠，不亦君子乎；命由我作，福自己求；小人闲居为不善。言不及之而言谓之躁，言及之而不言谓之隐，未
【读书清单】《了凡四训》&积善之方幻岭之漫
1.与人为善说话做事，不只是为自己所想，而是立足于客观事实的，不有意在他人面前卖弄自己骄傲的智慧和才能2.爱敬存心君子和小人差别就在于尊重爱护众人的那份心。各种各样的人，都是我们的同胞，都是值得尊敬的3.成人之美看到一个人做好事，或看到他的志向可以支持，资质可以进步的，都要对他进行引导，最终能造就他们4.劝人为善在忙碌着追逐名利的人，容易迷失自我。与他们相处时要随时提醒他们帮他们摆脱疑惑。比如看到
每日一读（子产不毁乡校）考文学
编辑|考文学排版|考文学子产不毁乡校《左传》郑人游于乡校（1），以论执政（2）。然明谓子产曰（3）：“毁乡校，何如？”子产曰；“何为？夫人朝夕退而游焉（4），以议执政之善否。其所善者，吾则行之；其所恶者，吾则改之，是吾师也，若之何毁之？我闻忠善以损怨（5），不闻作威以防怨(6)。岂不遽止(7)？然犹防川(8)：大决所犯，伤人必多，吾不克救也；不如小决使道(9)，不如吾闻而药之也(10)。”然明曰：
Kubernetes K8S之资源控制器RC、RS、Deployment详解 LightZhang666 kubernetes ci/cd devops kubernetes k8s devops ci/cd docker
Kubernetes的资源控制器ReplicationController（RC）、ReplicaSet（RS）、Deployment（Deploy）详解与示例主机配置规划服务器名称(hostname)系统版本配置内网IP外网IP(模拟)k8s-masterCentOS7.72C/4G/20G172.16.1.11010.0.0.110k8s-node01CentOS7.72C/4G/20G172
弱水三千，只取一瓢饮东心水
弱水三千，只取一瓢饮出处：黛玉道：“宝姐姐和你好你怎么样？宝姐姐不和你好你怎么样？宝姐姐前儿和你好，如今不和你好你怎么样？今儿和你好，后来不和你好你怎么样？你和他好他偏不和你好你怎么样？你不和他好他偏要和你好你怎么样？”宝玉呆了半晌，忽然大笑道：“任凭弱水三千，我只取一瓢饮。”黛玉道：“瓢之漂水奈何？”宝玉道：“非瓢漂水，水自流，瓢自漂耳！”佛祖在菩提树下问一人：在世俗的眼中，你有钱、有势、有一个
山水山蓝水浅
山。相比于危险，山能给所有的生物安全感，而安全的另一面便是争斗，继而杀戮，沦为又一个危险之地，所以山既安全又危险。有多少生之贪婪，便有多少死之恐惧，山收容所有的流浪，也观看所有的死亡，所以山既不安全也不危险。山只是山，是一个世界。水。水是流动的吗？是的，因为水是河流。河流终年流淌，只会流淌，浑浊、清澈、平缓、湍急……它只往下流淌，顺着地力。直到出现了悬崖，突然站起了身，成了一张倒挂的瀑布，又以千钧
读懂易经读懂中华文化（97）革卦有庆也
《易经》第四十九卦革泽火革兑上离下卦象结构：兑上离下卦名：革卦泽火革革，象形字形为被剖剥下来的兽皮。本义为去毛的兽皮。引申为：去除、更改、变革。《说文解字》：“革，兽皮治去其毛。”革除。《玉篇》：“革，改也。”改革、变革、革命、革故鼎新卦象自然属性看，兑上离下，兑为泽，离为火。火涸泽水，泽水灭火，水火相克相息，革除之象。卦象人文属性看，古代已掌握了先浸泡去毛，再火烤烘干这最基本的制革工艺。泽火，制
后仿之debug记录风之子npu 后仿单片机嵌入式硬件
在此记录一下在实际工作中碰到的在后仿过程中碰见的一些问题：1.数据采样失败原因1：iodelay增加不足；解决办法：根据sdc修正iodelay数值，同时参考后端PR的timingreport，修正delay；原因2：glitch导致采样失败，zerodelay期间，虽然在波形中看到信号变化时瞬时的，但是同一个timingslot中因为器件自身的原因，导致信号在同一个timingslot中其实变化
2023-08-16 仁德上人
理与事的圆融无障碍，说着容易，落实做到太难了文/仁德上人有人喜欢研究那些空洞自己欺骗自己的空道理，明白得再多再透彻也是空的，是空性不可得之空道理；也有人喜欢在事相上多做一些好事善事，认为是真修行，无论怎么样的做事，都是自己我我我喜欢做而做的。这是修行最怕的两边的邪知邪见邪行为，一边是执理废事，一边是执事废理，总不能达到真正的理与事的圆融，没有障碍。只有真正在事相上落实做到，一天到晚地做好事做善事，
山水之间，择一事终一生拾光宇宙
艺术源于画家对生活的热爱。在姜子龙老师的世界里，竹便是他全部的生活，三十多年来，与竹为伴，笔墨浸染，直抒写竹人生。他爱竹成痴，敬竹成魔，三十多年如一日，细心观察竹的生长和四季习性，用心感悟竹之精神。这个浮躁时代，坚持是一种稀缺资源。坚持是一件耗费心力的事，是一件从一而终的事，是一件无法回头的事。但只要是自己选择的，再苦再累，坚持往前走，属于你的风景终会出现。胡适说，生命本没有意义，你要能给他什么意
曾经沧海难为水，除却青春不剩情旭下雨了
三月初的夜里，我失眠了。起因很多，心里一直毛燥的不行。但最令我舍不下的竟然是一本小说，一个渣攻，一个让人心疼的病人受。心里止不住的感慨，如果在《最爱你的那十年》里面，蒋对贺留了一点点迷恋。不，不能说是迷恋，因为他们两个已经熬过了七年之痒，实现了十年之约。贺对蒋已经将爱变成一种深入骨髓的习惯了。因此，蒋在外面心野了，衣服上有女人唇印了，电话里有长期联络的小情儿了，他都装作不知。因为，太相信他们这十年
高端密码学院笔记228 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（541）期《幸福》之启动深层心理轻松意识基础篇——“扛得住”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:高尚、伟大的代价就是责任。自由的第一个意义就是担负自己的责任2020.8.20星期三一笔记:1.从接的住到扛得住，心里境界的提升2.看到优秀的家人向别人学习如何去做，什么心里阶段性呈现什么状态。3.学习力越强，承载力越强4.精准，准确，的点评就是对笔
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt