nice-wyh

YOLOv5 7.0 网络结构解读

前言

YOLOV5是一系列在COCO数据集上预训练的目标检测架构和模型，结合了在数千个小时的研究和开发中获得的经验教训和最佳实践。本文主要以yolov5s为例介绍YOLOV5-v7.0版本的网络架构及初始化超参数。

一.YOLOV5s网络结构图

网络结构主要包含以下部分：

1.输入端：自适应锚框计算、自适应图片缩放、Mosaic数据增强

2.Backbone：CBS模块、C3模块、SPPF模块

3.Neck：FPN+PAN结构

4.Head：CIOU Loss

二.输入端

（1）自适应锚框计算

在YOLOV5中，每次训练前，都会根据数据集来自适应计算anchor锚框大小

若觉得计算的锚框效果不好，可以在train.py的参数设置部分将--noautoanchor的default设置为False

1.1计算过程

读取训练集的所有图片的w、h以及检测框的w、h
将读取的坐标修正为绝对坐标
使用Kmeans算法将训练集的所有检测框进行聚类，得到k个anchor
通过遗传算法对得到的anchor进行变异，如果变异后的效果好，则将其保留，否则跳过
将最终得到的最优anchor按照面积返回

1.2默认锚框

在models下的配置文件yaml下预设了一些针对COCO数据集在640*640图像下的锚定框的尺寸：

anchor的参数一共有三行，每行6个数值；每一行代表不同的特征图；

第一行是在最大特征图上的锚框，80*80代表浅层的特征图（P3），包含较多的低层次信息，适合于小目标检测，所以这一行特征图所用的anchor尺度较小
第二行是在中间的特征图上的锚框，40*40特征图上就用介于这两个尺寸之间的anchor用来检测中等大小的目标
第三行是在最小特征图上的锚框，20*20代表浅层的特征图，包含更多的高层次信息，如轮廓、结构等信息，适合于大目标检测，所以这一行的anchor尺度较大

1.3自定义锚框

锚框核查函数/utils/autoanchor.py文件中：

def check_anchors(dataset, model, thr=4.0, imgsz=640):
    # Check anchor fit to data, recompute if necessary
    m = model.module.model[-1] if hasattr(model, 'module') else model.model[-1]  # Detect()
    shapes = imgsz * dataset.shapes / dataset.shapes.max(1, keepdims=True)
    scale = np.random.uniform(0.9, 1.1, size=(shapes.shape[0], 1))  # augment scale
    wh = torch.tensor(np.concatenate([l[:, 3:5] * s for s, l in zip(shapes * scale, dataset.labels)])).float()  # wh

    def metric(k):  # compute metric
        r = wh[:, None] / k[None]
        x = torch.min(r, 1 / r).min(2)[0]  # ratio metric
        best = x.max(1)[0]  # best_x
        aat = (x > 1 / thr).float().sum(1).mean()  # anchors above threshold
        bpr = (best > 1 / thr).float().mean()  # best possible recall
        return bpr, aat

    stride = m.stride.to(m.anchors.device).view(-1, 1, 1)  # model strides
    anchors = m.anchors.clone() * stride  # current anchors
    bpr, aat = metric(anchors.cpu().view(-1, 2))
    s = f'\n{PREFIX}{aat:.2f} anchors/target, {bpr:.3f} Best Possible Recall (BPR). '
    if bpr > 0.98:  # threshold to recompute
        LOGGER.info(f'{s}Current anchors are a good fit to dataset ✅')
    else:
        LOGGER.info(f'{s}Anchors are a poor fit to dataset ⚠️, attempting to improve...')
        na = m.anchors.numel() // 2  # number of anchors
        anchors = kmean_anchors(dataset, n=na, img_size=imgsz, thr=thr, gen=1000, verbose=False)
        new_bpr = metric(anchors)[0]
        if new_bpr > bpr:  # replace anchors
            anchors = torch.tensor(anchors, device=m.anchors.device).type_as(m.anchors)
            m.anchors[:] = anchors.clone().view_as(m.anchors)
            check_anchor_order(m)  # must be in pixel-space (not grid-space)
            m.anchors /= stride
            s = f'{PREFIX}Done ✅ (optional: update model *.yaml to use these anchors in the future)'
        else:
            s = f'{PREFIX}Done ⚠️ (original anchors better than new anchors, proceeding with original anchors)'
        LOGGER.info(s)

YOLOV5在开始训练前会计算数据集标注信息针对默认锚定框的最佳召回率，如果最佳召回率大于或等于0.98，则不需要重新计算锚定框，使用默认锚定框；否则会重新计算符合此数据集的锚定框。

    def metric(k, wh):  # compute metrics
        r = wh[:, None] / k[None]
        x = torch.min(r, 1 / r).min(2)[0]  # ratio metric
        # x = wh_iou(wh, torch.tensor(k))  # iou metric
        return x, x.max(1)[0]  # x, best_x

其中，bpr参数就是判断是否需要重新计算锚定框的依据（是否小于0.98）

重新计算符合此数据集标注的锚定框，是利用k均值聚类算法和遗传算法实现的

（2）Mosaic数据增强

最早出现在YOLOV4，V5也沿用了此技术。

Mosaic数据增强的主要思想是将多张图片按一定比例组合成一张图片，实则是参考了CutMix的数据增强方式，CUtMix是将两张图片进行拼接，Mosaic则是对四张图片进行拼接，拼接后得到一张新的图片，同时也获得了对应的检测框。然后把他传入网络中学习，相当于一下子传入四张图片学习。

Mosaic数据增强的主要步骤:

随机选择四张不同的图像作为输入
分别对四张图片进行翻转(对原始图片进行左右的翻转)、缩放(对原始图片进行大小的缩放)、色域变化 (对原始图片的明亮度、饱和度、色调进行改变)等操作。
操作完成之后然后再将原始图片按照第一张图片摆放在左上，第二张图片摆放在左下，第三张图片摆放在右下，第四张图片摆放在右上四个方向位置摆好。
根据每张图片的尺寸变换方式，将映射关系对应到图片标签上。
依据指定的横纵坐标，对大图进行拼接。处理超过边界的检测框坐标。

Mosaic数据增强的优点:

增加数据多样性，随机选取四张图像进行组合,组合得到图像个数比原图个数要多。
增强模型鲁棒性，混合四张具有不同语义信息的图片，可以让模型检测超出常规语境的目标。
加强批归一化层(Batch Normalization)的效果。当模型设置BN操作后,训练时会尽可能增大批样本总量(BatchSize) ，因为

BN原理为计算每一个特征层的均值和方差，如果批样本总量越大，那么BN计算的均值和方差就越接近于整个数据集的均值和方
差,效果越好。

Mosaic 数据增强算法有利于提升目标检测性能。Mosaic 数据增强图像由四张原始图像拼接而成，这样每张图像会有更大概率包含小目标。

三.Backbone

Backbone主干网络的主要作用是提取特征，并不断缩小特征图。他的主要结构有Conv模块、C3模块、SPPF模块

（1）CBS模块

有一个COnv2d、一个BatchNorm2d和SiLU激活函数构成

conv2d的padding是自动计算的，通过修改stride来决定特征图缩小的倍数，在commom.py下

def autopad(k, p=None, d=1):  # kernel, padding, dilation
    # Pad to 'same' shape outputs
    if d > 1:
        k = d * (k - 1) + 1 if isinstance(k, int) else [d * (x - 1) + 1 for x in k]  # actual kernel-size
    if p is None:
        p = k // 2 if isinstance(k, int) else [x // 2 for x in k]  # auto-pad
    return p

在Backbone中CBS模块的stride均为2, kernel均为3。因此CBS模块每次会将特征图的宽高减半，下采样特征图,同时提取到目标特征。
BatchNorm2d为批归一化层,对每批的数据做归一化,其详细作用不在这里赘述。
SiLU激活函数，SiLU是Sigmoid和ReLU的改进版。 SiLU具备无上界有下界、平滑、非单调的特性。SiLU在深层模型上的效果优于ReLU。具有平滑性和非线性特性,有助于网络在训练过程中更快地收敛。

（2）C3模块

C3模块有三个CBS模块和一个BottleNeck模块组成，因此得名。在Backbone中，C3是更为重要的特征提取模块。其结构如图：

进入C3后,将会分为两路，左路经过CBS和一个Bottleneck, 右路只经过一个CBS,最后将两路Concat,再经过一个CBS。 C3中的3个CBS模块均为1 * 1卷积，起到降维或升维的作用，对于提取特征意义不大。
●Bottleneck在Backbone中使用的是残差连接，Bottleneck中有两个CBS, 第一个CBS为1 * 1卷积，将通道缩减为原来的一半,第二个为3 * 3卷积，将通道数翻倍。先隆维有利王卷积核更好的理解特征信息L升维将有利于提取到更多更详细的特征。

在残差结构中，主分支和残差分支的特征图尺寸和维度是相同的。add 操作是将主分支和残差分支的特征图进行直接相加，不会改变特征图的尺寸和维度，只是将对应位置的特征值进行相加。下述C3中带有False参数则表示不使用残差结构。通过残差结构，可以实现在深层网络中传递梯度和信息的快速传递，并有助于解决深层网络训练中的梯度消失问题。

（3）SPPF

SPP是空间金字塔池化，采用1 x 1, 5x 5, 9x 9, 13 x 13的最大池化的方式，进行多尺度融合。YOLOv5 6.0版本开始使用了在SPP基础上改进的SPPF。

SPP是将三个并行的MaxPool2d和输入Concat到-起，第一个MaxPool2d的kernel为5*5, 第二个为9*9,第三个为13* 13。用三个不同大小的kernel,代表三个尺度。5 * 5的kernel可以理解为比较大的尺度,而13 * 13就是比较小的尺度。这样就在图片的不同尺度下取到了最大的代表特征值,并Concat融合。
SPPF是将三个kernelI为5 * 5的MaxPool2d做串行计算。第-个MaxPool2d表示较大的尺度,第二个MaxPoo在第一个MaxPool2d的基础上进一步做池化，那么产生的尺度将会进一步缩小，第三个同理。

注意:图像的尺度并非指图像的大小,而是指图像的模糊程度(σ) ,例如，人近距离看一个物体和远距离看一个物体模糊程度是不一样的，从近距离到远距离图像越来越模糊的过程，也是图像的尺度越来越大的过程。

（4）Foucs结果（6.0版本开始启用）

Focus模块是对图片进行切片操作，具体操作是在-张图片中每隔一个像拿到一个值，这样获得了四个独立的特征层,然后将四个独立的特征层进行堆叠，此时宽高信息就集中到了通道信息，输入通道扩充了四倍。拼接起来的特征层相对于原先的三通道变成了十二个通道，后将得到的新图片再经过卷积操作，最终得到了没有信息丢失情况下的二倍下采样特征图。

YOLOv5 6 0开始将Focus模块替换成了一个6 * 6的卷积层。两者的计算量是等价的，但使用6 * 6的卷积会更加高效。

四、Neck

Neck的作用就是从Backbone中获取相对于较浅的特征，再与深层的语义特征Concat到-起。

特征金字塔FPN+ PAN

FPN结构通过自顶向下进行上采样，使得底层特征图包含更强的图像强语义信息

传入FPN结构中，通过Upsample上采样的方式，向特征图中插值,使特征图的尺寸大，以便于融合来自Backbone的特征图，做特征的向.上融合,特征图不断变大;
PAN结构自底向上进行下采样，使顶层特征包含图像位置信息，两个特征最后进行融合,使不同尺寸的特征图都包含图像语义信息和图像特征信息，保证了对不同尺寸的图片的准确预测。

总结: FPN层自顶向下可以捕获强语义特征，而PAN则通过自底向上传达强定位特征。

五、Head

Head层为Detect模块，Detect模块的网络结构很简单,仅由三个1 * 1卷积构成,对应三个检测特征层。

上述经过FPN特征金字塔,我们可以获得20* 20*512、40* 40 * 256、80* 80 * 128三个加强特征,然后我们利用这三个shape的特征层传入Yolo Head获得预测结果。
对于每一个特征层,我们可以获得利用一个1 * 1卷积调整通道数，最终的通道数和需要区分的种类个数相关，每-个特征层上每一个特征点存在3个先验框。
如果使用的是COCO训练集，类则为80种，最后的维度应该为255= 3 * 85，三个特征层的shape为20* 20 * 255、40* 40 *255、80* 80 * 255

最后的255可以拆分成3个85,对应3个先验框的85个参数, 85可以拆分成4 + 1 + 80。
这里的3是指每个位置先验框(锚框)的数量;
前4个参数用于判断每一个特征点的回归参数, 回归参数调整后可以获得预测框;
第5个参数用于判断每一个特征点是否包含物体;
最后80个参数用于判断每一个特征点所包含的物体种类。

六超参数详解

（1）hyp超参数

文件位于data/hyps文件夹下

# YOLOv5  by Ultralytics, GPL-3.0 license
# Hyperparameters for low-augmentation COCO training from scratch
# python train.py --batch 64 --cfg yolov5n6.yaml --weights '' --data coco.yaml --img 640 --epochs 300 --linear
# See tutorials for hyperparameter evolution https://github.com/ultralytics/yolov5#tutorials

lr0: 0.01  # initial learning rate (SGD=1E-2, Adam=1E-3)
lrf: 0.01  # final OneCycleLR learning rate (lr0 * lrf)
momentum: 0.937  # SGD momentum/Adam beta1
weight_decay: 0.0005  # optimizer weight decay 5e-4
warmup_epochs: 3.0  # warmup epochs (fractions ok)
warmup_momentum: 0.8  # warmup initial momentum
warmup_bias_lr: 0.1  # warmup initial bias lr
box: 0.05  # box loss gain
cls: 0.5  # cls loss gain
cls_pw: 1.0  # cls BCELoss positive_weight
obj: 1.0  # obj loss gain (scale with pixels)
obj_pw: 1.0  # obj BCELoss positive_weight
iou_t: 0.20  # IoU training threshold
anchor_t: 4.0  # anchor-multiple threshold
# anchors: 3  # anchors per output layer (0 to ignore)
fl_gamma: 0.0  # focal loss gamma (efficientDet default gamma=1.5)
hsv_h: 0.015  # image HSV-Hue augmentation (fraction)
hsv_s: 0.7  # image HSV-Saturation augmentation (fraction)
hsv_v: 0.4  # image HSV-Value augmentation (fraction)
degrees: 0.0  # image rotation (+/- deg)
translate: 0.1  # image translation (+/- fraction)
scale: 0.5  # image scale (+/- gain)
shear: 0.0  # image shear (+/- deg)
perspective: 0.0  # image perspective (+/- fraction), range 0-0.001
flipud: 0.0  # image flip up-down (probability)
fliplr: 0.5  # image flip left-right (probability)
mosaic: 1.0  # image mosaic (probability)
mixup: 0.0  # image mixup (probability)
copy_paste: 0.0  # segment copy-paste (probability)

（2）anchor

YOL Ov5在yaml文件中预设好了输入图像为640 * 640分辨率对应的anchor尺寸，YOL Ov5的anchor也是在大特征图上检测组标.在小特征图上检测大目标。三个特征图，每个特征图上的格子有三种尺寸的anchor.

anchors:
  - [10,13, 16,30, 33,23]  # P3/8
  - [30,61, 62,45, 59,119]  # P4/16
  - [116,90, 156,198, 373,326]  # P5/32

（3）Backbone

YOLOV5 Backbone ，在models/yolov5s.yaml下

# YOLOv5 v6.0 backbone
backbone:
  # [from, number, module, args]
  # from   第一列 输入来自哪一层  -1代表上一层， 4代表第4层     
  # number 第二列 卷积核的数量    最终数量需要乘上width  
  # module 第三列 模块名称 包括：Conv Focus BottleneckCSP  SPP  
  # args   第四列 模块的参数   
  [[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2   卷积层的输入通道数为64，卷积核大小为6x6，步长为2，填充为2
   [-1, 1, Conv, [128, 3, 2]],  # 1-P2/4     卷积层的输入通道数为128，卷积核大小为3x3，步长为2，填充为2
   [-1, 3, C3, [128]],           #代表一个残差块residual block，C3表示该残差块使用的是C3卷积层，残差块的输入通道数为128
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],  # 9
  ]

（4）网络结构参数

根据训练过程验证网络结构，结合训练输出的网络结构信息

**backbone的前3个C3数量对应yolov5s.yaml的配置3，6，9分别除了3，变为1/3后的1，2，3,和模型深度参数有关depth_multiple: 0.33**

                 from  n    params  module                                  arguments
层数                  数量   参数量  模块名称                                网络结构参数：输入维度，输出维度，卷积核大小，卷积步长
  0                -1  1      3520  models.common.Conv                      [3, 32, 6, 2, 2]
  1                -1  1     18560  models.common.Conv                      [32, 64, 3, 2]
  2                -1  1     18816  models.common.C3                        [64, 64, 1]
  3                -1  1     73984  models.common.Conv                      [64, 128, 3, 2]
  4                -1  2    115712  models.common.C3                        [128, 128, 2]
  5                -1  1    295424  models.common.Conv                      [128, 256, 3, 2]
  6                -1  3    625152  models.common.C3                        [256, 256, 3]
  7                -1  1   1180672  models.common.Conv                      [256, 512, 3, 2]
  8                -1  1   1182720  models.common.C3                        [512, 512, 1]
  9                -1  1    656896  models.common.SPPF                      [512, 512, 5]
 10                -1  1    131584  models.common.Conv                      [512, 256, 1, 1]
 11                -1  1         0  torch.nn.modules.upsampling.Upsample    [None, 2, 'nearest']
 12           [-1, 6]  1         0  models.common.Concat                    [1]
 13                -1  1    361984  models.common.C3                        [512, 256, 1, False]
 14                -1  1     33024  models.common.Conv                      [256, 128, 1, 1]
 15                -1  1         0  torch.nn.modules.upsampling.Upsample    [None, 2, 'nearest']
 16           [-1, 4]  1         0  models.common.Concat                    [1]
 17                -1  1     90880  models.common.C3                        [256, 128, 1, False]
 18                -1  1    147712  models.common.Conv                      [128, 128, 3, 2]
 19          [-1, 14]  1         0  models.common.Concat                    [1]
 20                -1  1    296448  models.common.C3                        [256, 256, 1, False]
 21                -1  1    590336  models.common.Conv                      [256, 256, 3, 2]
 22          [-1, 10]  1         0  models.common.Concat                    [1]
 23                -1  1   1182720  models.common.C3                        [512, 512, 1, False]
 24      [17, 20, 23]  1    229245  models.yolo.Detect                      [80, [[10, 13, 16, 30, 33, 23], [30, 61, 62, 45, 59, 119], [116, 90, 156, 198, 373, 326]], [128, 256, 512]]
Model summary: 214 layers, 7235389 parameters, 7235389 gradients, 16.6 GFLOPs

自定义数据集使用pytorch框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测知识鱼丸 machine learning 逻辑回归算法机器学习
1.数据准备首先，我们需要一些示例数据。在这个例子中，我们将生成一些简单的二维数据点，并为其分配标签。2.定义逻辑回归模型接下来，我们定义一个简单的逻辑回归模型。3.训练模型定义损失函数和优化器，然后进行模型训练。4.保存模型训练完成后，我们可以保存模型的状态字典。5.加载模型并进行预测加载保存的模型，并进行预测。importtorchimporttorch.nnasnnimporttorch.o
梯度提升用于高效的分类与回归纠结哥_Shrek 分类回归数据挖掘
使用决策树（DecisionTree）实现梯度提升（GradientBoosting）主要是模拟GBDT（GradientBoostingDecisionTrees）的原理，即：第一棵树拟合原始数据计算残差（负梯度方向）用新的树去拟合残差累加所有树的预测值重复步骤2-4，直至达到指定轮数下面是一个纯Python+PyTorch实现GBDT（梯度提升决策树）的代码示例。1.纯Python实现梯度提升
yolov11网页版2.0（附源码+响应式） Pan_peter Python YOLO 网页端预测系统目标检测
演示视频：（功能演示）yolov11网页版2.0（附源码+响应式）_哔哩哔哩_bilibili项目链接：https://blog.csdn.net/Pan_peter/article/details/145130452,视频播放量0、弹幕量0、点赞数0、投硬币枚数0、收藏人数0、转发人数0,视频作者电石QwQ,作者简介不甘寂寞，相关视频：1.14全新！！【RVC变声器】无需声卡！0延迟！支持ios
pytorch深度Q网络纠结哥_Shrek pytorch 人工智能 python
DQN引入了深度神经网络来近似Q函数，解决了传统Q-learning在处理高维状态空间时的瓶颈，尤其是在像Atari游戏这样的复杂环境中。DQN的核心思想是使用神经网络Q(s,a;θ)Q(s,a;\theta)Q(s,a;θ)来近似Q值函数，其中θ\thetaθ是神经网络的参数。DQN的关键创新包括：经验回放（ExperienceReplay）：在强化学习中，当前的学习可能会依赖于最近的经验，容易
COCO8 数据集上训练 YOLO11n：从入门到跑路（100 轮训练实战）星际编程喵 Python探索之旅目标跟踪人工智能计算机视觉机器学习
前言训练YOLO11n，听起来就像是给赛博世界的“战斗天使”装上双核发动机，而COCO8数据集，则是那个小小的试验场。今天，我们就要在这个数据集上训练YOLO11n模型100轮，见证它如何从一个懵懂的“AI萌新”成长为“目标检测大佬”。本篇文章将以专业又幽默的方式，带你深入了解训练流程，并提供完整代码示例，让你轻松掌握这项技术。简介YOLO（YouOnlyLookOnce）是目标检测领域的明星模型
VS2019+QT4.15+openCV4.5.1+CUDA加速小小秀峰哥 python 人工智能深度学习
文章目录前言一、软件安转以及注意事项二、CMake编译总结前言`最近公司有一个关于使用海康威视网络摄像头的目标检测的项目，发现使用openCV显示时，出现很大的延时，因此，只能使用cuda进行加速才能使显示达到实时，在进行编译时我发现很多问题，解决了好几天才完成编译一、软件安转以及注意事项1、Windows10系统2、VisualStudio2019与QT4.15（先安装）3、CUDA11.8、c
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-head.py 红色的山茶花 YOLO 笔记深度学习
head.pyultralytics\nn\modules\head.py目录head.py1.所需的库和模块2.classDetect(nn.Module):3.classSegment(Detect):4.classOBB(Detect):5.classPose(Detect):6.classClassify(nn.Module):7.classWorldDetect(Detect):8.cl
Deepseek 对种猪市场会带来哪些影响？百态老人笔记大数据人工智能
DeepSeek对种猪市场的影响可以从以下几个方面进行分析：1.提高生产效率与降低成本根据，DeepSeek已经被用于养猪场中分析饲料配比，从而将猪的育肥周期从6个月缩短至5个月，并降低了15%的成本。这表明DeepSeek在优化养殖流程和提高生产效率方面具有显著作用，能够帮助养猪场降低运营成本，提升经济效益。2.推动智能化养殖技术的应用和提到，深度学习技术（如YOLOv5模型）已经被应用于生猪的
YOLOv11小白的进击之路（六）创新YOLO的iou及损失函数时的源码分析水静川流 YOLO YOLO pytorch yolo 计算机视觉人工智能 python
iou或者说是损失函数的修改经常作为论文的创新点之一，那这篇文章就总结分析了在对YOLO11进行损失函数创新时需要关注的源代码，新的一年祝大家论文与财都发发发！总的来看需要关注三个函数，分别位于YOLO庞大源码的不同文件，下面逐一分析：bbox_iou函数bbox_iou函数位于/ultralytics-main/ultralytics/utils/metrics.py，这个函数的目的是计算两个边
如何使用深度学习中的 Transformer 算法进行视频目标检测 go5463158465 python 算法深度学习 python 开发语言
以下将介绍如何使用深度学习中的Transformer算法进行视频目标检测，并给出一个复现相关论文思路及示例代码。这里以DETR（End-to-EndObjectDetectionwithTransformers）为基础进行说明，它是将Transformer引入目标检测领域的经典论文。步骤概述环境准备：安装必要的库，如PyTorch、torchvision等。数据准备：使用公开的视频目标检测数据集，
SpringBoot中运行Yolov5程序 eqa11 spring boot YOLO 后端
文章目录SpringBoot中运行Yolov5程序一、引言二、环境搭建1、SpringBoot项目创建2、YOLOv5环境配置三、SpringBoot与YOLOv5集成1、创建Python服务2、SpringBoot调用Python服务四、使用示例1、创建控制器五、总结SpringBoot中运行Yolov5程序一、引言在人工智能领域，目标检测是一个热门且实用的技术。YOLOv5作为目标检测算法中的
pytorch实现主成分分析 (PCA)：用于数据降维和特征提取纠结哥_Shrek pytorch 人工智能 python
使用PyTorch实现主成分分析（PCA）可以通过以下步骤进行：标准化数据：首先，需要对数据进行标准化处理，确保每个特征的均值为0，方差为1。计算协方差矩阵：计算数据的协方差矩阵，以捕捉特征之间的关系。特征值分解：对协方差矩阵进行特征值分解，获得主成分。选择主成分：根据特征值的大小选择前几个主成分，通常选择方差最大的主成分。转换数据：将数据投影到选定的主成分上，完成降维。例子代码：importto
使用PyTorch实现线性SVM指南余桢钟
使用PyTorch实现线性SVM指南svm-pytorchLinearSVMwithPyTorch项目地址:https://gitcode.com/gh_mirrors/sv/svm-pytorch本指南基于GitHub上的开源项目svm-pytorch，旨在帮助开发者理解和运用这个库来在PyTorch框架下实现支持向量机（SupportVectorMachines,SVM）。项目介绍sparse
conda从本地安装包幽殇默 pytorch conda
第一步：先下载需要的包。常用的网址1：https://mirrors.tuna.tsinghua.edu.cn/清华大学开源软件镜像站官网常用的网址2：https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/win-64/?C=M&O=D清华大学开源软件镜像站pytorh下载网址常用的网址3：https://anaconda.org/
YOLO 目标检测编程详解不知名靓仔 YOLO 目标检测人工智能
引言目标检测是计算机视觉中的一个重要任务，它旨在识别图像中的对象并定位这些对象的位置。YOLO（YouOnlyLookOnce）是一种流行的目标检测算法，因其速度快且准确度高而广受好评。本文将深入探讨YOLO的原理及其实现方法，并提供一个使用Python和PyTorch的示例代码。项目源码见最下方1.YOLO算法简介YOLO算法的核心思想是将目标检测视为回归问题，而不是传统的分类加定位的两阶段方法
Torchserve服务开发 qq_27844739 AI工程化运维人工智能 pytorch 服务器
Torchserve服务开发文章目录Torchserve服务开发0.Torchserve介绍0.1.背景0.2.API类型1.开发使用1.0.环境部署1.1.handler开发1.1.1.context参数1.1.2.data参数1.2.handler调试2.配置文件3.batch推理0.Torchserve介绍0.1.背景TorchServe是PyTorch中推荐的模型部署解决方案，通过它可以将
Python实现YOLO目标检测我专门写bug PYTHON python YOLO 目标检测
#-*-coding:utf-8-*-#载入所需库importcv2importnumpyasnpimportosimporttimedefyolo_detect(pathIn='',pathOut=None,confidence_thre=0.5,nms_thre=0.3,jpg_quality=80):#pathIn：原始图片的路径#pathOut：结果图片的路径#label_path：类别标
【yolo目标检测】交通标志检测鱼弦【HOT】技术热谈 YOLO 目标检测人工智能
鱼弦：CSDN内容合伙人、CSDN新星导师、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）YOLO（YouOnlyLookOnce）是一种流行的实时目标检测算法，可用于交通标志检测。以下是关于YOLO目标检测的原理详细解释、使用场景解释以及相关文献材料的链接：原理详细解释：YOLO目标检测
PyTorch 框架实现线性回归：从数据预处理到模型训练全流程大模型铲屎官 PyTorch pytorch 线性回归人工智能深度学习 python
系列文章目录Pytorch基础篇01-PyTorch新手必看：张量是什么？5分钟教你快速创建张量！02-张量运算真简单！PyTorch数值计算操作完全指南03-Numpy还是PyTorch？张量与Numpy的神奇转换技巧04-揭秘数据处理神器：PyTorch张量拼接与拆分实用技巧05-深度学习从索引开始：PyTorch张量索引与切片最全解析06-张量形状任意改！PyTorchreshape、tra
【YOLOv11改进- 主干网络】YOLOv11+MobileNetV2（2018）: 相比于 MobileNetV1 而言准确率更高，模型更小；算法conv_er YOLOv11目标检测改进 YOLO 网络 cnn 深度学习机器学习目标检测人工智能
YOLOV11目标检测-主干网络改进实例与创新改进专栏目录YOLOV11目标检测-主干网络改进实例与创新改进专栏本文介绍1.完整代码获取2.MobileNetv2介绍摘要亮点优势3.MobileNetv2网络结构图4.yolov11-MobileNetv2yaml文件5.MobileNetv2代码实现6.MobileNetv2添加方式论文地址：MobileNetV2:InvertedResidua
【YOLOv11改进- 主干网络】YOLOv11+TransNext特征提取网络（CVPR2024）: 基于YOLOv11的主干网络改进超轻量；算法conv_er YOLOv11目标检测改进 YOLO 网络人工智能深度学习机器学习目标检测
YOLOV11目标检测-主干网络改进实例与创新改进专栏目录YOLOV11目标检测-主干网络改进实例与创新改进专栏本文介绍1.完整代码获取2.TransNext介绍摘要亮点优势3.TransNext网络结构图4.yolov11-transNextyaml文件5.TransNext代码实现6.TransNext添加方式论文地址：http://arxiv.org/pdf/2311.17132http:/
Window Mamba 环境安装【CUDA】红豆布丁 python mamba ssm cuda
WindowMamba环境安装1.安装PyTorch环境2.直接安装Mamba及其依赖3.手动编译Mamba及其依赖1.安装PyTorch环境condacreate-nmambapython=3.10condaactivatemambacondainstallcudatoolkit==11.8pipinstalltorch==2.1.1torchvision==0.16.1torchaudio==
【YOLOv11改进- 注意力机制】YOLOv11+SCSA注意力机制（2024）: 最新空间和通道协同注意力,助力YOLOv11有效涨点；包含二次创新算法conv_er YOLOv11目标检测改进 YOLO 深度学习人工智能目标检测计算机视觉机器学习
YOLOV11目标检测改进实例与创新改进专栏专栏地址：YOLOv11目标检测改进专栏，包括backbone、neck、loss、分配策略、组合改进、原创改进等；本文介绍本文给大家带来的改进内容是在YOLOv11中添加SCSA注意力机制，助力有效涨点。作者提出了一种新的空间与通道协同注意模块（SCSA），该模块涉及在多个语义层面上对空间注意力和通道注意力之间协同关系的研究。SCSA由两部分组成：可共
【计算机视觉】目标跟踪应用油泼辣子多加计算机视觉计算机视觉目标跟踪人工智能
一、简介目标跟踪是指根据目标物体在视频当前帧图像中的位置，估计其在下一帧图像中的位置。视频帧由t到t+1的检测，虽然也可以使用目标检测获取，但实际应用中往往是不可行的，原因如下：目标跟踪的目的是根据目标在当前视频帧图像中的位置，预测其在下一帧图像中的位置。然而，使用目标检测直接获取目标位置的方式在实际应用中存在一些限制，主要原因如下：1.实时性问题频繁检测开销大：目标检测通常需要对每一帧的整个图像
ERROR: Could not find a version that satisfies the requirement torch-sparse ERROR: No matching distr 海洋之心图神经网络 pytorch 深度学习人工智能 python 机器学习
文章目录问题描述：原因分析：解决方案：问题描述：在使用!pipinstall--no-indextorch-sparse-fhttps://pytorch-geometric.com/whl/torch-1.7.0+cu102.html安装torch-sparse时出现如下问题ERROR:Couldnotfindaversionthatsatisfiestherequirementtorch-sp
自建stgcn数据集并训练青年夏日科技工作者 AI编程
参考了许多博文，慢慢地也就把st-gcn跑出来了，参考的文章一会附在文章里面，实测有用。1.安装st-gcn复现STGCNCPU版（ubuntu16.04+pytorch0.4.0+openpose+caffe）_Significance的博客-CSDN博客复现旧版STGCNGPU版（win10+openpose1.5.0）_Significance的博客-CSDN博客22.准备训练数据集官方使用
Tensor 基本操作2 理解 tensor.max 操作，沿着给定的 dim 是什么意思 | PyTorch 深度学习实战 Chatopera 研发团队机器学习深度学习 pytorch 人工智能
前一篇文章，Tensor基本操作1|PyTorch深度学习实战本系列文章GitHubRepo:https://github.com/hailiang-wang/pytorch-get-started目录Tensor基本操作torch.max默认指定维度Tensor基本操作torch.maxtorch.max实现降维运算，基于指定的dim选取子元素的最大值。默认a=torch.randn(1,3)p
【图像超分】论文复现：万字长文！Pytorch实现EDSR！代码修改无报错！踩坑全记录！适合各种深度学习新手！帮助你少走弯路！附修改后的代码和PSNR最优的模型权重文件！十小大超分辨率重建（理论+实战科研+应用）深度学习 pytorch 人工智能超分辨率重建图像处理计算机视觉图像超分
第一次来请先看这篇文章：【超分辨率（Super-Resolution）】关于【超分辨率重建】专栏的相关说明，包含专栏简介、专栏亮点、适配人群、相关说明、阅读顺序、超分理解、实现流程、研究方向、论文代码数据集汇总等）修改后代码和权重文件下载见文末链接！！！包含制作好的h5数据集和最优性能权重文件，可直接用于测试。本文亮点：讲解细致，EDSR流程全通，代码注释丰富，适合新手入门阅读深度思考，踩坑报错全
【人工智能】Python常用库-PyTorch常用方法教程 IT古董人工智能机器学习 Python 人工智能 python pytorch 机器学习
PyTorch是一个强大的开源深度学习框架，以其灵活性和动态计算图而广受欢迎。以下是PyTorch的详细教程，涵盖从基础到实际应用的使用方法。1.安装与导入1.1安装PyTorch访问PyTorch官方网站，根据系统、Python版本和CUDA支持选择安装命令。常用安装命令：pipinstalltorchtorchvisiontorchaudio1.2导入库importtorchimporttor
YOLOv8改进策略【Backbone/主干网络】| 替换骨干网络为2023-CVPR ConvNeXt V2 （附网络详解和完整配置步骤） Limiiiing YOLOv8改进专栏 YOLO 深度学习计算机视觉目标检测
一、本文介绍本文记录的是将ConvNeXtV2应用到YOLOv8中的改进方法研究。本文将ConvNeXtV2应用于YOLOv8，一方面利用全卷积掩码自动编码器在训练时优化特征学习，减少模型对大规模标注数据的依赖；另一方面，通过全局响应归一化层增强特征竞争，缓解特征坍塌问题，提高特征多样性。本文在YOLOv8的基础上配置了原论文中convnextv2_atto,convnextv2_femto,co
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio