老狼IT工作室

[YOLOv8] 数据集训练参数详解

什么是YOLO训练？

YOLO(You Only Look Once)是一种实时目标检测算法，最早由 Joseph Redmon 等人于2016年提出。与传统的目标检测算法相比，YOLO具有速度快、精度高、可扩展性强等优点，因此在计算机视觉领域得到了广泛的应用。

YOLO的训练过程包括两个主要步骤：数据收集和模型训练。

数据收集：需要收集大量的带有标注的数据集，包括图像和对应的目标标注信息。标注信息通常使用边界框和类别标签来表示目标的位置和类型。

[YOLOv8] 缺陷检测之数据集标注(LabelImg，LabelMe，AnyLabeling，LabelStudio等)

模型训练：使用收集到的数据集对YOLO模型进行训练，通过反向传播算法不断调整模型参数，使其能够更好地拟合数据分布，从而提高检测准确率。

[YOLOv8] 详细教程 - 缺陷检测之训练自定义数据集(含图文）

YOLO的训练过程使用了卷积神经网络(CNN)的结构，将输入图像划分为多个网格单元，并在每个网格单元中预测目标的位置和类别概率分布。同时，YOLO还采用了一些技巧来加速训练和提高检测速度，例如使用梯度裁剪、走分层和融合技术等。

YOLOv8训练参数列表

训练 - Ultralytics YOLOv8 文档

YOLO模型的训练设置是指用于对数据集进行模型训练的各种超参数和配置。这些设置会影响模型的性能、速度和准确性。一些常见的YOLO训练设置包括批大小、学习率、动量和权重衰减。其他可能影响训练过程的因素包括优化器的选择、损失函数的选择以及训练数据集的大小和组成。仔细调整和实验这些设置以实现给定任务的最佳性能是非常重要的。

训练自定义数据集例子

from ultralytics import YOLO

if __name__ == '__main__':
    # 加载一个模型
    model = YOLO('D:/my_project/wepy/src/wepy/aitool/train/runs/detect/train3/weights/best.pt') # 从权重文件初始化模型
    # model = YOLO('yolov8n.yaml')  # 从YAML建立一个新模型
    # 训练模型
    results = model.train(
        data='D:/YOLOv8Train/jj_dataset/data.yaml',
        device='0',
        epochs=200,  # 训练过程中整个数据集将被迭代多少次,显卡不行你就调小点
        batch=8,  # 一次看完多少张图片才进行权重更新
        verbose=False,
        patience=0,
        save=True,
        save_period=10,
        imgsz=640)

训练参数详解

model

指定了所使用的模型文件的位置，例如 yolov8n.pt 或 yolov8n.yaml。

“.yaml”和“.pt”和的区别：
“.pt”类型的文件，是预训练好的模型，里面包含了模型的网络结构和训练好的参数，已经具备了检测目标的能力。如果是自定义训练数据集特别大，非常耗时，可以使用上次训练好的模型（“.pt”文件）来开始训练，这样可以缩短训练时间。

“.yaml”文件描述了模型的网络结构，对于训练自定义的数据集，开始我们一般采用yolov8n.yaml这种.yaml文件的形式，等训练完生成“.pt”文件之后，可以考虑切换到“.pt”，但是并不意味这使用上一次训练生成的“.pt”文件来训练，就一定比使用“.yaml”文件重新训练要好。

data

训练数据集文件的位置，例如 coco128.yaml，或者自定义的数据集data.yaml。数据集文件包含了训练和验证所需的图像、标签。

例如：

names:
  0: normal
  1: dip
  2: black_hole
  3: bubble
nc: 4
test: D:\YOLOv8Train\v8_train_datasets\jj_dataset\test
train: D:\YOLOv8Train\v8_train_datasets\jj_dataset\train
val: D:\YOLOv8Train\v8_train_datasets\jj_dataset\val

[YOLOv8] - YOLO数据集格式介绍和案例

epochs

训练的轮数，默认值100。该参数设定了模型将会被训练多少次，每一轮都遍历整个训练数据集。训练的轮数越多，模型对数据的学习就越充分，但也增加了训练时间。

设置策略：
默认是100轮数。但一般对于自定义数据集，可以加大到300，可以观察每一轮训练的指标（mAP，Recall，Precision）来手动提前停止，或者通过“patience”参数来提前停止训练。

patience

早停的等待轮数，默认值50。在训练过程中，如果在一定的轮数内没有观察到模型性能的明显提升，就会停止训练。这个参数确定了等待的轮数，如果超过该轮数仍没有改进，则停止训练。

为什么要早停？
早停能减少过拟合。过拟合(overfitting)是指只能拟合训练数据，但不能很好地拟合不包含在训练数据中的其他数据的状态。

batch

每批图像数量（-1为自动批大小）。在训练过程中，数据被分成多个批次进行处理，每个批次包含一定数量的图像。这个参数确定了每个批次中包含的图像数量。如果设置为“-1”，则会自动调整批次大小，至你的显卡能容纳的最多图像数量。

设置策略：

每完成一批图像的训练，就会计算loss，进行权重参数的更新。如果你的数据集比较大，一般认为batch越大越好。因为batch越大意味batch中的图像更有可能代表整个数据集的分布，从而帮助模型更好的学习。但batch越大占的用显卡显存空间越多，你可以先设置一个偏大的值，比如32，如果报显存溢出，逐步减少调整到一个占用80%~90%之间的CPU占用率的batch值即可。

imgsz

输入图像的大小，以整数表示，默认值为640。可以指定一个整数值表示图像的宽和高为相同值，也可以是宽度和高度的组合。例如640表示图像的宽度和高度均为640像素。

设置策略：

YOLOv8官网提供的训练集的imgsz基本上都是使用640。如果数据集中存在大量小对象，增大输入图像的尺寸imgsz可以使得这些小对象从高分辨率中受益，更好的被检测出。你可以根据你收集的数据集的图像特点，图像大小分布，来进行自定义，看看哪个imgsz效果最好。

save

是否保存训练的检查点和预测结果，默认值为True。当设置为true时，模型的权重和训练状态会被保存下来，以便在需要时进行恢复或继续训练。预测结果也可以被保存下来以供后续分析和评估。

save_period

每x轮次保存检查点（如果<1则禁用），默认值为“-1”。该参数用来设置保存检查点的频率，例如设置为10表示每隔10次训练轮数保存一次检查点。如果设置为负数，则表示禁用中间过程保存检查点功能。

使用场景：
如果训练因为不稳定中断后，可以和“resume”参数配合从中断前保存下来的检查点开始继续训练。

resume

从最后检查点恢复训练，默认为 False。如果设置为 True，将从最后一个检查点的状态继续训练。

cache

数据加载时是否使用缓存，默认为 False。该参数用来控制是否将数据加载到缓存中，以加快训练过程中的数据读取速度。如果为 True，选择在 RAM 内存中缓存数据，如果为 False，则从磁盘上上读取图像数据。

device

训练运行的设备，默认值为None。例如使用CUDA GPU 运行可以设定为 “device=0”，如果使用多个 GPU 运行可以设定为 “device=0,1,2,3”，如果没有可用的 GPU，可以设定为 “device=cpu” 使用 CPU 进行训练。数据集比较大时，使用cpu基本上是训练不动的，速度会非常慢。

workers

数据加载时的工作线程数（如果DDP则为每个RANK），默认值为8（目前主流的cpu都8核心以上）。这个参数确定了加载数据时使用的线程数，在数据加载过程中，可以使用增加workers值，以提高数据读取速度，具体的最佳值取决于硬件（CPU的个数）和数据集的大小。

project

项目名称，默认值为None。这个参数用于标识当前训练任务所属的项目，方便管理和组织多个训练任务。

name

实验名称，默认值名None。该参数为当前训练任务指定一个名称，以便于标识和区分不同的实验,

exist_ok

是否覆盖现有的实验，默认值为False。如果设置为 True，当实验名称已经存在时，将会覆盖现有实验。如果设置为 false，当实验名称已经存在时，将会报错。

pretrained

是否使用预训练模型，默认值为True。如果设置为 True，将加载预训练的模型权重进行训练，这有助于加快训练过程和提高模型性能。该参数需要和“model”参数结合使用，如果“model”参数设置的不是“.pt”文件，该参数无效。

optimizer

选择要使用的优化器，默认值为auto。优化器是深度学习中用于调整模型参数以最小化损失函数的算法。可以选择不同的优化器，如 ‘SGD’、‘Adam’、‘AdamW’、‘RMSProp’，根据任务需求选择适合的优化器。

verbose

是否打印详细输出，默认值为False。如果设置为 True，训练过程中会输出更详细的信息和日志，可以更好的帮助我们了解训练的细节。如果设置为 False，只会输出关键信息和结果。

seed

随机种子，用于实现可重复性，默认为0。通过设置相同的随机种子，可以使得每次运行时的随机过程保持一致，以便于结果的复现。

deterministic

是否启用确定性模式，默认值为True。启用确定性模式后，保证在相同的输入下，每次运行的结果是确定的，不会受到随机性的影响。（该参数和“seed”参数是否存在关系？）

non-deterministic inference by Yolov8 · Issue #3497 · ultralytics/ultralytics · GitHub

single_cls

将多类数据训练为单类，默认值为False。如果设置为 True，将会将多类数据视为单一类别进行训练。

rect

使用矩形训练，每个批次进行最小填充，默认值为False。

矩形训练是什么？

yolov5中的Rectangular training和Rectangular inference

cos_lr

使用余弦学习率调度器，默认值为False。如果设置为 True，将使用余弦函数调整学习率的变化情况。

余弦学习率调度器是一种常见的学习率调度算法，用于在训练神经网络时调整模型参数的更新步长。它根据当前训练的进度和预设的目标，按照余弦函数的方式来调整学习率的大小，使得模型能够更好地收敛到最优解。

具体来说，余弦学习率调度器会在每个训练周期开始时计算一个初始的学习率，然后在训练过程中不断调整该学习率的大小和方向，以满足不同的训练目标。通常情况下，余弦学习率调度器会在训练初期采用较大的学习率，以便快速探索参数空间；而在训练后期则会逐渐减小学习率，以保证模型能够稳定收敛到最优解。

余弦学习率调度器的优点在于其具有自适应性、可调节性和普适性等特点，可以适用于不同的神经网络结构和训练场景。同时，由于其简单易实现且效果良好，因此被广泛应用于深度学习领域的各种应用中。

close_mosaic

最后轮次禁用马赛克增强（0为禁用），默认值为10。可以设定一个整数值，表示在训练的最后第几个轮次中禁用mosaic增强。

mosaic是什么？

mosaic数据增强是一种在YOLOv4中首次引入的数据增强技术，它可以将4张训练图像以一定的比例合并成一张。这样可以让模型学习如何在比正常更小的尺度上识别物体，也可以在训练中显著减少对大批量大小的需求。

Mosaic数据增强方法是YOLOV4论文中提出来的，主要思想是将四张图片进行随机裁剪，再拼接到一张图上作为训练数据。
这样做有以下几个优点：
1、增加了数据的多样性，丰富了图片的背景。
2、增加了目标个数
3、四张图片拼接在一起变相地提高了batch_size，在进行BN操作时的时候可以更好的统计均值和方差

YOLOv4: Optimal Speed and Accuracy of Object Detection

数据增强之Mosaic数据增强的优点、Mixup,Cutout,CutMix的区别_mosaic data augmentation

amp

是否使用自动混合精度（Automatic Mixed Precision，AMP）训练，默认为True。AMP 是一种深度学习训练技术，利用半精度浮点数加速训练过程，可以减少显存占用。

fraction

训练的数据集比例，默认为1.0（即训练集中的所有图像）。

profile

在训练期间为记录器分析ONNX和TensorRT速度。默认值为False。

freeze

在训练期间冻结前n层，或冻结层索引列表（int 或 list, 可选)。默认值为None。

lr0

初始学习率，默认值为0.01。学习率是控制模型参数更新步幅的超参数，初始学习率确定了训练开始时的参数更新速度。

lrf

最终学习率系数，最终学习率= (lr0 * lrf)，默认值为0.01。最终学习率是通过初始学习率乘以该比例系数得到的，用于控制训练过程中学习率的衰减。

momentum

SGD 优化器的动量/Adam 优化器的 beta1，默认值为0.937。动量是一种加速梯度下降过程的技术，用于增加参数更新的稳定性。

动量是什么？

动量(Momentum)是一种常用的机器学习优化算法，用于加速梯度下降过程并提高模型的收敛速度和准确性。它通过在每次迭代时沿着梯度方向更新模型参数的同时，引入一个动量项来抵消之前梯度下降过程中的惯性效应，从而更好地利用历史信息进行优化。

具体来说，动量的思想是将之前的梯度乘上一个系数(通常取值为0.9),然后将这个结果加到当前的梯度上，得到新的梯度。在更新模型参数时，不仅要考虑当前的梯度大小，还要考虑之前更新过的参数对梯度的影响。这样可以使得模型在训练初期更快地朝最优解靠近，同时也可以避免陷入局部最优解。

动量算法的优点在于其简单易实现且效果良好，可以适用于各种机器学习任务中。同时，由于其具有一定的鲁棒性和泛化能力，因此也被广泛应用于深度学习领域的各种应用中。

weight_decay

优化器的权重衰减（weight decay），默认值为0.0005。

权重衰减是什么？

权重衰减是一种正则化技术，用于减小模型复杂度，防止过拟合。

深度学习中权重衰减(Weight Decay)是一种常用的正则化技术，用于防止模型过拟合和梯度消失等问题。它通过在损失函数中添加一个与模型参数大小相关的正则项来实现，使得模型的参数更新更加稳定和可控。

具体来说，权重衰减的思想是在损失函数中添加一个与模型参数大小相关的正则项，例如L1正则化或L2正则化。对于L1正则化，正则项为所有模型参数的绝对值之和；对于L2正则化，正则项为所有模型参数的平方和。在每次参数更新时，除了考虑当前的梯度大小外，还需要将正则项加入到梯度中进行更新。

权重衰减的优点在于其简单易实现且效果良好，可以适用于各种深度学习任务中。同时，由于其具有一定的鲁棒性和泛化能力，因此也被广泛应用于深度学习领域的各种应用中。需要注意的是，权重衰减也有可能会导致模型收敛速度变慢或者陷入局部最优解，因此需要根据具体情况进行权衡和选择。

warmup_epochs

热身阶段的轮数，默认值3.0。热身阶段是训练过程中初始阶段的一部分，在此阶段内，学习率和动量等参数逐渐增加，以帮助模型更好地适应训练数据。

warmup_momentum

热身阶段的初始动量，默认值为0.8。在热身阶段开始时，动量的初始值。

warmup_bias_lr

热身阶段的初始偏置学习率，默认为0.1。在热身阶段开始时，偏置学习率的初始值。

box

边界框损失权重，默认值为7.5。用于调整边界框损失的权重，以控制其在总损失中的贡献程度

如果你希望更精准的边界框的定位你可以增加box的值。

cls

类别损失权重，默认值为0.5。用于调整类别损失的权重，以控制其在总损失中的贡献程度（按像素进行缩放）。

如果你希望更精准的类别判断你可以增加cls的值。

dfl

DFL（Dynamic Freezing Loss）损失权重，默认值为1.5。用于调整 DFL 损失的权重，以控制其在总损失中的贡献程度。

DFL是什么？

Dynamic Freezing Loss是一种用于目标检测任务中的损失函数，它可以有效地解决目标检测中存在的类别不平衡问题。传统的目标检测损失函数通常采用交叉熵损失函数，但这种损失函数对于小样本数据集和少数类样本的预测效果较差。

Dynamic Freezing Loss通过引入一个动态阈值来解决这个问题。具体来说，它在计算损失时会根据当前模型对每个类别的预测置信度来动态地调整阈值，使得模型对于少数类样本的预测更加准确。当模型对某个类别的预测置信度低于阈值时，该类别的损失会被设置为一个较大的值，从而增加模型对该类别的关注度；反之，当模型对某个类别的预测置信度高于阈值时，该类别的损失会被设置为一个较小的值，从而减少模型对该类别的关注度。

Dynamic Freezing Loss的优点在于其可以有效地解决目标检测中的类别不平衡问题，提高模型对于少数类样本的预测精度。同时，由于其具有一定的可解释性，因此也可以用于解释模型的预测结果。

DFL应用于类别不平衡的情形（当某些类别出现频率过高，而另一些类别出现频率较低）。

Focal Loss for Dense Object Detection

pose

姿态损失权重（仅姿态），默认值为12.0。用于调整姿态损失的权重，以控制其在总损失中的贡献程度（仅应用于姿态相关任务）。

kobj

关键点目标损失权重（仅姿态），默认值为2.0。用于调整关键点目标损失的权重，以控制其在总损失中的贡献程度（仅应用于姿态相关任务）。

label_smoothing

标签平滑（label smoothing），默认值为0.0。标签平滑是一种正则化技术，用于减少模型对训练数据的过拟合程度。

标签平滑是什么？

标签平滑(Label Smoothing)是一种用于解决目标检测任务中类别不平衡问题的技术，它通过给每个类别的标签分配一个额外的概率值来实现。具体来说，对于一个有n个类别的数据集，标签平滑会为每个类别分配一个介于0和1之间的概率值，例如p = 0.1表示将某个类别的标签概率降低10%。

在目标检测任务中，通常会出现一些类别的样本数量远远少于其他类别的情况，例如人脸检测中的“人”类别就经常出现这种情况。如果直接使用交叉熵损失函数进行训练，会导致模型对于这些少数类样本的预测效果较差。而标签平滑可以通过给这些少数类样本的标签分配更高的概率值来提高模型的预测精度。

需要注意的是，标签平滑也有可能会导致模型对某些类别的预测效果变差，因此需要根据具体情况进行权衡和选择。此外，标签平滑也可以与权重衰减等技术结合使用，以进一步提高模型的鲁棒性和泛化能力。

nbs

标准批次大小（nominal batch size），默认值为64。设置训练过程中每个批次的大小。

overlap_mask

训练时是否要求蒙版重叠（仅用于分割训练），默认值为True。如果设置为 True，则要求训练过程中的蒙版（mask）重叠。

mask_ratio

蒙版下采样比例（仅用于分割训练），默认值为4。用于控制蒙版下采样的比例。

dropout

是否使用丢弃正则化（dropout regularization）（仅用于分类训练），默认值为0.0。如果设置为非零值，则在训练过程中使用丢弃正则化来减少模型的过拟合。

val

是否在训练过程中进行验证/测试，默认值为True。如果设置为 True，将在训练过程中进行验证或测试，以评估模型的性能。

【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
钢筋长度超限检测检数据集VOC+YOLO格式215张1类别 futureflsl 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：215标注数量(xml文件个数)：215标注数量(txt文件个数)：215标注类别数：1标注类别名称:["iron"]每个类别标注的框数：iron框数=215总框数：215使用标注工具：labelImg标注规则：对类别进
COCO 格式的数据集转化为 YOLO 格式的数据集 QYQY77 YOLO python
"""--json_path输入的json文件路径--save_path保存的文件夹名字，默认为当前目录下的labels。"""importosimportjsonfromtqdmimporttqdmimportargparseparser=argparse.ArgumentParser()parser.add_argument('--json_path',default='./instances
yolov5＞onnx＞ncnn＞apk 图像处理大大大大大牛啊 opencv实战代码讲解 yolo onnx ncnn 安卓
一.yolov5pt模型转onnx条件：colabnotebookyolov51.安装环境!pipinstallonnx>=1.7.0#forONNXexport!pipinstallcoremltools==4.0#forCoreMLexport!pipinstallonnx-simplifier2.修改common.py在classFocus下面
[数据集][目标检测]汽车头部尾部检测数据集VOC+YOLO格式5319张3类别 FL1623863129 数据集目标检测汽车 YOLO
数据集制作单位：未来自主研究中心(FIRC)版权单位：未来自主研究中心(FIRC)版权声明：数据集仅仅供个人使用，不得在未授权情况下挂淘宝、咸鱼等交易网站公开售卖,由此引发的法律责任需自行承担数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：5319标注数量(xml文件
遥感图像分割系统：融合空间金字塔池化（FocalModulation)改进YOLOv8 xuehaisj YOLO 人工智能计算机视觉 yolov8
1.研究背景与意义项目参考AAAIAssociationfortheAdvancementofArtificialIntelligence研究背景与意义遥感图像分割是遥感技术领域中的一个重要研究方向，它的目标是将遥感图像中的不同地物或地物类别进行有效的分割和识别。随着遥感技术的不断发展和遥感图像数据的大规模获取，遥感图像分割在农业、城市规划、环境监测等领域具有广泛的应用前景。然而，由于遥感图像的特
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
基于YOLOV5人脸检测打上码赛克 Deep-white YOLO 人工智能深度学习
还在为自己的隐私而烦恼吗，还在为拍摄的视频因不想露脸而无法发布吗。yolov5检测人脸，并打上马赛克，保护自己的隐私。只需下载代码，解压缩后就可以传入你想要打马赛克的视频或者图片了。这个是需要你对代码有一些了解的，等我开发一下使大家都可以用。里面权重已经训练好了，也有一些人脸的数据集，数据量不多，训练完的权重不是很好，但是给自己的视频打上马赛克足够了。大家要是想去增加数据集，可以使用里面的权重利用
yolov5单目测距+速度测量+目标跟踪 cv_2025 YOLO 目标跟踪人工智能计算机视觉机器学习图像处理 opencv
要在YOLOv5中添加测距和测速功能，您需要了解以下两个部分的原理：单目测距算法单目测距是使用单个摄像头来估计场景中物体的距离。常见的单目测距算法包括基于视差的方法（如立体匹配）和基于深度学习的方法（如神经网络）。基于深度学习的方法通常使用卷积神经网络（CNN）来学习从图像到深度图的映射关系。单目测距代码单目测距涉及到坐标转换，代码如下：defconvert_2D_to_3D(point2D,R,
粉尘识别数据集——工地/矿下粉尘数据识别，数据集已划分，YOLO格式-有权重，相关指数，map相当高毕设宇航 YOLO 机器学习目标跟踪
数据集名称粉尘识别数据集数据集描述这是一个专门针对工地或矿下粉尘识别设计的数据集，包含了大量的高清图像，用于识别施工或采矿环境中产生的粉尘。数据集已经按照标准的数据划分方法分为训练集、验证集和测试集，并且以YOLO格式进行了标注。此外，数据集中还包含了预训练的模型权重和相关性能指标，如mAP（MeanAveragePrecision），表明模型在粉尘识别任务上的表现优异。数据集特点高清图像：所有图
YOLOV8改进-C2f添加Deformable Conv V2 森爱。 YOLOV8改进 YOLO
目录1DeformableConvV2介绍2YOLOV8添加DeformableConvV22.1代码添加到Blocks2.1.1C2f_DCN代码2.1.2加入_all_导入2.1.3加入modules导入2.2添加至运行模块tasks2.2.1导入包2.2.2解析参数添加2.3在_init_中增加名称2.4模型配置文件yaml替换1DeformableConvV2介绍论文地址:https://
结合YOLOv8和OpenCV WeChat QRCode打造一款二维码识别器搜狐技术产品小编2023 YOLO opencv 微信人工智能计算机视觉
本文字数：3876字预计阅读时间：25分钟01引言二维码（QRCode）在现代生活中有广泛应用，从支付系统到信息传递，它们无处不在。本文提出了一种如何识别二维码的方法，主要贡献在于优化处理分辨率较高的图像时，由于二维码在整张图片中占据的比例较小，传统的OpenCVWeChatQRCode的识别方法表现不佳的问题。下面描述详细的优化过程。02OpenCVWeChatQRCodeWeChatQRCod
【目标检测数据集】番茄叶片病害数据集13940张9类VOC+YOLO格式熬夜写代码的平头哥∰ 数据集目标检测 YOLO 目标跟踪
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：13946标注数量(xml文件个数)：13946标注数量(txt文件个数)：13946标注类别数：9标注类别名称:["EarlyBlight","Healthy","LateBlight","LeafMiner","Le
YOLOv8数据增强热心小张研究生 yolov8
1.找到augment.py（ultralytics/data/augment.py），修改对应内容#TransformsT=[A.Blur(p=0.01),A.MedianBlur(p=0.01),A.ToGray(p=0.01),A.CLAHE(p=0.01),A.RandomBrightnessContrast(p=0.0),A.RandomGamma(p=0.0),A.ImageCompr
[数据集][目标检测]血细胞检测数据集VOC+YOLO格式2757张4类别 FL1623863129 数据集目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：2757标注数量(xml文件个数)：2757标注数量(txt文件个数)：2757标注类别数：4标注类别名称:["Platelets","RBC","WBC","sicklecell"]每个类别标注的框数：Platelet
目标检测YOLO系列从入门到精通技术详解100篇-【目标检测】工业相机格图素书数码相机目标检测人工智能
目录知识储备深度相机1TOF2双目视觉3结构光4智能门锁应用5手机应用算法原理相机的成像与标定模型相机标定的实施·标定过程的算法实施相机标定的扩展CCD工业相机、镜头倍率及相关参数计算方法知识储备深度相机1TOF1.1Kinectv2Kinectv2是Microsoft在2014年发售的，如图1-1所示。相比于Kinectv1在硬件和软件上作出了很大的进化，且在深度测量的系统和非系统误差方面表现出
ERROR: Could not install packages due to an OSError: [Errno 2] No such file or directory:错误解决 nomoremorphine python pip 计算机视觉目标检测
安装yolov8时(pipinstallultralytics)报错：ERROR:CouldnotinstallpackagesduetoanOSError:[Errno2]没有那个文件或目录:‘xxxx/anaconda3/envs/v8-test/lib/python3.7/site-packages/numpy-1.21.6.dist-info/METADATA’问题原因：安装环境里对应的安
论文阅读笔记（十九）：YOLO9000: Better, Faster, Stronger __Sunshine__ 笔记 YOLO9000 detection classification
WeintroduceYOLO9000,astate-of-the-art,real-timeobjectdetectionsystemthatcandetectover9000objectcategories.FirstweproposevariousimprovementstotheYOLOdetectionmethod,bothnovelanddrawnfrompriorwork.Theim
Yolo-v3利用GPU训练make时发生错误：/usr/bin/ld: cannot find -lcuda 徐小妞66666
一.利用GPU训练Yolov3时，首先要修改MakeFile文件，修改格式如下：GPU=1(原来为0)CUDNN=1(原来为0)NVCC=/usr/local/cuda/bin/nvcc(新建,注意自己本机的地址)二.此时make产生错误/usr/bin/ld:cannotfind-lcuda1.查看MakeFile文件找到该行代码：LDFLAGS+=-L/usr/local/cuda/lib64
yolov5 +gui界面+单目测距实现对图片视频摄像头的测距毕设宇航 QQ767172261 yolov5 单目测距
可实现对图片，视频，摄像头的检测项目概述本项目旨在实现一个集成了YOLOv5目标检测算法、图形用户界面（GUI）以及单目测距功能的系统。该系统能够对图片、视频或实时摄像头输入进行目标检测，并估算目标的距离。通过结合YOLOv5的强大检测能力和单目测距技术，系统能够在多种应用场景中提供高效、准确的目标检测和测距功能。技术栈YOLOv5：用于目标检测的深度学习模型。OpenCV：用于图像处理和单目测距
目标检测-YOLOv3 wydxry 深度学习目标检测 YOLO 深度学习
YOLOv3介绍YOLOv3(YouOnlyLookOnce,Version3)是YOLO系列目标检测模型的第三个版本，相较于YOLOv2有了显著的改进和增强，尤其在检测速度和精度上表现优异。YOLOv3的设计目标是在保持高速的前提下提升检测的准确性和稳定性。下面是对YOLOv3改进和优势的介绍，以及YOLOv3核心部分的代码展示。相比YOLOv2的改进与优势多尺度特征金字塔YOLOv3引入了FP
使用TensorRT对YOLOv8模型进行加速推理 fengbingchun Deep Learning CUDA/TensorRT YOLOv8 TensorRT
这里使用GitHub上shouxieai的infer框架对YOLOv8模型进行加速推理，操作过程如下所示：1.配置环境，依赖项，包括：(1).CUDA:11.8(2).cuDNN:8.7.0(3).TensorRT:8.5.3.1(4).ONNX:1.16.0(5).OpenCV:4.10.02.cloneinfer代码：https://github.com/shouxieai/infer3.使用
使用yolov8识别+深度相机+机械臂实现垃圾分拣机械臂（代码分享）调包侠@ YOLO 数码相机毕业设计
文章目录垃圾分拣机械臂总体介绍主要功能与特色视频演示文件目录程序主代码完整代码链接垃圾分拣机械臂总体介绍本作品将视觉识别技术部署在嵌入式设备，自动控制机械臂进行分拣任务，在我们的设计中，首先使用深度相机将图像信息发送到嵌入式设备，视觉识别算法进行分类检测，将垃圾分为感染性，损失性，病理性，药物性，化学性，并根据相机的深度值计算出目标的三维坐标，由于系统使用眼在手外的结构，根据手眼标定的结果，将坐标
【深度学习实战】行人检测追踪与双向流量计数系统【python源码+Pyqt5界面+数据集+训练代码】YOLOv8、ByteTrack、目标追踪、双向计数、行人检测追踪、过线计数阿_旭 AI应用软件开发实战深度学习实战深度学习 python 行人检测行人追踪过线计数
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
pytorch训练后pt模型中保存内容详解(yolov8n.pt为例) yueguang8 yolo算法 pytorch YOLO 人工智能
在PyTorch中，.pt模型文件通常包含以下几类数据：模型参数：存储模型的权重和偏置参数。优化器状态：包含优化器的状态信息，以便在恢复训练时能够从中断的地方继续。训练状态：一些训练过程中的信息，例如当前的epoch数和训练进度。其他元数据：包括模型的配置、训练时使用的超参数等。在讲解pytorchpt(pth)文件中保存了什么内容之前，需要先了解pt在保存时保存了那些参数。以YOLO系列pt保存
实训day4 yolo1代码运行 Hazelyu27
yolo1代码运行今天主要是在pycharm上运行pytorch的yolo1训练和测试代码。主要遇到的问题：1.训练文件路径的修改，开始没有找到tmp_file文件，就在该文件夹下创建了这个txt文件，但是发现：ifisinstance(list_file,list):#Catmultiplelistfilestogether.#Thisisespeciallyusefulforvoc07/voc
[数据集][目标检测]街道乱堆垃圾检测数据集VOC+YOLO格式94张1类别 FL1623863129 数据集目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：94标注数量(xml文件个数)：94标注数量(txt文件个数)：94标注类别数：1标注类别名称:["baolu"]每个类别标注的框数：baolu框数=107总框数：107使用标注工具：labelImg标注规则：对类别进行
地平线旭日x3派部署yolov8 巴啦啦魔仙变！！ YOLO python 数学建模
地平线旭日x3派部署yolov8总体流程1.导出onnx模型导出YOLOV8_onnxruntime.py验证onnxutils.py2.在开发机转为bin模型2.1准备数据图片2.2转换必备的yaml文件2.3开始转换3.开发机验证**quantized_model.onnx4.板子运行bin模型资源链接总体流程1.导出onnx模型导出使用yolov8的github库导出onnx模型。注意设置o
YOLOv8改进 | 检测头篇 | YOLOv8引入DynamicHead检测头小李学AI YOLOv8有效涨点专栏 YOLO 深度学习目标检测计算机视觉机器学习人工智能
1.DynamicHead描述1.1摘要：在目标检测中，定位和分类相结合的复杂性导致了各种方法的蓬勃发展。以往的工作试图提高各种目标检测头的性能，但未能呈现出统一的观点。本文根据目标检测的特点，推导了一种新的动态头部框架，将目标检测头部与注意力统一起来。该方法通过在特征层次间、空间位置间和输出通道内协调组合多种自注意机制，在不增加计算开销的情况下显著提高了目标检测头的表示能力。进一步的实验表明，本
YOLOv8 只检测人只画框不要标签 waketzheng YOLO
参考了这个：YOLOv8只检测人（或其他一种或者多种类别）_yolov8只检测指定类别-CSDN博客1.只检测人：predict的时候指定参数classes=[0]2.只画框不要标签：plot的时候传入labels=False3.标签中去掉置信度：result.plot(conf=False)示例代码如下：#!/usr/bin/envpythonimportcontextlibfromdateti
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key