Image-MJ

初涉YOLO

一瞥(You Only Look Once, YOLO)，是检测Pascal VOC 2012数据集内对象/目标的系统，能够检测出20种Pascal对象：

人person

鸟bird、猫cat、牛cow、狗dog、马horse、羊sheep

飞机aeroplane、自行车bicycle、船boat、巴士bus、汽车car、摩托车motorbike、火车train

瓶子bottle、椅子chair、餐桌dining table、盆景potted plant、沙发sofa、显示器tv/monitor

YOLO由以下参与者共同完成：Santosh、Ross和Ali，详细内容参见其paper

以下教程分为9部分（不要害怕，easy），运行系统Ubuntu 14.04。OpenCV、cuda、GPU这些依赖是可选项，如果没有也可以，就是慢点(其实是慢很多)啦。最后会添加一下官网教程中没有的安装错误和修改信息。

本篇教程内容全部翻译自官网

1.How It Works

先前的检测系统多使用分类器(classifier)或者定位器(localizer)进行检测任务，把图片的不同局部位置和多种尺度输入到模型中去，图片得分较高的区域(region)作为检测目标。

YOLO是一个全新的方法，把一整张图片一下子应用到一个神经网络中去。网络把图片分成不同的区域，然后给出每个区域的边框预测和概率，并依据概率大小对所有边框分配权重。最后，设置阈值，只输出得分（概率值）超过阈值的检测结果。

初涉YOLO_第1张图片

输入-检测-输出

我们的模型相比于基于分类器的模型有一些优势，在测试阶段，整张图片一次输入到模型中，所以预测结果结合了图片的全局信息。同时，模型只是用一次网络计算来做预测，而在R-CNN中一张图片就需要进行上千次的网络计算！所以YOLO非常快，比R-CNN快1000倍，比Fast R-CNN快100倍。整个系统的细节见paper

2.Detection Using A Pre-Trained Model

本节内容会知道你如何使用YOLO预训练好的模型进行目标检测。在这之前，你应该安装好DarkNet，安装方法戳这里。

安装好DarkNet之后，在darknet的子目录cfg/下已经有了一些网络模型的配置文件，在使用之前，需要下载好预训练好的权重文件yolo.weights(1.0 GB).

现在，使用DarkNet的yolo命令进行一下测试吧（假设你在darknet/目录下，自己修改好yolo.weights和image的路径）

./darknet yolo test cfg/yolo.cfg /yolo.weights

如果你没有现成的图片，不妨直接使用darknet/data/下面的某张图片。

进行上面的测试，Darknet会打印出检测到的目标对象和可信度，以及耗时。使用CPU时，每张图片耗时为6-12秒，GPU版本会快，快很多。

如果安装DarkNet的时候，没有使用OpenCV，上面的测试不会直接显示出图片结果，你需要自己手动打开predictions.png. 打开你会看到类似于下图的预测结果

初涉YOLO_第2张图片

predictions.png

如果想运行一次DarkNet检测多张图片的话，你应该先运行以下命令载入预训练模型

./darknet yolo test cfg/yolo.cfg yolo.weights

模型载入成功后，会提示输入图片路径Enter Image Path：

键入类似于data/eagle.jpg的路径，检测这张图片，给出结果之后，会继续提示Enter Image Path。注意如果你连续输入了多张图片，之前的结果会被下一次的检测结果覆盖掉，因为预测结果都叫predictions.jpg。。。要退出/中断程序的话，直接键入Ctrl-C（自己记住这个命令，后面会再用）即可。

3.A Smaller Model

上面的YOLO模型会占用很多GPU内存，方法类似，只需要调用不同的配置文件，载入相应的权重文件即可。在这里，提供一个更小版本的模型，使用yolo-small.cfg配置文件，调用yolo-small.weights(359MB)，命令如下

./darknet yolo test cfg/yolo-small.cfg yolo-small.weights

这个小版本的YOLO大概占用1.1GB的GPU内存~

4.A Tiny Model, yolo-tiny.weights(172 MB)

./darknet yolo test cfg/yolo-tiny.cfg yolo-tiny.weights

占用611MB的GPU内存，在Titan X上的速度是150 fps

5.YOLO Model Comparison

yolo.cfg，基于extraction网络，处理一张图片的速度为45fps，训练数据来源2007 train/val + 2012 train/val + 2007、2012所有数据

yolo-small.cfg，全连接层变小，占用内存变小，50fps，训练数据来源2007 train/val + 2012 train/val

yolo-tiny.cfg，更加小型的网络，基于DarkNet reference network，155fps，数据来源2007 train/val + 2012 train/val

6.Changing The Detection Threshold

YOLO默认返回可信度至少为0.2的检测结果，可以通过-thres 参数改变可信度阈值，例如设置为0：

./darknet yolo test cfg/yolo.cfg yolo.weights data/dog.jpg -thresh 0

这将可能返回所有的检测结果。

7.Real-Time Detection On VOC 2012

如果编译时使用了CUDA，那么预测的速度回远远超过你（手动）输入图片的速度。为了更快速地检测多张图片的内容，应该使用yolo的valid子程序。

首先预备好数据并生成元数据给DarkNet。这里我们使用VOC2012的数据（需要注册一个账号才能下载），下载2012test.rar文件之后，运行以下命令

tar xf 2012test.tar

cp VOCdevkit/VOC2012/ImageSets/Main/test.txt .

sed 's?^?'`pwd`'/VOCdevkit/VOC2012/JPEGImages/?; s?$?.jpg?' test.txt > voc.2012.test

这些命令首先解压数据包，然后生成全路径的测试图像，然后把voc.2012.test移动到darknet/data子目录下

mv voc.2012.test /darknet/data

OKAY，现在使用这些图片做检测，我们使用CUDA版本的，超级快！运行下面命令

./darknet yolo valid cfg/yolo.cfg yolo.weights

运行上面命令后，你会看到一串数字在屏幕上飞，数字表示当前处理了多少图片。VOC 2012 test数据集共有10991张图片，共耗时250秒，相当于44fps。如果你用Selective Search方法的话，要耗时6小时！相比之下，咱的方法整个pipeline才耗时4分钟，pretty cool!

预测结果在results/子目录下，其格式为Pascal VOC要求提交的特殊格式。

如果你想复现我们在Pascal挑战赛中的结果，你得使用yolo-rescore.weights才行。

8.Real-Time Detection on a Webcam

只是简单地跑一下测试数据集，而且看不到实时的结果，真的挺无趣的。所以，我们把输入改成webcam

挖个坑，后面填

9.Training YOLO

其实，你可以从头开始训练YOLO，如果你想的话。你可以尝试不同的训练方法，设置不同的超参数，以及使用自己的数据集。咱们下面尝试自己训练Pascal VOC数据集。

9.1下载Pascal VOC Data

咱们先下载2007年到2012年的VOC数据，下载之前，新建一个文件夹（比如VOC）存放这些数据，进入此文件夹，按如下方式下载数据，然后解压。

curl -O http://pjreddie.com/media/files/VOCtrainval_11-May-2012.tar

curl -O http://pjreddie.com/media/files/VOCtrainval_06-Nov-2007.tar

curl -O http://pjreddie.com/media/files/VOCtest_06-Nov-2007.tar

tar xf VOCtrainval_11-May-2012.tar

tar xf VOCtrainval_06-Nov-2007.tar

tar xf VOCtest_06-Nov-2007.tar

解压完之后，所有数据都自动存放在VOCdevkit/子目录下了。

9.2生成VOC的标注信息

接下来生成DarkNet训练所需的标签文件，该文件扩展名为.txt，文件内每一行对应一张图片的标注信息，具体格式如下

其中的x, y, width和height是对应图片上的坐标和宽、高。只要运行一下DarkNet项目中scripts/子目录下面的voc_label.py脚本，就会自动生成VOC的标注文件。如果你没找到这个文件，可以再重新下载一下。下载和脚本运行方式如下

curl -O http://pjreddie.com/media/files/voc_label.py

python voc_label.py

这个脚本大概要运行几分钟，运行结束之后，你会看到多了两个文件夹，VOCdevkit/VOC2007/labels/和VOCdevkit/VOC2012/labels/。

现在，你的VOC目录下应该是这个样子的

ls
2007_test.txt   VOCdevkit
2007_train.txt  voc_label.py
2007_val.txt    VOCtest_06-Nov-2007.tar
2012_train.txt  VOCtrainval_06-Nov-2007.tar
2012_val.txt    VOCtrainval_11-May-2012.tar

其中的文本文件，比如2007_test.txt，包含的内容是VOC 2007年的test数据集标注信息。DarkNet需要一个txt文件提供所有标注信息，所以我们还需要把这些信息导入到一个txt文件中。本例中，我们使用2007年的train和validation数据和2012年的train数据作为训练集，2012年的validation数据作验证数据。具体使用如下命令

cat 2007_* 2012_train.txt > train.txt

OKAY，现在2007年的所有图片和2012年的train数据集的图片路径都在train.txt文件里面了。标注信息在下面两个路径中

/darknet/VOC/VOCdevkit/VOC2007/labels/

/darknet/VOC/VOCdevkit/VOC2012/labels/

上面所做的就是训练自己的数据集之前所要准备的数据信息了。

9.3重定向DarkNet到Pascal数据

进入DarkNet目录中，src/子目录里面有一个yolo.c文件，打开并编辑一下其中的18、19行（54、55行？不重要，自己确定）

18    char *train_images = "/your_path/VOC_train/train.txt";
19    char *backup_directory = "/your_path/backup/";

其中，train_images指向的是训练文件，backup_directory指向的是训练过程中权重的备份路径。编辑好yolo.c之后，保存，重新编译一下DarkNet。

9.4下载预训练之后的卷积权重

训练的时候使用来自Extraction模型的卷积层权重，这个模型训练时用的是Imagenet数据。从这(54MB)下载这些权重。如果你想直接用Extraction模型生成这些预训练好的权重，你得先下载预训练好的Extraction模型，运行下面的命令

./darknet partial cfg/extraction.cfg extraction.weights extraction.conv.weights 25

劝告大家直接下载权重会更简单。。。

9.5训练

运行下面命令开始训练

./darknet yolo train cfg/yolo.cfg extraction.conv.weights

运行时，屏幕会提示一下数字和任务信息。

如果你想训练更快些，同时降低提示信息频率，首先终止训练，然后在cfg/yolo.cfg中修改一下第三行的信息

3    subdivisions = 2

或修改成4，或更大，比如64。然后重新开始训练

9.6训练Checkpoints

每训练128000张图片之后，DarkNet自动保存checkpoint信息到你在src/yolo.c中指定的备份路径下。checkpoint的文件名类似于yolo_12000.weights。你可以使用这些checkpoint信息重新开始训练，避免从头开始。

40,000次迭代之后，DarkNet会保存模型的权重，然后结束训练，最后的权重会以yolo.weights命名。

恭喜，这就训练结束了~

Good Luck!!

上两张训练时的截图

初涉YOLO_第3张图片

running_1

初涉YOLO_第4张图片

running_2

下面是你安装过程中可能遇到的问题和解决办法

Q1.使用GPU=1，运行测试命令，例如

./darknet imtest data/eagle.jpg

或者

./darknet yolo demo cfg/yolo.cfg yolo.weights并键入图片地址

报以下错误

L2 Norm: 372.007568

CUDA Error:invalid device function

darknet: ./src/cuda.c:21: check_error: Assertion `0' failed.

Aborted (core dumped)

看了看./src/cuda.c的代码也没发现啥。。。

出现这个问题是因为DarkNet的配置信息Makefile文件里面的GPU架构和实际安装的GPU不对应。

ARCH= --gpu-architecture=compute_xx --gpu-code=compute_xx

经测试，k40m和k40显卡应该设置为

ARCH= --gpu-architecture=compute_35 --gpu-code=compute_35

tk1显卡的设置应该为

ARCH=--gpu-architecture=compute_20 --gpu-code=compute_20

或许这些信息对你有所帮助

初涉YOLO_第5张图片

你可能感兴趣的:(YOLO)

5.31.15 使用图像到图像转换和 YOLO 技术对先前的乳房 X 光检查结果中的异常进行早期检测和分类托比-马奎尔深度学习基础知识 YOLO
在本研究中，我们研究了基于You-Only-Look-Once(YOLO)架构的端到端融合模型的有效性，该模型可同时检测和分类数字乳房X光检查中的可疑乳腺病变。包括四类病例：肿块、钙化、结构扭曲和正常，这些病例来自包含413个病例的私人数字乳房X光检查数据库。对于所有病例，先前的乳房X光检查（通常是1年前扫描的）均报告为正常，而当前的乳房X光检查被诊断为癌变（经活检证实）或健康。方法：建议将基于Y
yolov5训练失败总结 BTU_YC 深度学习 python pytorch
yolov5训练失败总结版本原因：在进行训练时，出现如下报错：UserWarning:Detectedcalloflr_scheduler.step()beforeoptimizer.step().InPyTorch1.1.0andlater,youshouldcallthemintheoppositeorder:optimizer.step()beforelr_scheduler.step().
YOLO学习笔记｜从YOLOv5到YOLOv11：技术演进与核心改进北斗猿 YOLO学习从零到1 YOLO 目标检测算法 python 计算机视觉
从YOLOv5到YOLOv11：技术演进与核心改进深度解析一、YOLO系列发展概述YOLO（YouOnlyLookOnce）目标检测算法自2016年诞生以来，凭借其"单次检测"的独特理念和卓越的实时性能，持续引领着计算机视觉领域的技术革新。从JosephRedmon的初代YOLO到AlexeyBochkovskiy的YOLOv4，再到Ultralytics团队的YOLOv5及后续系列，这一算法家族
文末含资料链接！YOLOv11性能飞跃：深度融合iRMB注意力机制，实战教程助你突破检测极限！博导ai君深度学习教学-附源码 YOLO
文章目录1.介绍：揭秘iRMB——轻量化与高性能的完美融合1.1摘要：洞察iRMB的设计哲学与卓越表现1.2简单描述：深入剖析iRMB的构造与工作原理核心灵感：CNN与Transformer的珠联璧合iRMB的核心结构：短距离与长距离的协同设计理念：实用、统一、有效、高效1.3模块结构：iRMB的内部构造图（概念描述）2.代码解析：逐行揭秘iRMB的魔法2.1`LayerNorm2d`：为2D数据
2020-10-30 Victor Zhong AI 框架人工智能深度学习机器学习
极片缺陷检测模型验证报告：1：数据准备训练集：326张验证集：81张2：模型准备模型：yolov33：训练参数设置epochs:4603batch_size:8device:RTX2080Ticfg:yolov3-spp-jp4：验证结果5：检测结果部分检测结果图，全部结果图见文件夹result：6:结果分析a.训练数据中，某一类缺陷标注数量相对较少，影响检测该类的目标；可以通过数据增强的方法或增
YOLO融合synergisticNet中的模块今天炼丹了吗 YOLOv11与自研模型专栏 YOLO
YOLOv11v10v8使用教程：YOLOv11入门到入土使用教程YOLOv11改进汇总贴：YOLOv11及自研模型更新汇总《HyperSINet:ASynergeticInteractionNetworkCombinedWithConvolutionandTransformerforHyperspectralImageClassification》一、模块介绍论文链接：https://ieeex
yolov5/v7/v8/v9/v10环境详细配置教程（Windows+conda+pycharm）视觉算法er 深度学习环境配置 YOLO 目标检测人工智能深度学习 conda pycharm
一、所需环境配置1.1.虚拟环境创建首先，打开AnacondaPrompt命令窗口，创建一个新的虚拟环境，后面的包都在这个环境中安装。创建命令是：我的习惯是使用3.8版本的python，你也可以换成更高版本；condacreate-nyolopython=3.8输入命令后，运行结果如下：输入y即可；1.2.激活虚拟环境安装完成后，即可激活虚拟环境，输入以下命令即可；condaactivateyol
YOLOv11 改进策略 | GFPN：超越 BiFPN，跳层与跨尺度连接重塑特征金字塔
YOLOv11改进策略|GFPN：超越BiFPN，跳层与跨尺度连接重塑特征金字塔！介绍颈部网络（Neck）在目标检测任务中扮演着至关重要的角色，它负责有效地融合来自骨干网络（Backbone）不同层级的特征图，为检测头部（Head）提供包含丰富语义和空间信息的多尺度特征。FPN、PANet和BiFPN等结构是特征金字塔融合的代表。BiFPN作为其中的佼佼者，通过双向连接和加权融合取得了优异的性能。
超详细yolov8/11-segment实例分割全流程概述：配置环境、数据标注、训练、验证/预测、onnx部署(c++/python)详解
因为yolo的检测/分割/姿态/旋转/分类模型的环境配置、训练、推理预测等命令非常类似，这里不再详细叙述，主要参考**【YOLOv8/11-detect目标检测全流程教程】**，下面有相关链接，这里主要针对数据标注、格式转换、模型部署等不同细节部分；【YOLOv8/11-detect目标检测全流程教程】超详细yolo8/11-detect目标检测全流程概述：配置环境、数据标注、训练、验证/预测、o
创新引入HAttention模块：提升YOLOv8小目标检测精度【YOLOv8】程序员Gloria YOLOv8 YOLO 目标跟踪人工智能目标检测
文章目录创新引入HAttention模块：提升YOLOv8小目标检测精度【YOLOv8】引言1.YOLOv8模型概述1.1YOLOv8架构1.2YOLOv8小目标检测的挑战2.HAttention模块：原理与设计2.1HAttention模块的动机2.2HAttention模块的结构3.HAttention模块在YOLOv8中的应用3.1引入HAttention模块3.2YOLOv8架构修改3.3
YOLOv11深度解析：Ultralytics新一代目标检测架构创新与实战指南芯作者 D2:YOLO YOLO 神经网络计算机视觉
2024年Ultralytics重磅推出YOLOv11**：在精度与速度的平衡木上再进一步，参数减少22%，推理速度提升2%，多任务支持全面升级！一、YOLOv11核心创新：轻量化与注意力机制的完美融合YOLOv11并非颠覆性重构，而是通过模块级优化实现“少参数、高精度、快推理”的目标。其三大创新点如下：1.1C3k2模块：动态卷积核的灵活设计取代YOLOv8的C2f模块，C3k2通过参数c3k动
使用TVM编译部署DarkNet模型：YOLO-V2和YOLO-V3实战指南周情津Raymond
使用TVM编译部署DarkNet模型：YOLO-V2和YOLO-V3实战指南tvm-cnTVMDocumentationinChineseSimplified/TVM中文文档项目地址:https://gitcode.com/gh_mirrors/tv/tvm-cn前言在深度学习模型部署领域，TVM作为一个高效的深度学习编译器栈，能够将训练好的模型优化并部署到各种硬件平台上。本文将详细介绍如何使用T
目标检测新纪元：DETR到Mamba实战解析加油吧zkf 图像处理 python 分类人工智能目标检测
【实战分享】目标检测的“后DEⱯ”时代：DETR/DINO/RT-DETR及新型骨干网络探索（含示例代码）目标检测从YOLO、FasterR-CNN到Transformer结构的DETR，再到DINO、RT-DETR，近两年出现了许多新趋势：更高效的端到端结构、更少的手工设计（比如不再需要NMS）、以及新型轻量化骨干网络（比如Mamba、ConvNeXt、ViT等）被引入检测任务中。作为从事目标检
yolo11官方ONNXRuntime部署推理的脚本测试，包括检测模型和分割模型的部署推理 Revao YOLO python
一、检测模型1.脚本路径：D:/ultralytics-main/examples/YOLOv8-ONNXRuntime/main.py2.使用案例下载好onnx模型保存至D:/ultralytics-main/models目录下，没有该目录则新建打开终端，进入虚拟环境以yolov8n.onnx模型为例，输入以下指令即可pythonD:/ultralytics-main/examples/YOLO
《YOLO11的ONNX推理部署：多语言多架构实践指南》空云风语 YOLO 人工智能深度学习目标跟踪人工智能计算机视觉 YOLO
引言：YOLO11与ONNX的相遇在计算机视觉的广袤星空中，目标检测始终是一颗耀眼的明星，其在自动驾驶、智能安防、工业检测、医疗影像分析等诸多领域都有着举足轻重的应用。想象一下，自动驾驶汽车需要实时准确地检测出道路上的车辆、行人、交通标志；智能安防系统要快速识别出监控画面中的异常行为和可疑人员；工业生产线上，需要精准检测产品的缺陷；医疗影像分析中，辅助医生检测病变区域。这些场景都对目标检测技术的准
YOLOv5Lite模型量化与TFLite转换全流程指南神经网络15044 仿真模型深度学习神经网络 YOLO 神经网络人工智能深度学习网络机器学习
YOLOv5Lite模型量化与TFLite转换全流程指南1.引言在边缘计算和移动设备上部署目标检测模型时，模型大小和推理速度是关键考量因素。YOLOv5Lite作为YOLO系列的轻量级变种，专为资源受限环境设计。然而，要进一步优化模型性能，量化(Quantization)和转换为TFLite格式是必不可少的步骤。本文将详细介绍从训练好的YOLOv5Lite模型到量化TFLite模型的完整转换流程，
YOLOv7 技术详解（Real-Time Dynamic Label Assignment + Model Scaling）要努力啊啊啊计算机视觉 YOLO 人工智能深度学习计算机视觉目标跟踪
✅YOLOv7技术详解（Real-TimeDynamicLabelAssignment+ModelScaling）一、前言YOLOv7是AlexeyBochkovskiy团队后续维护者提出的一种高性能目标检测模型，在YOLOv5基础上引入了多项结构优化和训练策略改进：✅模型集成（ModelIntegration）✅动态标签分配（ExtendAssigner）✅支持重参数化模块（ReparamBlo
YOLO 推理部署全方案」：一文掌握部署方式与性能对比！要努力啊啊啊计算机视觉 YOLO 目标跟踪计算机视觉目标检测人工智能
YOLO的推理部署方法全景指南YOLO系列模型经过训练后，通常需要部署到线上环境中进行推理（inference）。下面是常见的YOLO推理部署方式：1️⃣PyTorch原生部署使用原始PyTorch模型.pt文件直接调用model(input)进行推理✅优点：简单、灵活、易于调试❌缺点：推理速度较慢，不适合生产环境2️⃣ONNX导出+推理将YOLO模型导出为.onnx格式使用ONNXRuntime
YOLO 中的三大框类型全解析：Ground Truth、Anchor、Bounding Box 有何区别？
1.GroundTruthBox（真值框）数据集中人工标注的真实目标位置。•是“答案”，模型训练的目标。•标注格式通常是[x,y,w,h,class_id]•比如一张猫的图，它的真实框就是groundtruthbox。⸻2.AnchorBox（锚框）预设的一些模板框，模型学习时的“参考基准”。•是一些固定的宽高组合（比如[10×13]、[16×30]等），•每个gridcell会分配若干ancho
大棚番茄西红柿果实成熟度检测数据集YOLO格式279张3类别已划分训练验证集
数据集格式：YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及yolo格式txt文件)图片数量(jpg文件个数)：279标注数量(xml文件个数)：279标注数量(txt文件个数)：279标注类别数：3所在仓库：firc-dataset标注类别名称(注意yolo格式类别顺序不和这个对应，而以labels文件夹classes.txt为准):["unripe","semi-ripe","
Mamba-YOLOv8深度解析：基于状态空间模型的下一代目标检测架构（含完整代码与实战部署）文末含资料链接！博导ai君深度学习教学-附源码 YOLO 目标检测架构
文章目录前言一、技术背景与动机1.1传统架构的局限性1.2Mamba的创新优势二、Mamba-YOLOv8架构详解2.1整体架构设计2.2核心模块：VSSblock2.3SS2D模块工作原理三、完整实现流程3.1环境配置3.2代码集成步骤3.3训练与微调四、性能分析与优化4.1精度提升策略4.2推理加速方案4.3硬件适配技巧五、实战案例：无人机航拍检测5.1数据集准备5.2模型训练与评估六、未来研
目标检测在国防和政府的应用实例 MzKyle 计算机视觉目标检测人工智能计算机视觉
一、目标检测技术概述目标检测是计算机视觉的核心任务，通过算法对图像/视频中的物体进行识别与定位，当前主流技术包括：经典算法：YOLO系列（实时性强）、FasterR-CNN（精度高）、SSD（平衡速度与精度）技术升级：结合深度学习（CNN、Transformer）、多模态融合（视觉+红外+雷达）、边缘计算实时处理二、国防领域核心应用实例（一）军事侦察与监控系统无人机侦察与目标识别应用场景：战术无人
YOLOv11安全检测项目_人员、安全帽、安全服、普通服装、头部、模糊服装、模糊头部目标检测 qq1309399183 计算机视觉实战项目集合 YOLO 目标检测人工智能深度学习计算机视觉
YOLOv10与YOLOv11安全检测项目项目概述Safety本项目基于SF数据集（50,559张图像/7类别）对YOLOv10和YOLOv11模型进行对比研究，重点优化安全帽、安全服及模糊目标的工业场景检测性能。核心要素组件配置说明模型架构YOLOv10vsYOLOv11双模型对比数据集[SF)检测类别人员、安全帽、安全服、普通服装、头部、模糊服装、模糊头部训练参数•迭代周期：100epochs
Ubuntu 24.04.2 LTS Python 人工智能Ai视觉模型 GHY云端大师 AI 训练模型 python 人工智能
一、创建Python虚拟环境#更新软件包列表，确保你获取到最新版本的可用软件包sudoaptupdate#安装用于创建Python3.10虚拟环境（venv）的相关软件包sudoaptinstallpython3.10-venv-y或sudoaptinstallpython3.12-venv-y#使用Python3创建一个名为"yolov8_env"的虚拟环境python3-mvenvyolo
文献阅读篇#8：YOLO如何实现多模态 hjs_deeplearning YOLO 人工智能深度学习目标检测多模态模态融合
一、引言YOLO众所周知是一个目标检测、跟踪、计数等等的视觉模型，对于YOLO来说，它的核心功能还是分类，识别出物体的类别并辅助以计数、跟踪等等功能。但是，光使用一个YOLO模型进行目标检测只能提取一张图片的特征，或者只能通过一条路去提取特征，最终输出结果。而前面提到的多模态，则会引入另一个维度的特征。例如二区Top期刊《Underwateracousticintelligentspectrums
YOLOv8 轴承缺陷检测使用YOLOv8进行训练、评估和可视化预测结果包含1440张图片的轴承缺陷检测数据集 YOLO格式或XML格式 OICQQ67658008 YOLO xml 深度学习轴承缺陷数据检测算法人工智能
轴承缺陷检测4类1440张names:[‘aocao’,‘aoxian’,‘cashang’,‘huahen’]名称：：[‘凹槽’，‘凹陷’,‘卡伤’,‘划痕’]共1440张，8:1:1比例划分train：1152张，val：144张，test：144张标注文件为YOLO适用的txt格式或xml格式。可以直接用于模型训练。YOLOv8轴承缺陷检测importosimporttorchfromIPy
RK3576 Yolo 部署
1.开发背景Ubuntu下实现yolo计算比较常见，现实中我们需要在各种嵌入式板卡上实现yolo模型，在板卡上运行yolo也是常态。主要参考官方github和野火教程。2.开发需求在RK3576上运行yolov8的官方例程3.开发环境Ubuntu20.04+Conda+Yolov8+RK35764.实现步骤4.1PyTorch文件转ONNX4.1.1下载权重文件下载官方权重文件yolov8n.pt
【YOLOv11】ultralytics最新作品yolov11 AND 模型的训练、推理、验证、导出以及使用 Jackilina_Stone #Deep Learning 【改进】YOLO系列 YOLO 人工智能 python 计算机视觉深度学习
目录一ultralytics公司的最新作品YOLOV111yolov11的创新2安装YOLOv113PYTHONGuide二训练三验证四推理五导出模型六使用文档：https://docs.ultralytics.com/models/yolo11/代码链接：https://github.com/ultralytics/ultralyticsPerformanceMetrics
YOLOv12_ultralytics-8.3.145_2025_5_27部分代码阅读笔记-split_dota.py 红色的山茶花 YOLO 笔记深度学习
split_dota.pyultralytics\data\split_dota.py目录split_dota.py1.所需的库和模块2.defbbox_iof(polygon1:np.ndarray,bbox2:np.ndarray,eps:float=1e-6)->np.ndarray:3.defload_yolo_dota(data_root:str,split:str="train")->
YOLOv12_ultralytics-8.3.145_2025_5_27部分代码阅读笔记-augment.py
augment.pyultralytics\data\augment.py目录augment.py1.所需的库和模块2.classBaseTransform:3.classCompose:4.classBaseMixTransform:5.classCutMix(BaseMixTransform):6.classCopyPaste(BaseMixTransform):7.defv8_transfo
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他