runner668

yolo3安装与测试VOC-2007数据集测试

环境：虚拟机下的ubuntu，所以就别想着什么CUDA了，折腾了半天才安装了了个opencv。

 
   哦，不对，还是需要先说说怎么安装吧，虽然很简单。 
  

 
   YOLO: 是实现实时物体检测的系统，Darknet是基于YOLO的框架 
  

 
   darknet非常容易安装，它只有２个可选择的依赖： 
  

 
       Opencv: 能支持更多格式的图像，并且得到实时的显示，我安装了这个，但是自己电脑原因效果不好。 
  

 
       GPU: 利用GPU计算，能大大提升YOLO的识别帧率，画面更加流畅 
  

 
   安装这两个依赖都必须要 
   先安装基础版yolo

 
   ---安装基础版yolo--- 
  

 
   首先将darknet从 
   github 
   上clone下来: 
  

 
   $ git clone https://github.com/pjreddie/darknet.git 
  

 
   $ cd darknet 
  

 
   $ make 
  

 
   如果正确执行的话,会看到以下内容: 
  

 
   运行以下命令: 
  

 
   $ ./darknet 
  

 
   看到以下效果,即为安装成功: 
  

 
   ---基础版yolo测试--- 
  

 
   完成上面的操作后,我们可以看到 cfg/目录下已经有了YOLO的配置文件了. 
  

现在为了测试我们的yolo,需要下载官方训练完毕的权重(237MB),或者运行以下命令: 权重可以自己随便找

 
   我们没有使用OpenCV编译Darknet，因此无法直接显示检测结果。相反，它将它们保存在/darknet/predictions.png中。您可以打开它来查看检测到的对象。由于我们在CPU上使用Darknet，每个图像需要大约6-12秒。如果我们使用GPU版本，速度会更快. 
  

 
   在data/目录下还有其他的测试图片,可以尝试一下 
  

./darknet detect cfg/yolo.cfg yolo.weights data/dog.jpg

 
   在我尝试利用摄像头进行实时检测的时候,发现识别的速度特别慢,因为此时的程序还是使用的CPU,一帧图像都得要处理6-7秒.所以我们需要给用CUDA+Opencv编译yolo,使之能通过GPU显卡运算,这样速度会提高很多很多. 
  

 
   到此，你就会明白了接下来为啥会安装opencv库了，不再废话了，cuda的安装请参考原文作者的帖子： 
  

 
   ---安装opencv--- 
  

 
   安装opencv过程也很简单，但是容易出错，因为安装完成后需要就行一些配置和测试 
  

 
   这是一篇不错的博客，照着敲下来基本就ok了。 
  

 
   https://blog.csdn.net/cocoaqin/article/details/78163171 
  

 
   另外你可能跑到 exemple 文件夹下的 python库中测试，但是这个时候你会发现 what？ 
  

 
   不能导入 cv2，也就是在python中不能用，这个时候很简单， 
  

 
   pip install opencv-python 
  

 
   就可以用了。 
  

 
   哦，对了还有你想测试下您的摄像头能不能用，比如你可能测试了下边的方法。 
  

 
   然后出乎你意料的是，黑屏，黑屏啊，虽然有个 hello opencv！但显然笔记本的摄像头并没有亮啊。 
  

 
   但是你还是不死心的，那就去python中写个简单的脚本来打开摄像头测试 
  

 
   # -*- coding: utf-8 -* 
  

 
   import cv2 
  

 
   import numpy as np 
  

 
   import pickle 
  

 
   import matplotlib.pyplot as plt 
  

 
   cap = cv2.VideoCapture(0) 
  

 
   index = 0 
  

 
   while True: 
  

 
       ret,frame = cap.read() 
  

 
       # Our operations on the frame come here 
  

 
       gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) 
  

 
       # Display the resulting frame 
  

 
       cv2.imshow('frame',gray) 
  

 
       if cv2.waitKey(1) & 0xFF == ord('p'): 
  

 
           cv2.imwrite("kk.jpg",frame) 
  

 
           index = index + 1 
  

 
       if cv2.waitKey(1) & 0xFF == ord('q'): 
  

 
           break 
  

 
   # When everything done, release the capture 
  

 
   cap.release() 
  

 
   cv2.destroyAllWindows() 
  

写完之后你赶紧python下，，可是

于是，有点崩溃的感觉！！！！！！！！！！

百度，可是这个问题的人好少。寻思着自己的机子是在虚拟机下安装的，难不成是虚拟机没办法打开摄像头。

果然，发现了真想，于是设置代开 camera，网上有人是

找了半天没找到camera，在ubuntu右下角的usb中，找知道了这个，打开了。

在终端输入 cheese，打开摄像头试试，奇迹发生了。但是画面质量很差，以至于之后在yolo中调用摄像头的出现花屏，花屏，我找了半天暂时没找到解决办法，哪位大佬知道的话求指教？？？？？？？？？！

测试模型的视频识别：实时抓取人脸图像进行检测识别，执行如下命令，可是我的到这里花屏了，这不是关键时候掉链子

嘛，只能怪自己的的电脑台渣吧，我还作，还装个虚拟机。

./darknet detector demo cfg/coco.data cfg/yolov3.cfg yolov3.weights

我想着要想在摄像头正确的显示，需要改动V4L2底层开发库。但是目前我还没有想好怎么设置。

------voc数据集测试------

Download the training, validation, test data and VOCdevkit

wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCdevkit_08-Jun-2007.tar

Extract all of these tars into one directory named VOCdevkit

tar xvf VOCtrainval_06-Nov-2007.tar
tar xvf VOCtest_06-Nov-2007.tar
tar xvf VOCdevkit_08-Jun-2007.tar

一.制作数据集

运行以下代码，将.xml 文件转换成.txt 文件，以备YOLO训练时数据解析：

1.数据集准备
（1）将数据集VOCdevkit2007拷贝到darknet\scripts下 （2）VOCdevkit2007修改名称为VOCdevkit

2.修改darknet\scripts\voc_label.py //自带的脚本，但是可能有点小偏差，我使用了下面的。
sets=[('2007', 'train'), ('2007', 'val'), ('2007', 'test')]  //这里自行添加 
classes = ["comp"] 
//注释掉
#os.system("cat 2007_train.txt 2007_val.txt 2012_train.txt 2012_val.txt > train.txt")
#os.system("cat 2007_train.txt 2007_val.txt 2007_test.txt 2012_train.txt 2012_val.txt > train.all.txt")

3.终端进入darknet\scripts，执行：
    python voc_label.py  
此后可以看到:
VOCdevkit\VOC2007里多了一个labels文件夹（如下）
darknet\scripts下多了2007_train.txt、2007_val.txt和2007_test.txt三个文件

///////////////////////////////////////////

voc_label.py

import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join

sets=[('2007', 'train'), ('2007', 'val')]

classes = ["aeroplane", "bicycle", "bird", "boat", "bottle", "bus", "car", "cat", "chair", "cow", "diningtable", "dog", "horse", "motorbike", "person", "pottedplant", "sheep", "sofa", "train", "tvmonitor"]


def convert(size, box):
    dw = 1./size[0]
    dh = 1./size[1]
    x = (box[0] + box[1])/2.0
    y = (box[2] + box[3])/2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x*dw
    w = w*dw
    y = y*dh
    h = h*dh
    return (x,y,w,h)

def convert_annotation(year, image_id):
    in_file = open('VOCdevkit/VOC%s/Annotations/%s.xml'%(year, image_id))
    out_file = open('VOCdevkit/VOC%s/labels/%s.txt'%(year, image_id), 'w')
    tree=ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)

    for obj in root.iter('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text))
        bb = convert((w,h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')

wd = getcwd()

for year, image_set in sets:
    if not os.path.exists('VOCdevkit/VOC%s/labels/'%(year)):
        os.makedirs('VOCdevkit/VOC%s/labels/'%(year))
    image_ids = open('VOCdevkit/VOC%s/ImageSets/Main/%s.txt'%(year, image_set)).read().strip().split()
    list_file = open('%s_%s.txt'%(year, image_set), 'w')
    for image_id in image_ids:
        list_file.write('%s/VOCdevkit/VOC%s/JPEGImages/%s.jpg\n'%(wd, year, image_id))
        convert_annotation(year, image_id)
    list_file.close()

二.修改配置文件

（1）修改data/my_voc.names文件：comp 

（2）修改cfg/voc.data文件。
classes= 1
train  = /home/ming/darknet/darknet/scripts/2007_train.txt  //训练集
valid  = /home/ming/darknet/darknet/scripts/2007_train.txt  //测试机，前边没制作，就和训练集一样了哈。。
names = data/my_voc.names
backup = backup  //在darknet新建一个backup目录，存储.weight

（3） 修改×××.cfg（以yolo-voc.cfg为例），修改2个参数（filters，class），见下：yolo2为例
① 【region】层中 classes 改成1。
② 【region】层上方第一个【convolution】层，其中的filters值要进行
修改，改成(classes+ coords+ 1)* (NUM) ，我的情况中：(1+4+1)* 5=30
③ learning_rate：学习率
④ max_batches：最大迭代次数

三.训练

用的是yolo2网络，yolo3和yolo2网络结构不一样，暂时没有尝试。

./darknet detector train cfg/voc.data cfg/yolov2-voc.cfg darknet19_448.conv.23

可以看到提示，有的照片没有打开，我去2007_train.txt中看了一下，有路径但是没有对应的照片，说明我资源下载的不全！

------voc输出参数解读------

以上截图显示了所有训练图片的一个批次（batch），批次大小的划分根据我们在 .cfg 文件中设置的subdivisions参数。在我使用的 .cfg 文件中 batch = 64 ，subdivision = 8，所以在训练输出中，训练迭代包含了8组，每组又包含了8张图片，跟设定的batch和subdivision的值一致。

（注：也就是说每轮迭代会从所有训练集里随机抽取 batch = 64 个样本参与训练，所有这些 batch 个样本又被均分为 subdivision = 8 次送入网络参与训练，以减轻内存占用的压力）

批输出

针对上图中最后一行中的信息，我们来一步一步的分析。如下的输出是由 detector.c 生成的，具体代码见：点击打开链接

9798：指示当前训练的迭代次数

0.370096：是总体的Loss(损失）

0.451929 avg：是平均Loss，这个数值应该越低越好，一般来说，一旦这个数值低于0.060730 avg就可以终止训练了。

0.001000 rate：代表当前的学习率，是在.cfg文件中定义的。

3.300000 seconds：表示当前批次训练花费的总时间。

627072 images：这一行最后的这个数值是9798*64的大小，表示到目前为止，参与训练的图片的总量。

分块输出

在分析分块输出之前，我们得了解一下IOU（Intersection over Union，也被称为交并集之比：点击打开链接），这样就能理解为什么分块输出中的参数是一些重要且必须要输出的参数了。

可以看到，IOU（交集比并集）是一个衡量我们的模型检测特定的目标好坏的重要指标。100%表示我们拥有了一个完美的检测，即我们的矩形框跟目标完美重合。很明显，我们需要优化这个参数。

回归正题，我们来分析一下这些用来描述训练图集中的一个批次的训练结果的输出。那些想自己深入源代码验证我所说的内容的同学注意了，这段代码：点击打开链接执行了以下的输出：

Region Avg IOU: 0.326577：表示在当前subdivision内的图片的平均IOU，代表预测的矩形框和真实目标的交集与并集之比，这里是32.66%，这个模型需要进一步的训练。

Class: 0.742537：标注物体分类的正确率，期望该值趋近于1。

Obj: 0.033966：越接近1越好。

No Obj: 0.000793：期望该值越来越小，但不为零。

Avg Recall: 0.12500：是在recall/count中定义的，是当前模型在所有subdivision图片中检测出的正样本与实际的正样本的比值。在本例中，只有八分之一的正样本被正确的检测到。

count: 8：count后的值是所有的当前subdivision图片（本例中一共8张）中包含正样本的图片的数量。在输出log中的其他行中，可以看到其他subdivision也有的只含有6或7个正样本，说明在subdivision中含有不含检测对象的图片。

总结

在这篇短文里，我们回顾了一下YOLOv2在终端输出的不同的参数的含义，这些参数也在告诉我们YOLOv2的训练过程是怎样进行的。这个能在一定程度上解答大家关于YOLOv2的训练输出的大部分问题，但请记住，对YOLOv2的探索决不应该到此为止。

跟以往一样，欢迎大家在评论区留言，进一步讨论关于YOLOv2的相关问题，我也会不断优化改进这篇文章，所以，别忘了留言评论哦！

原英文地址： https://timebutt.github.io/static/understanding-yolov2-training-output/

学习系列二：常用目标检测的格式转换脚本文件txt,json等小啊磊_Vv 目标检测 YOLO 人工智能计算机视觉 json
常用目标检测的格式转换脚本文件txt,json等文章目录常用目标检测的格式转换脚本文件txt,json等前言一、json格式转yolo的txt格式二、yolov8的关键点labelme打的标签json格式转可训练的txt格式三、yolo的目标检测txt格式转coco数据集标签的json格式四、xml格式转yolo数据集标签的txt格式五、根据yolo的目标检测训练的最好权重推理图片六、根据yolo
【目标检测】YOLO格式数据集txt标注转换为COCO格式JSON ericdiii 目标检测目标检测 YOLO json
YOLO格式数据集：images|--train|--test|--vallabels|--train|--test|--val代码：importosimportjsonfromPILimportImage#设置数据集路径dataset_path="path/to/your/dataset"images_path=os.path.join(dataset_path,"images")labels_
目标检测:yolo格式txt转换成COCO格式json 詹姆斯德格式转换目标检测 YOLO json
修改对应文件路径即可,其他根据txt或者希望生成的json做轻微调整#-*-coding:utf-8-*-importosimportjsonfromPILimportImagecoco_format_save_path="/home/admin1/data/LVIS"#要生成的标准coco格式标签所在文件夹yolo_format_classes_path="/home/admin1/data/L
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-ops.py 红色的山茶花 YOLO 笔记深度学习
ops.pyultralytics\utils\ops.py目录ops.py1.所需的库和模块2.classProfile(contextlib.ContextDecorator):3.defsegment2box(segment,width=640,height=640):4.defscale_boxes(img1_shape,boxes,img0_shape,ratio_pad=None,pa
基于深度学习YOLOv5的海洋动物检测系统深度学习&目标检测实战项目深度学习 YOLO 目标跟踪人工智能目标检测计算机视觉
1.引言随着人工智能技术的快速发展，深度学习在图像处理领域的应用逐渐展现出强大的能力，尤其是在目标检测任务上。YOLO（YouOnlyLookOnce）系列模型作为一种高效的目标检测算法，以其实时性和高精度在许多领域得到了广泛应用。海洋动物的检测任务也因此受益，借助深度学习模型，我们可以实时、自动地检测海洋中的动物，有助于海洋生态研究、环境保护以及水下监测等多个领域。本文将详细介绍如何基于YOLO
基于YOLOv5、YOLOv8和YOLOv10的车站行李监控系统：深度学习应用与实现深度学习&目标检测实战项目 YOLO 深度学习人工智能目标检测目标跟踪
引言在现代车站，行李监控是一项至关重要的安全任务。随着交通安全要求的不断提高，尤其是在车站等人流密集的场所，及时检测和识别行李不仅有助于防止行李遗失或误取，还能有效地减少潜在的安全威胁。传统的人工检查方法已经无法满足快速响应和高精度的需求，而基于深度学习的目标检测技术，特别是YOLO（YouOnlyLookOnce）系列算法，成为了高效解决此类问题的理想选择。YOLO系列算法（包括YOLOv5、Y
使用yolo11x进行物体分类欣然～分类人工智能深度学习
利用yolo11x进行物体识别一、物品分类代码说明模型加载：加载yolo11x.pt模型，如果这个模型在物体分类上表现不佳，可以考虑使用像yolov8n.pt这类通用的预训练模型。摄像头设置：打开电脑摄像头并将帧率设置为10fps，以此减轻处理负担。FPS计算：借助time库计算每帧的处理时间，进而得到FPS值，并在画面左上角显示。物体检测与分类：运用model(frame,conf=0.5,ve
YOLOv8改进策略【Neck】| NeurIPS 2023 融合GOLD-YOLO颈部结构，强化小目标检测能力 Limiiiing YOLOv8改进专栏 YOLO 目标检测深度学习计算机视觉
一、本文介绍本文主要利用GOLD-YOLO中的颈部结构优化YOLOv8的网络模型。GOLD-YOLO颈部结构中的GD机制借鉴了全局信息融合的理念，通过独特的模块设计，在不显著增加延迟的情况下，高效融合不同层级的特征信息。将其应用于YOLOv8的改进过程中，能够使模型更有效地整合多尺度特征，减少信息损失，强化对不同大小目标物体的特征表达，从而提升模型在复杂场景下对目标物体的检测精度与定位准确性。专栏
基于深度学习YOLOv5的火焰检测系统深度学习&目标检测实战项目深度学习 YOLO 人工智能目标跟踪目标检测
引言随着智能监控技术和深度学习的不断发展，火灾检测系统已经成为了自动化消防领域中的重要应用之一。传统的火灾报警系统往往依赖于温度传感器或烟雾探测器，但这些方法常常容易受到环境变化的影响，如高温、湿度等因素，这可能导致误报或漏报的情况。近年来，基于视觉的火灾检测系统，特别是使用深度学习进行图像处理和火焰识别，逐渐成为一种更为可靠的解决方案。本文将介绍如何基于深度学习和YOLOv5模型，构建一个火焰检
YOLOv8改进策略【Neck】| TPAMI 2024 FreqFusion 频域感知特征融合模块解决密集图像预测问题 Limiiiing YOLOv8改进专栏 YOLO 深度学习计算机视觉目标检测
一、本文介绍本文主要利用FreqFusion结构改进YOLOv8的目标检测网络模型。FreqFusion结构针对传统特征融合在密集图像预测中存在的问题，创新性地引入自适应低通滤波器生成器、偏移量生成器和自适应高通滤波器生成器。将FreqFusion应用于YOLOv8的改进过程中，能够使模型在处理复杂场景图像时，更精准地聚焦目标物体边界，减少背景噪声干扰，显著强化目标物体边界特征表达，进而提升模型在
【目标检测xml2txt】label从VOC格式xml文件转YOLO格式txt文件 zy_destiny 花式label转换目标检测 xml YOLO 人工智能计算机视觉 python
目录1.VOC格式xml文件2.YOLO格式txt文件3.xml2txt代码（python）整理不易，欢迎一键三连！！！送你们一条美丽的--分割线--1.VOC格式xml文件VOC数据格式是一种用于图像标注的标准格式，它用于存储图像及其相关的标注信息。在VOC格式中，每张图片的标注标签信息会被保存到一个XML文件中。XML文件的结构包括以下几个部分：annotation：这是整个XML文件的主要部
视频分析：基于目标检测（YOLO）实现走路看手机检测、玩手机检测、跌倒检测等 shiter 人工智能系统解决方案与技术架构音视频深度学习人工智能
文章大纲背景行为检测的定义与挑战视频分析数据集目标检测数据集自制数据集思路Kaggle数据集COCO数据集OpenImagesDatasetV7人类行为视频分析yolo进行行为分析的检测看手机行为检测--方法与数据集方法数据集跌倒行为检测--方法与数据集跌倒检测-数据集跌倒检测-目标检测跌倒检测-姿态估计参考文献与学习路径背景行为检测在自动驾驶、视频监控等领域的广阔应用前景使其成为了视频分析的研究
基于yolo的自定义模型训练阿拉斯攀登图像处理机器学习 YOLO 计算机视觉目标检测视觉检测
YOLOv8自定义模型训练全流程指南，包含数据准备、标注、训练的详细步骤和可视化说明一、数据准备流程图graphTDA[拍摄商品照片]-->B[数据标注]B-->C[划分数据集]C-->D[配置YAML文件]D-->E[开始训练]二、详细步骤说明步骤1：采集商品图片硬件需求：智能手机（建议使用后置摄像头）简易摄影棚（可用白色纸箱+LED灯代替）拍摄要点：每个商品至少拍摄50张不同角度照片包含以下场
打造智能体育赛事分析：YOLO目标检测系统详解 A等天晴计算机视觉 YOLO 目标检测人工智能
一、项目简介1.项目背景随着体育赛事直播和分析需求的增加，自动检测和识别体育赛事中的目标（如球员、球、裁判等）变得非常重要。深度学习技术，尤其是YOLO（YouOnlyLookOnce）模型，因其高效和准确的特性，成为目标检测领域的主流选择。2.项目目标构建一个能够自动检测体育赛事中的目标的系统实现一个用户友好的UI界面使用YOLOv8/v7/v6/v5模型进行检测提供完整的训练数据集二、环境准备
基于yolo的视频检测分析阿拉斯攀登机器学习图像处理 YOLO 音视频视觉检测
基于yolo的视频检测分析分步骤实现视频处理、目标检测与追踪、动作分析、计数逻辑，然后整合成API完整的解决方案，包含视频分析逻辑和API封装，使用Python、YOLOv8和FastAPI实现代码如下：python代码实现importosimportuuidimportjsonfromdatetimeimportdatetimefromfastapiimportFastAPI,UploadFil
行人检测系统：基于YOLOv5的行人检测与UI界面实现深度学习&目标检测实战项目 YOLO ui python 开发语言深度学习视觉检测计算机视觉
1.引言行人检测（PedestrianDetection）是计算机视觉中的一个重要任务，广泛应用于自动驾驶、智能安防、交通监控等领域。行人检测的目标是从图像或视频中检测出行人的位置，并标出其在图像中的边界框。随着深度学习技术的快速发展，YOLO（YouOnlyLookOnce）系列模型在目标检测任务中表现出了极高的准确性和速度，成为了行人检测的常用工具。本文将详细介绍如何使用YOLOv5实现行人检
创建一个基于YOLOv8+PyQt界面的驾驶员疲劳驾驶检测系统实现对驾驶员疲劳状态的打哈欠检测，头部下垂疲劳眼睛检测识别 QQ_767172261 行为类别睡觉姿态课堂等 YOLO pyqt
如何使用Yolov8创建一个基于YOLOv8的驾驶员疲劳驾驶检测系统文章目录1.数据集准备2.安装依赖3.创建PyQt界面4.模型训练1.数据集准备2.模型训练数据集配置文件(`data.yaml`)训练脚本(`train.py`)3.PyQt界面开发主程序(`MainProgram.py`)4.运行项目5.关键代码解释数据集配置文件(`data.yaml`)训练脚本(`train.py`)主程序
【Windows/C++/yolo开发部署03】将实例分割模型ONNX导出为 TensorRT 引擎：完整记录认识祂 CV计算机视觉 Ultralytics yolo 实例分割模型部署
【完整项目下载地址】：【TensorRT部署YOLO项目：实例分割+目标检测】+【C++和python两种方式】+【支持linux和windows】资源-CSDN文库目录写在前面环境准备1.使用trtexec将ONNX模型转换为TensorRT引擎2.验证TensorRT引擎2.1TensorRT版本2.2GPU信息2.3TensorRT引擎信息2.4推理请求2.5推理性能2.6警告信息2.7其他
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-dist.py 红色的山茶花 YOLO 笔记深度学习
dist.pyultralytics\utils\dist.py目录dist.py1.所需的库和模块2.deffind_free_network_port()->int:3.defgenerate_ddp_file(trainer):4.defgenerate_ddp_command(world_size,trainer):5.defddp_cleanup(trainer,file):1.所需的库
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-instance.py 红色的山茶花 YOLO 笔记深度学习
instance.pyultralytics\utils\instance.py目录instance.py1.所需的库和模块2.def_ntuple(n):3.classBboxes:4.classInstances:1.所需的库和模块#UltralyticsAGPL-3.0License-https://ultralytics.com/licensefromcollectionsimportab
渣土车检测数据集VOC+YOLO格式826张1类别 FL1623863129 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：826标注数量(xml文件个数)：826标注数量(txt文件个数)：826标注类别数：1标注类别名称(注意yolo格式类别顺序不和这个对应，而以labels文件夹classes.txt为准):["mucktruck"]每
yolo目标识别数据集无人机长了一个脑袋 YOLO
在目标识别领域，在机器学习和计算机视觉中，使用YOLO（YouOnlyLookOnce）模型进行目标检测是一种常见的方法。为了使用YOLO进行目标识别，你需要准备一个适当的数据集。以下是关于如何准备和使用YOLO目标识别数据集的步骤：1.选择或创建数据集选择数据集：如果已经有现成的数据集，如COCO、PascalVOC、ImageNet等，可以直接使用。创建数据集：如果没有合适的现成数据集，你可以
Win与Linux下，Python调用Basler相机完整步骤-实现拍照保存宇宙美男般的工程师计算机视觉 python python3.11 YOLO
近期在使用Basler工业相机完成视觉项目，用python调用basler工业相机进行视觉训练，需要先拍照存储数据集，于是写了以下代码保存拍照。此代码在win10与win11下、Linux下均测试过，完美使用。拍照完成后可以使用yolo进行识别，过完年上班后我会发布使用basler调用yolo识别的代码。代码在最后，如果帮到你了，请帮忙给个赞或收藏谢谢！！有问题在评论区反应，看到就会回复使用方法：
python实现yolo目标检测_目标检测|YOLO原理与实现 weixin_39709194
码字不易，欢迎给个赞！欢迎交流与转载，文章会同步发布在公众号：机器学习算法全栈工程师(Jeemy110)最新的YOLOv2和YOLOv3:小白将：目标检测|YOLOv2原理与实现(附YOLOv3)zhuanlan.zhihu.com前言当我们谈起计算机视觉时，首先想到的就是图像分类，没错，图像分类是计算机视觉最基本的任务之一，但是在图像分类的基础上，还有更复杂和有意思的任务，如目标检测，物体定位，
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-errors.py 红色的山茶花 YOLO 笔记深度学习
errors.pyultralytics\utils\errors.py目录errors.py1.所需的库和模块2.classHUBModelError(Exception):1.所需的库和模块#UltralyticsAGPL-3.0License-https://ultralytics.com/licensefromultralytics.utilsimportemojis2.classHUBM
YOLOv8-ultralytics-8.2.103部分代码阅读笔记-trainer.py 红色的山茶花 YOLO 笔记
trainer.pyultralytics\engine\trainer.py目录trainer.py1.所需的库和模块2.classBaseTrainer:1.所需的库和模块#UltralyticsYOLO,AGPL-3.0license"""Trainamodelonadataset.Usage:$yolomode=trainmodel=yolov8n.ptdata=coco8.yamlimg
YOLOv8-ultralytics-8.2.103部分代码阅读笔记-utils.py 红色的山茶花 YOLO 笔记
utils.pyultralytics\data\utils.py目录utils.py1.所需的库和模块2.defimg2label_paths(img_paths):3.defget_hash(paths):4.defexif_size(img:Image.Image):5.defverify_image(args):6.defverify_image_label(args):7.defpoly
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-files.py 红色的山茶花 YOLO 笔记深度学习
files.pyultralytics\utils\files.py目录files.py1.所需的库和模块2.classWorkingDirectory(contextlib.ContextDecorator):3.defspaces_in_path(path):4.defincrement_path(path,exist_ok=False,sep="",mkdir=False):5.deffil
YOLOv10改进 | 独家创新- 注意力篇 | YOLOv10引入结合SimAM和SKAttention形成全新的SKAM注意力机制和C2f_SKAM(全网独家创新) 小李学AI YOLOv10有效涨点专栏 YOLO 机器学习深度学习人工智能计算机视觉目标检测 pytorch
1.SKAM介绍SKAM（SimAMandSKAttentionModule）注意力机制结合了SimAM和SKAttention的优点，能够在图像特征提取中表现出更为优异的性能。SimAM注意力机制SimAM（SimplifiedAttentionModule）是一种简单但有效的注意力机制，旨在增强重要特征，同时抑制不相关的特征。SimAM的主要优点包括：(1).计算简单：SimAM仅需计算均值和
运用Faster RCNN、YOLO经典目标检测算法对滑坡图像进行检测 AngeliaZ Faster RCNN YOLO
本次实验采用的操作系统为Ubuntu16.04平台，编程环境基于Python，GPU为NVIDIAGeForce740m，在基于深度学习框架CAFFE下进行实验。实验输出结果
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo

yolo3安装与测试VOC-2007数据集测试

批输出

分块输出

总结

你可能感兴趣的:(yolo)