工地工程车分类检测数据集 6300张 带标注 voc yol

工地工程车分类检测数据集 6300张 带标注 voc yol_第1张图片

数据集特点
  • 类型:工地工程车分类检测数据集。
  • 格式:VOC和YOLO格式,适用于训练目标检测模型。
  • 规模:共包含6300张图像。
  • 标注:使用.xml(VOC格式)和.txt(YOLO格式)文件进行标注,每个文件对应一张图像,标注格式分别为VOC和YOLO格式。
  • 类别:包含多种工地工程车辆类别。
  • 质量:数据集标注准确,涵盖了多种工地环境下的工程车辆。

数据集组成

  • 训练集:用于训练模型,包含约5000张图像。
  • 验证集:用于模型调参和验证,包含约630张图像。
  • 测试集:用于最终评估模型性能,包含约670张图像。

数据集目录结构

1construction_vehicle_dataset/
2├── images/
3│   ├── train/
4│   ├── val/
5│   └── test/
6├── annotations/
7│   ├── xmls/  # VOC format
8│   │   ├── train/
9│   │   ├── val/
10│   │   └── test/
11│   └── txts/  # YOLO format
12│       ├── train/
13│       ├── val/
14│       └── test/
15└── dataset.yaml  # YOLOv5 configuration file

标注格式

VOC格式

每个.xml文件包含图像的基本信息以及每个目标的标注,格式如下:

1
2    ConstructionVehicleDataset
3    000001.jpg
4    
5        1920
6        1080
7        3
8    
9    
10        excavator
11        Unspecified
12        0
13        0
14        
15            100
16            200
17            300
18            400
19        
20    
21    
22
YOLO格式

每个.txt文件包含多个目标的标注,格式为:

1<类别> <中心_x> <中心_y> <宽度> <高度>

其中,所有坐标值均为相对于图像尺寸的百分比。

示例标注文件

假设有一张图像中包含一台挖掘机和一台推土机,.txt文件内容可能如下所示:

10 0.3 0.4 0.2 0.2  # 挖掘机
21 0.7 0.6 0.1 0.15  # 推土机

使用指南

  1. 环境搭建:确保安装了YOLOv5和其他必要的软件包。
  2. 数据集准备:下载数据集并按照上述目录结构组织数据。
  3. 模型配置:设置YOLOv5的训练参数,包括类别数量等。
  4. 模型训练:使用训练集对模型进行训练。
  5. 模型评估:使用验证集和测试集评估模型性能。

关键代码示例

1. 数据集准备
1import os
2import cv2
3import numpy as np
4
5def load_data(data_dir):
6    labels = sorted(os.listdir(data_dir))
7    data = []
8    for label in labels:
9        path = os.path.join(data_dir, label)
10        for img_name in os.listdir(path):
11            img_path = os.path.join(path, img_name)
12            img = cv2.imread(img_path, cv2.IMREAD_COLOR)
13            img = cv2.resize(img, (640, 640))  # YOLOv5 输入尺寸
14            data.append([img, labels.index(label)])
15    return np.array(data)
16
17data_dir = 'path/to/construction_vehicle_dataset'
18data = load_data(data_dir)
2. 模型训练
1# 安装YOLOv5
2pip install yolov5
3
4# 开始训练
5yolov5 train data=path/to/construction_vehicle_dataset/dataset.yaml cfg=yolov5s.yaml weights=pretrained_weights.pt epochs=100

报告和文档

  • 报告:报告应包括数据集背景、数据集组成、标注格式、使用指南等内容。
  • 文档:文档应包括数据集的组织方式、标注格式、模型训练及评估的具体步骤等。

 

你可能感兴趣的:(数据集,分类,人工智能,机器学习,工地工程车,汽车)