轮子去哪儿了

models.py YOLOv3 中 darknet 模型构建过程

文章目录

- 说明：
- 模型构建如下：
- - 1. 模型构建过程
  - - 1. 第一步：理解模型配置文件 yolov3.cfg
    - 2. 第二步：解析 config_path 配置文件，生成 module_defs 列表
    - 3. 第三步：根据 module_defs 列表，创建 module_list 模型列表
    - 3.1 构建 module_list 模型列表的主要代码如下：
    - 3.2 模型中需要重点理解的地方：
    - - 3.2.1 定义一个 yolo层需要的三个参数
      - 3.2.2 yolo层对数据的处理过程，计算过程
  - 2. yolo 层中loss 的计算
  - 完

说明：

代码来源：PyTorch-YOLOv3：https://github.com/eriklindernoren/PyTorch-YOLOv3
模型是通过论文作者的 .cfg 配置文件自动生成的。

模型构建如下：

1. 模型构建过程

1. 第一步：理解模型配置文件 yolov3.cfg

YOLO 模型根据一个.cfg 配置文件生成的。配置文件路径：opt.model_def 的默认地址是 “config/yolov3.cfg”
“yolov3.cfg” 文件的部分内容如下：

[net]
# Testing
#batch=1
#subdivisions=1
# Training
batch=16
subdivisions=1
width=416
........

[convolutional]
batch_normalize=1
filters=32
size=3

.......

[shortcut]
from=-3
activation=linear

......

[yolo]
mask = 6,7,8
anchors = 10,13,  16,30,  33,23,  30,61,  62,45,  59,119,  116,90,  156,198,  373,326
classes=80
num=9
jitter=.3
ignore_thresh = .7
truth_thresh = 1
random=1

[route]
layers = -4

......
[upsample]
stride=2

......

2. 第二步：解析 config_path 配置文件，生成 module_defs 列表

self.module_defs = parse_model_config(config_path)  # model.py 文件中解析

parse_model_config 函数：解析 “config/yolov3.cfg” 文件内容成字典,
parse_model_config(config_path) 解析后的结果 self.module_defs（字典）如下：

module_defs 列表 内容如下：

[{'type': 'net', 'batch': '16', 'subdivisions': '1', 'width': '416', 'height': '416', 'channels': '3', 'momentum': '0.9', 'decay': '0.0005', 'angle': '0', 'saturation': '1.5', 'exposure': '1.5', 'hue': '.1', 'learning_rate': '0.001', 'burn_in': '1000', 'max_batches': '500200', 'policy': 'steps', 'steps': '400000,450000', 'scales': '.1,.1'},
 {'type': 'convolutional', 'batch_normalize': '1', 'filters': '32', 'size': '3', 'stride': '1', 'pad': '1', 'activation': 'leaky'},
 {'type': 'convolutional', 'batch_normalize': '1', 'filters': '64', 'size': '3', 'stride': '2', 'pad': '1', 'activation': 'leaky'},
 {'type': 'convolutional', 'batch_normalize': '1', 'filters': '32', 'size': '1', 'stride': '1', 'pad': '1', 'activation': 'leaky'},
 {'type': 'convolutional', 'batch_normalize': '1', 'filters': '64', .....
 ......
 }

3. 第三步：根据 module_defs 列表，创建 module_list 模型列表

module_list 模型列表，即一个 nn.ModuleList() 列表，将网路的各个层 nn.Sequential() 依次添加在其中。（如 conv、maxpool、upsample、route、shortcut、yolo 层）
构建模型列表是为了给 model.forward() 函数使用的。

self.hyperparams, self.module_list = create_modules(self.module_defs)
print(len(self.module_defs))  # 107
print(len(self.module_list))  # 107

self.hyperparams 的内容（由 module_defs 列表中第一个字典的内容构造的）如下：

{'type': 'net', 'batch': '16', 'subdivisions': '1', 
'width': '416', 'height': '416', 'channels': '3',
'momentum': '0.9', 'decay': '0.0005', 'angle': '0',
'saturation': '1.5', 'exposure': '1.5', 'hue': '.1',
'learning_rate': '0.001', 'burn_in': '1000',
'max_batches': '500200', 'policy': 'steps',
'steps': '400000,450000', 'scales': '.1,.1'}

self.module_list 的内容（由 module_defs 列表中除了第一个字典的其他内容构造的）如下：

module_list 内容如下：

ModuleList(
  (0): Sequential(
    (conv_0): Conv2d(3, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
    (batch_norm_0): BatchNorm2d(32, eps=1e-05, momentum=0.9, affine=True, track_running_stats=True)
    (leaky_0): LeakyReLU(negative_slope=0.1)
  )
  (1): Sequential(
    (conv_1): Conv2d(32, 64, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
    (batch_norm_1): BatchNorm2d(64, eps=1e-05, momentum=0.9, affine=True, track_running_stats=True)
    (leaky_1): LeakyReLU(negative_slope=0.1)
  )
  
......

  (4): Sequential(
    (shortcut_4): EmptyLayer()
  )
  
......

  (11): Sequential(
    (shortcut_11): EmptyLayer()
  )
  (12): Sequential(
    (conv_12): Conv2d(128, 256, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
    (batch_norm_12): BatchNorm2d(256, eps=1e-05, momentum=0.9, affine=True, track_running_stats=True)
    (leaky_12): LeakyReLU(negative_slope=0.1)
  )
  
.......

  (81): Sequential(
    (conv_81): Conv2d(1024, 255, kernel_size=(1, 1), stride=(1, 1))
  )
  (82): Sequential(
    (yolo_82): YOLOLayer(
      (mse_loss): MSELoss()
      (bce_loss): BCELoss()
    )
  )
  (83): Sequential(
    (route_83): EmptyLayer()
  )
  (84): Sequential(
    (conv_84): Conv2d(512, 256, kernel_size=(1, 1), stride=(1, 1), bias=False)
    (batch_norm_84): BatchNorm2d(256, eps=1e-05, momentum=0.9, affine=True, track_running_stats=True)
    (leaky_84): LeakyReLU(negative_slope=0.1)
  )
  (85): Sequential(
    (upsample_85): Upsample()
  )
  (86): Sequential(
    (route_86): EmptyLayer()
  )
  (87): Sequential(
    (conv_87): Conv2d(768, 256, kernel_size=(1, 1), stride=(1, 1), bias=False)
    (batch_norm_87): BatchNorm2d(256, eps=1e-05, momentum=0.9, affine=True, track_running_stats=True)
    (leaky_87): LeakyReLU(negative_slope=0.1)
  )
  
......

  (104): Sequential(
    (conv_104): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
    (batch_norm_104): BatchNorm2d(256, eps=1e-05, momentum=0.9, affine=True, track_running_stats=True)
    (leaky_104): LeakyReLU(negative_slope=0.1)
  )
  (105): Sequential(
    (conv_105): Conv2d(256, 255, kernel_size=(1, 1), stride=(1, 1))
  )
  (106): Sequential(
    (yolo_106): YOLOLayer(
      (mse_loss): MSELoss()
      (bce_loss): BCELoss()
    )
  )
)

3.1 构建 module_list 模型列表的主要代码如下：

module_list 是根据 module_defs（列表）构建的。
module_list 是模型列表，列表中的 107 个Sequential()之间是相互独立的，但有先后关系的，可以通过 for … in … 来遍历其中的每一个 Sequential()。

主要涉及的函数如下：

import torch.nn as nn

def create_modules(module_defs):
	hyperparams = module_defs.pop(0)  # 弹出列表中得第一元素（第一个字典，第一个保存的是net的一些设置）
	output_filters = [int(hyperparams["channels"])]  # 用于记录 图片的通道数目的变化  3
	module_list = nn.ModuleList() # 用于 依次存放每一个网络结构层
	for module_i, module_def in enumerate(module_defs):  # 遍历列表中的每一个字典（每一层网络）
	    modules = nn.Sequential()  # 构架一个 小模块
	    
	    if module_def["type"] == "convolutional":  #  卷积层
	    	.....
	    	filters = int(module_def["filters"])
	    	modules.add_module(  # 模型添加 卷积层
		    	f"conv_{module_i}",
		        nn.Conv2d(  
		              in_channels= output_filters[-1]
		              out_channels=
		              kernel_size= 
		              stride= 
		              padding= 
		              bias=not bn,   
		        ),
	    	)
	    	if bn:  #  模型添加 BN 层  
	    		moudle.add_moudule(f"batch_norm_{module_i}", nn.BatchNorm2d(filters, momentum=0.9, eps=1e-5))
	    	if module_def["activation"] == "leaky":  # 模型添加 relu 层
	            modules.add_module(f"leaky_{module_i}", nn.LeakyReLU(0.1))   # x < 0时， y = 0.1 * X
	    
	    elif module_def["type"] == "maxpool":  # 池化层
	    	modules.add_module(f"_debug_padding_{module_i}", nn.ZeroPad2d((0, 1, 0, 1)))  # 模型添加 pad 处理
	    	modules.add_module(f"maxpool_{module_i}", maxpool)  #  模型添加 最大池化层
	    
	    elif module_def["type"] == "upsample":  # 上采样 参数设置	
	    	modules.add_module(f"upsample_{module_i}", upsample)
	    
	    elif module_def["type"] == "route":
	    	filters = ...
	    	modules.add_module(f"route_{module_i}", EmptyLayer())
	    
	    elif module_def["type"] == "shortcut":
	    	filters = ...
	    	modules.add_module(f"shortcut_{module_i}", EmptyLayer())
	    
	    elif module_def["type"] == "yolo":
	    	modules.add_module(f"yolo_{module_i}", yolo_layer)
	    module_list.append(modules)  # modules 是模型中一个 Sequential()  # module_list 是所有的 Sequential()，即整个模型 
	    output_filters.append(filters)  #  filters 数量
	    
	return hyperparams, module_list

3.2 模型中需要重点理解的地方：

3.2.1 定义一个 yolo层需要的三个参数

yolo_layer = YOLOLayer(anchors, num_classes, img_size)

anchors # 一共有 9 组。每一个yolo检测层只使用其中的三组，如：[(116, 90), (156, 198), (373, 326)]
num_classes # 80
img_size # 图片的大小 416

3.2.2 yolo层对数据的处理过程，计算过程

需要的参数:
grid_size # 网格的个数 13
stride # 每个网格的步幅宽度 416 / 13 = 32
scaled_anchors # 缩放anchors： [(116, 90), (156, 198), (373, 326)] / 32
grid_x # tensor([[[
[0, 1, 2 … 12],
[0, 1, 2 … 12],
[0, 1, 2 … 12]]]])
grid_y # tensor([[[
[0, 0, 0],
[1, 1, 1],
[2, 2, 2]
…
[12, 12, 12]]]])
scaled_anchors # tensor([
[ 3.6250, 2.8125],
[ 4.8750, 6.1875],
[11.6562, 10.1875]], device=‘cuda:0’)
anchor_w # 当前三个anchor 的宽度 3.6 4.8 11.6
anchor_h # 当前三个anchor 的高度 2.8 6.1 10.1
输入yolo层的数据是 x ：
三个yolo层(网路一共有三个yolo层)中的输入数据x的shape 分别是:
torch.Size([1, 255, 13, 13])
torch.Size([1, 255, 26, 26])
torch.Size([1, 255, 52, 52])
这里的255是不能改变的 255 = 3 *（5 + 80）（255 的原因：每张图片会被分成 13 * 13 个格子，每个格子使用 3 个anchor 进行预测，每个 anchor 需要预测 4 个坐标的概率 + 1个box框的概率 + 80 个类别的概率。）
prediction时，需要将255才开成 3 * 85，方便后续处理：
torch.Size([1, 3, 13, 13, 85])
torch.Size([1, 3, 26, 26, 85])
torch.Size([1, 3, 52, 52, 85])
输出 yolo 层的数据是 output
在 yolo 层中，不是对数据进行卷积、池化之类的操作，而是对数据进行 sigmod 或 exp 之类的处理。4个坐标数据需要经过论文中计算，将相对于 grid cell 的坐标转化成相对于整幅图片的坐标。
output 也是由 1 * 13 * 13 * (4 + 1 + 80) 组成，只是其中的 4 +1 + 80 个数据经过 “类似” sigmod 操作后的 output。
程序中的计算代码如下：

# 4个坐标的 sigmod 处理过程：
x = torch.sigmoid(prediction[..., 0])  # Center x  # 预测到的一个目标框的 x 值
y = torch.sigmoid(prediction[..., 1])  # Center y

pred_boxes[..., 0] = x.data + self.grid_x  # 给每一个预测的box 添加片偏置量， 作为最后的预测结果
pred_boxes[..., 1] = y.data + self.grid_y
pred_boxes[..., 2] = self.anchor_w * torch.exp(w.data)  
pred_boxes[..., 3] = self.anchor_h * torch.exp(h.data)  

# 1个 边框置信度 和 80个类别信息也是经过 sigmod 处理后得到的。
pred_conf = torch.sigmoid(prediction[..., 4])  # Conf  预测到的一个目标框的 置信度 值
pred_cls = torch.sigmoid(prediction[..., 5:])  # Cls pred.  预测到的一个目标框的 80个类别 的概率

论文中的计算公司如下：

2. yolo 层中loss 的计算

重点理解

yolo 层中计算 loss时，输入的坐标数据不是相对于原始图片标签坐标，而是相对于特征图的坐标信息，所以计算 loss 时，需要将相对于原图的标签转化成相对于特征图的标签坐标信息。
mse_loss：均方损失函数，计算坐标 x y w h 时使用
bce_loss：二分类用的交叉熵损失函数，计算 1 + 80 个数据时使用
最后总的 loss 就是前面这些 loss 的简单相加即可。

# Loss : Mask outputs to ignore non-existing objects (except with conf. loss)
loss_x = self.mse_loss(x[obj_mask], tx[obj_mask])  # mse 均方误差
loss_y = self.mse_loss(y[obj_mask], ty[obj_mask])
loss_w = self.mse_loss(w[obj_mask], tw[obj_mask])
loss_h = self.mse_loss(h[obj_mask], th[obj_mask])

loss_conf_obj = self.bce_loss(pred_conf[obj_mask], tconf[obj_mask])  # 二分类用的交叉熵损失函数
loss_conf_noobj = self.bce_loss(pred_conf[noobj_mask], tconf[noobj_mask])  # 如何理解两个类别？？？？？

loss_conf = self.obj_scale * loss_conf_obj + self.noobj_scale * loss_conf_noobj  # 判断有误边框。有目标：没目标 是 1:100的权重
loss_cls = self.bce_loss(pred_cls[obj_mask], tcls[obj_mask])  # 80个类别的
total_loss = loss_x + loss_y + loss_w + loss_h + loss_conf + loss_cls  # 总的loss

完

你可能感兴趣的:(YOLO,yolov3,darknet)

【目标检测】机场内部目标检测数据集4106张YOLO+VOC格式
数据集格式：VOC格式+YOLO格式压缩包内含：3个文件夹，分别存储图片、xml、txt文件JPEGImages文件夹中jpg图片总计：4106Annotations文件夹中xml文件总计：4106labels文件夹中txt文件总计：4106标签种类数：7标签名称:["Ground_vehicles","Horizontal_sign","Runaway_limit","Taxiway","Ver
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
模型训练与部署注意事项篇---resize Atticus-Orion 图像处理篇深度学习篇模型训练与部署注意事项篇深度学习计算机视觉人工智能
图像大小的影响在YOLOv系列模型的训练和推理部署过程中，图像大小的选择是影响模型性能（精度、速度、泛化能力）的关键因素之一。两者的关系既相互关联，又存在一定的灵活性，具体可从以下几个方面详细分析：一、核心关系：训练与推理图像大小的“基准一致性”YOLOv模型（如YOLOv5、v7、v8等）的训练和推理图像大小通常以**“基准尺寸”**为核心关联，即训练时设定的图像尺寸会作为模型设计的基础，而推理
将多个小型YOLO数据集合并为一个大型数据集梦实学习室 YOLO python YOLO python 机器学习
一、将多个小型YOLO数据集合并为一个大型数据集importosimportshutilimportargparsedefmerge_data(source_dir,target_dir,images_dir,labels_dir):images_target=os.path.join(target_dir,images_dir)labels_target=os.path.join(target_
目标检测中的NMS算法详解
好的，我们来详细解释一下目标检测中非极大值抑制（Non-MaximumSuppression,NMS）的相关概念和计算过程。1.为什么需要NMS？问题：目标检测模型（如FasterR-CNN,YOLO,SSD等）在推理时，对于同一个目标物体，通常会预测出多个重叠的、不同置信度（confidencescore）的候选边界框（BoundingBoxes）。直接输出所有这些框会导致：结果冗余：同一个物体
电梯开关状态人员进出检测数据集VOC+YOLO格式2220张4类别 fl176831 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：2220标注数量(xml文件个数)：2220标注数量(txt文件个数)：2220标注类别数：4标注类别名称:["CloseElevator","People-in-elevator","The-elevator-was-
YOLOv11 技术详解：架构优化与性能提升代码老y YOLO 架构目标跟踪
YOLOv11是目标检测领域中一个备受瞩目的新版本，它在保持实时性的同时，显著提升了检测的准确性和效率。本文将深入探讨YOLOv11的架构改进、性能优化以及它在不同应用场景中的表现。一、架构改进（一）C3K2块YOLOv11引入了C3K2块，这是对之前版本中CSP（CrossStagePartial）块的增强。C3K2块使用不同的核大小（例如3x3或5x5）和通道分离策略来优化更复杂特征的提取。这
Yolov5-obb(旋转目标poly_nms_cuda.cu编译bug记录及解决方案)
关于在执行pythonsetup.pydevelop#or"pipinstall-v-e."时poly_nms_cuda.cu报错问题。前面步骤严格按照install.md环境1.pytorch版本较低时（我的是1.10）：poly_nms_cuda.cu文件添加”#defineeps1e-8“，删除“constdoubleeps=1E-8;”这句2.pytorch版本较高时（我用的是1.27）h
YOLO11 目标检测从安装到实战
前言YOLO（YouOnlyLookOnce）系列是目标检测领域的经典算法，凭借速度快、精度高的特点被广泛应用。最新的YOLO11在模型结构和性能上进一步优化，本文将从环境搭建到实战应用，详细讲解YOLO11的使用方法，适合新手快速上手。一、环境准备1.系统要求操作系统：Windows10/11、Ubuntu20.04+、欧拉系统等硬件：CPU可运行，GPU（NVIDIA）可加速（推荐，需支持CU
街道垃圾识别难？陌讯视觉算法实测准确率突破95% 2501_92487900 算法边缘计算目标检测视觉检测计算机视觉
开篇痛点：街道垃圾识别的技术挑战在智慧城市和环保监管场景中，街道垃圾的实时检测一直是个难题。传统视觉算法（如YOLOv5、FasterR-CNN）在复杂街道场景下表现不佳，主要面临以下问题：光照干扰：早晚光线变化导致误检（如阴影被识别为垃圾）小目标漏检：饮料瓶、烟头等小物体在640x640输入下仅占10x10像素遮挡问题：垃圾桶周边堆积物造成特征混淆某环保科技公司实测数据显示，开源模型在真实场景中
占道识别漏检率 30%？陌讯多模态算法实测优化 2501_92487926 算法 ai 计算机视觉视觉检测
开篇：占道经营识别的三大技术痛点在城市管理智能化进程中，占道经营自动识别系统常面临三大核心难题：一是早晚光线剧变导致传统模型mAP骤降15-20%；二是流动摊贩与行人的特征混淆，误判率高达28%；三是密集场景下检测速度跌破15FPS，无法满足实时性要求[1]。某一线城市试点数据显示，基于开源YOLOv5的识别系统日均漏检事件超300起，人工复核成本占总投入的42%。这些问题的根源在于传统算法采用单
YOLOv8 环境监测五大场景 —— 二、森林火灾早期预警之无人机巡逻监测详细解释及代码完整示例路飞VS草帽 YOLOv8 原理与源代码讲解---六大章 YOLOv各版本的应用详细说明及代码示例环境监测五大场景 YOLO 无人机环境监测森林火灾早期预警无人机巡逻监测 YOLOv8
YOLOv8无人机森林火灾巡逻监测系统系统架构设计无人机火灾监测系统组成：1.飞行平台-多旋翼无人机(续航≥60分钟)-双光吊舱(可见光+红外)-RTK高精度定位-4G/5G数据链2.机载计算单元-JetsonOrinNX(AI加速)-轻量化YOLOv8模型-实时火情分析3.地面控制站-飞行路径规划-实时视频监控-火情预警系统4.云端协同-多机任务分配-火势扩散预测-应急资源调度完整代码实现1.无
安防监控漏报频发？陌讯实时检测算法实测召回率98% 2501_92487721 目标跟踪计算机视觉人工智能算法
一、开篇痛点：安防监控的检测难题在夜间低光、遮挡、小目标等复杂场景下，传统YOLO系列算法常出现漏检（FN）和误检（FP）。某安防厂商测试数据显示：当目标像素<50×50时，开源模型召回率骤降至65%以下。二、技术解析：陌讯算法的三重创新陌讯视觉算法通过多尺度特征融合+自适应光照补偿提升鲁棒性：动态感受野机制在Backbone中引入可变形卷积（DeformableConv），公式表示为：y(p)=
重型机械识别漏检率高？陌讯算法实测降 35%
在重型机械作业场景中，传统视觉识别系统常面临三大痛点：大型设备遮挡严重导致漏检率超20%、金属表面反光使特征提取失效、多机型混合作业时模型泛化能力不足。某港口集团曾反馈，其基于开源YOLOv5部署的机械监控系统，在暴雨天气下误报率飙升至37%，直接影响作业调度效率[实测数据来源：某港口2024年Q1运维报告]。技术解析：陌讯算法的三重突破陌讯视觉算法针对重型机械识别的特殊性，采用了创新的"动态注意
模型实战（21）之 C++ - tensorRT部署yolov8-det 目标检测明月醉窗台 #深度学习实战例程人工智能 c++YOLO 目标检测计算机视觉人工智能
C++-tensorRT部署yolov8-det目标检测python环境下如何直接调用推理模型转换并导出：pt->onnx->.engineC++tensorrt部署检测模型不写废话了，直接上具体实现过程+all代码1.Python环境下推理直接命令行推理，巨简单yolodetectpredictmodel=yolov8n.ptsource='https
【零基础学AI】第31讲：目标检测 - YOLO算法 1989 0基础学AI 人工智能目标检测 YOLO rnn lstm tensorflow
本节课你将学到YOLO算法的核心思想和工作原理如何使用YOLO进行物体检测构建一个简单的物体检测系统开始之前环境要求Python3.8+需要安装的包：opencv-python,numpy,matplotlib硬件要求：推荐使用GPU（非必须）前置知识基本Python编程能力了解卷积神经网络（CNN）的基本概念（第24讲内容）核心概念什么是目标检测？目标检测就像教计算机"看"图片中的物体。它不仅要
如何使用目标检测深度学习框架yolov8训练钢管管道表面缺陷VOC+YOLO格式1159张3类别的检测数据集步骤和流程 FL1623863129 深度学习目标检测深度学习 YOLO
【数据集介绍】数据集中有很多增强图片，大约300张为原图剩余为增强图片数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1159标注数量(xml文件个数)：1159标注数量(txt文件个数)：1159标注类别数：3所在仓库：firc-dataset标注类别名称(注意yo
钢管管道表面缺陷检测数据集VOC+YOLO格式1159张3类别 FL1623863129 数据集 YOLO 深度学习机器学习
数据集中有很多增强图片，大约300张为原图剩余为增强图片数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1159标注数量(xml文件个数)：1159标注数量(txt文件个数)：1159标注类别数：3所在仓库：firc-dataset标注类别名称(注意yolo格式类别顺
YOLOv5基础 | 万字长文带你深度解析yolov5s.yaml配置文件小哥谈 YOLO算法：基础+进阶+改进 YOLO 人工智能目标检测机器学习计算机视觉深度学习
前言：Hello大家好，我是小哥谈。配置文件yolov5s.yaml在YOLOv5模型训练过程中发挥着至关重要的作用，属于初学者必知必会的文件！在YOLOv5-6.0版本源码中，配置了5种不同大小的网络模型，分别是YOLOv5n、YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x，其中YOLOv5n是网络深度和宽度最小但检测速度最快的模型，其他4种模型都是在YOLOv5n的基础上不断加
万字长文详解YOLOv8 yaml 文件，结合模型输出的网络结构图分析Parameters /backbone/head以及三者的数学关联 YOLO大师 YOLO 论文阅读
YOLO目标检测创新改进与实战案例专栏专栏目录：YOLO有效改进系列及项目实战目录包含卷积，主干注意力，检测头等创新机制以及各种目标检测分割项目实战案例专栏链接:YOLO基础解析+创新改进+实战案例之前写过一篇YOLOv8yaml配置文件逐层的解析：结合YOLOv8源码逐层解读yaml文件的配置，本文主要从整体的角度去解析yaml。YOLOv8模型YOLOv8提供了非常多的模型，详见：https:
万字长文带你搞懂yolov5和yolov8以及目标检测相关面试起个别名 C++YOLO 目标检测目标跟踪
一、与yoloV4相比，yoloV5的改进输入端：在模型训练阶段，使用了Mosaic数据增强、自适应锚框计算、自适应图片缩放基准网络：使用了FOCUS结构和CSP结构Neck网络：在Backbone和最后的Head输出层之间插入FPN_PAN结构Head输出层：训练时的损失函数GIOU_Loss，预测筛选框的DIOU_nms二、yolov5网络结构预处理在模型预处理阶段，使用了Mosaic数据增强
YOLOv11模型轻量化挑战技术文章大纲程序猿全栈の董（董翔） github YOLOv11
模型轻量化的背景与意义目标检测模型YOLOv11的性能与应用场景轻量化的必要性：边缘设备部署、实时性需求、计算资源限制轻量化面临的挑战：精度与速度的权衡、模型压缩方法的选择YOLOv11的轻量化技术方向网络结构优化：深度可分离卷积、分组卷积、瓶颈设计模型剪枝：结构化剪枝与非结构化剪枝策略知识蒸馏：教师-学生模型框架与特征匹配方法量化与低比特压缩：FP16/INT8量化与二值化网络轻量化实现的具体方
【目标检测】Yolov7 的 ELAN 和 E-ELAN 模块演进（涉及到分组卷积，cardinality，梯度路径） Jiangnan_Cai 深度学习目标检测 YOLO 人工智能
感觉从YOLOv6开始，YOLOv6系列感觉优化点都着重于推理速度上面，YOLOv6的RepBlock重参数化，给我的感觉就是算子融合进行加速。而YOLOv7，为了在各种架构的边缘设备上获得极致的推理速度。YOLOv7的工作：新的bagoffreebies（有效的训练技巧，不会增加推理的计算量）有规划的重参数化模型（不同边缘设备架构，不同的重参数化方法）新的动态标签分配方法为了更好的理解YOLOv
目标检测YOLO实战应用案例100讲-基于深度学习的自动驾驶目标检测算法研究（续）林聪木目标检测 YOLO 深度学习
目录基于双蓝图卷积的轻量化自动驾驶目标检测算法5.1引言5.2DarkNet53网络冗余性分析5.3双蓝图卷积网络5.4实验结果及分析基于深度学习的自动驾驶目标检测算法研究与应用传统的目标检测算法目标检测基线算法性能对比与选择相关理论和算法基础2.1引言2.2人工神经网络2.3FCOS目标检测算法2.4复杂交通场景下的目标检测难点与FCOS改进方案基于FCOS的目标检测算法改进3.1引言3.2Re
人体坐姿检测系统开发实战（YOLOv8+PyTorch+可视化） Loving_enjoy 计算机学科论文创新点人工智能深度学习迁移学习经验分享
本文将手把手教你构建智能坐姿检测系统，结合目标检测与姿态估计技术，实现不良坐姿的实时识别与预警###一、项目背景与价值现代人每天平均坐姿时间超过8小时，不良坐姿会导致：-脊椎压力增加300%-颈椎病发病率提升45%-腰椎间盘突出风险增加60%本系统通过计算机视觉技术实时监测坐姿状态，对驼背、侧倾、前倾等不良姿势进行智能识别和预警。相较于传统传感器方案，我们的视觉方案具有非接触、低成本、易部署的优势
YOLOv11 | SAConv与C3k2融合架构技术详解，替换传统下采样Conv wei子技术杂谈 YOLO 人工智能
YOLOv11|SAConv与C3k2融合架构技术详解，替换传统下采样Conv1.核心创新与技术价值1.1突破性设计理念本文提出的SAConv（SwitchableAtrousConvolution）可切换空洞卷积结合C3k2二次创新模块，在YOLOv11中实现了三大突破：动态感受野调节：支持[1,2,3]三种空洞率的实时切换多尺度特征融合：跨层级特征的无损传递计算效率优化：相比传统空洞卷积节省3
煤炭传送带YOLOv8异物检测系统介绍 qq1309399183 计算机视觉实战项目集合 YOLO 目标检测人工智能深度学习计算机视觉传送带识别异物识别
传送带YOLOv8异物检测系统介绍随着工业自动化水平的不断提高，传送带系统在矿山、食品加工、制造业等领域的应用日益广泛。然而，传送带在运行过程中常常会混入各种异物，如金属零件、石块、木块等，这些异物不仅会影响产品质量，还可能损坏设备甚至危及人员安全。基于YOLOv8算法的传送带异物检测系统应运而生，为解决这一问题提供了智能化解决方案。系统概述YOLOv8(YouOnlyLookOnceversio
Python机器学习与深度学习：决策树、随机森林、XGBoost与LightGBM、迁移学习、循环神经网络、长短时记忆网络、时间卷积网络、自编码器、生成对抗网络、YOLO目标检测等 WangYan2022 机器学习/深度学习 Python 机器学习深度学习随机森林迁移学习
融合最新技术动态与实战经验，旨在系统提升以下能力：①掌握ChatGPT、DeepSeek等大语言模型在代码生成、模型调试、实验设计、论文撰写等方面的实际应用技巧②深入理解深度学习与经典机器学习算法的关联与差异，掌握其理论基础③熟练运用PyTorch实现各类深度学习模型，包括迁移学习、循环神经网络（RNN）、长短时记忆网络（LSTM）、时间卷积网络（TCN）、自编码器、生成对抗网络（GAN）、YOL
基于YOLOv8深度学习架构的智能农业巡检小车系统—面向农作物与杂草实时精准识别的创新实践
1.科技赋能智慧农业随着全球人口的持续增长和农业生产面临的挑战，精准农业已成为现代农业发展的必然趋势。其中，农作物与杂草的精准识别是实现自动化、智能化管理的关键一环。传统的人工除草效率低下，化学除草则可能带来环境问题。因此，开发高效、精准、环保的智能农业系统迫在眉睫。本文将深入探讨一款基于深度学习和智能硬件集成的农田作业智能小车系统。我们将重点聚焦于其硬件系统设计、软件系统架构、核心算法创新(特别
YOLOv11模型轻量化挑战的技术黑客飓风 YOLO 目标跟踪人工智能
YOLOv11模型轻量化挑战的技术文章大纲背景与意义YOLOv11在目标检测领域的地位与优势轻量化需求的实际应用场景（移动端、嵌入式设备等）轻量化面临的挑战：精度与速度的权衡YOLOv11模型结构分析整体架构设计特点（如主干网络、特征融合模块等）参数量与计算量分布的关键瓶颈现有轻量化改进的局限性轻量化技术路线网络结构优化深度可分离卷积替代传统卷积注意力机制的高效嵌入设计冗余模块的剪枝与删除量化与压
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他