wei子

YOLOv11训练教程：PyTorch与PyCharm在Windows 11下的完整指南

YOLOv11训练教程：PyTorch与PyCharm在Windows 11下的完整指南

介绍与引言

YOLO(You Only Look Once)是当前最流行的实时目标检测算法系列之一，YOLOv11作为该系列的最新演进版本，继承了YOLO家族高效、快速的特点，同时在精度和速度上有了进一步提升。本教程将详细介绍如何在Windows 11系统下使用PyTorch框架和PyCharm IDE进行YOLOv11模型的训练与部署。

目标检测作为计算机视觉的核心任务之一，在自动驾驶、安防监控、工业质检、医疗影像分析等领域有着广泛应用。YOLOv11凭借其出色的实时性能，特别适合需要快速响应的应用场景。

技术背景

YOLO发展历程

YOLO系列自2016年首次提出以来，经历了多个版本的迭代：

YOLOv1-v3: Joseph Redmon主导的基础版本
YOLOv4: Alexey Bochkovskiy优化的高性能版本
YOLOv5: Ultralytics推出的PyTorch实现
YOLOv6-v8: 各研究团队的不同改进版本
YOLOv9-v11: 最新演进版本，融合了Transformer等现代架构

YOLOv11核心创新

YOLOv11在前代基础上引入了多项改进：

更高效的骨干网络设计
改进的特征金字塔结构
优化的损失函数
动态标签分配策略
增强的数据增强管道

应用使用场景

YOLOv11适用于多种实时目标检测场景：

智能安防：实时监控视频中的人、车、危险物品检测
自动驾驶：道路场景中的车辆、行人、交通标志识别
工业检测：生产线上的缺陷产品自动筛查
零售分析：货架商品识别与顾客行为分析
农业应用：作物生长监测与病虫害识别
医疗影像：医学图像中的病灶区域定位

环境准备

硬件要求

操作系统：Windows 11
CPU：建议Intel i7或更高
GPU：NVIDIA显卡(建议RTX 2060以上，支持CUDA)
内存：16GB以上
存储：SSD硬盘，至少50GB可用空间

软件安装

1. 安装PyCharm

访问JetBrains官网下载PyCharm Community版
运行安装程序，按向导完成安装
启动PyCharm，完成初始配置

2. 安装Python

从Python官网下载3.8-3.10版本的Windows安装包
安装时勾选"Add Python to PATH"
验证安装：命令行运行python --version

3. 安装CUDA和cuDNN

查看显卡支持的CUDA版本(NVIDIA控制面板→系统信息)
从NVIDIA官网下载对应版本的CUDA Toolkit
下载匹配的cuDNN库，解压后复制到CUDA安装目录

添加环境变量：

CUDA_PATH = C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.7
PATH中添加: %CUDA_PATH%\bin

4. 创建虚拟环境

在PyCharm中：

File → New Project → 选择Python解释器
创建新的虚拟环境(建议Python 3.8)

5. 安装PyTorch

在PyCharm终端或命令行中运行：

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117

验证PyTorch GPU支持：

import torch
print(torch.cuda.is_available())  # 应输出True

6. 安装YOLOv11依赖

pip install opencv-python matplotlib tqdm pandas seaborn
pip install pycocotools tensorboard

YOLOv11算法原理

核心架构

YOLOv11采用了一种改进的CSPDarknet骨干网络，结合PANet特征金字塔和动态头机制：

骨干网络(Backbone): 提取多层次特征
颈部(Neck): 特征融合与增强
头部(Head): 预测边界框和类别

算法流程图

输入图像 → 数据增强 → CSPDarknet骨干 → PANet特征融合 → 动态检测头 → 输出预测
           ↑
          GT标签 → 标签分配 → 损失计算

关键创新点

动态标签分配：根据预测质量动态调整正负样本分配
损失函数优化：改进的CIoU损失和分类损失平衡
自适应特征融合：根据任务难度自动调整特征融合权重

代码实现

1. 数据集准备

以COCO格式数据集为例：

dataset/
├── images/
│   ├── train/
│   └── val/
└── labels/
    ├── train/
    └── val/

创建数据集配置文件data/custom.yaml:

# 训练和验证图像路径
train: ../dataset/images/train
val: ../dataset/images/val

# 类别数
nc: 3

# 类别名称
names: ['person', 'car', 'dog']

2. 模型训练

下载YOLOv11官方代码库：

git clone https://github.com/WongKinYiu/yolov11
cd yolov11

训练脚本示例：

import torch
from models.yolo import Model
from utils.datasets import create_dataloader
from utils.general import colorstr

# 超参数配置
hyp = {
    'lr0': 0.01,          # 初始学习率
    'momentum': 0.937,    # SGD动量
    'weight_decay': 0.0005,  # 权重衰减
    'warmup_epochs': 3.0, # 热身epochs
    'box': 0.05,          # box损失权重
    'cls': 0.5,           # cls损失权重
    'obj': 1.0,           # obj损失权重
}

# 数据加载
train_loader = create_dataloader('data/custom.yaml', 
                                imgsz=640, 
                                batch_size=16, 
                                stride=32, 
                                hyp=hyp, 
                                augment=True)[0]

# 模型初始化
model = Model('models/yolov11s.yaml', ch=3, nc=3).to('cuda')

# 优化器
optimizer = torch.optim.SGD(model.parameters(), 
                          lr=hyp['lr0'], 
                          momentum=hyp['momentum'], 
                          nesterov=True)

# 训练循环
for epoch in range(100):
    model.train()
    
    for i, (imgs, targets, paths, _) in enumerate(train_loader):
        imgs = imgs.to('cuda').float() / 255.0
        targets = targets.to('cuda')
        
        # 前向传播
        pred = model(imgs)
        
        # 计算损失
        loss, loss_items = compute_loss(pred, targets, model)
        
        # 反向传播
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        
        # 打印训练信息
        if i % 50 == 0:
            print(f'Epoch: {epoch}, Batch: {i}, Loss: {loss.item()}')

3. 模型验证

from utils.metrics import ap_per_class

# 验证数据加载
val_loader = create_dataloader('data/custom.yaml', 
                              imgsz=640, 
                              batch_size=16, 
                              stride=32, 
                              hyp=hyp, 
                              augment=False, 
                              pad=0.5, 
                              rect=True)[0]

# 验证模式
model.eval()
stats = []

for i, (imgs, targets, paths, shapes) in enumerate(val_loader):
    imgs = imgs.to('cuda').float() / 255.0
    
    # 非极大值抑制(NMS)参数
    conf_thres = 0.001  # 置信度阈值
    iou_thres = 0.6     # IoU阈值
    
    with torch.no_grad():
        # 推理
        pred = model(imgs)
        pred = non_max_suppression(pred, conf_thres, iou_thres)
    
    # 处理每张图像的预测结果
    for si, pred in enumerate(pred):
        labels = targets[targets[:, 0] == si, 1:]
        stats.append(ap_per_class(pred, labels, shapes[si][0]))
        
# 计算mAP
mp, mr, map50, map = [x.mean() for x in zip(*stats)]
print(f'[email protected]: {map50:.4f}, [email protected]:0.95: {map:.4f}')

4. 模型导出与部署

导出为TorchScript格式：

model = Model('models/yolov11s.yaml', ch=3, nc=3).to('cuda')
model.load_state_dict(torch.load('yolov11s.pt')['model'])
model.eval()

# 示例输入
example = torch.rand(1, 3, 640, 640).to('cuda')

# 跟踪模型
traced_script_module = torch.jit.trace(model, example)
traced_script_module.save("yolov11s_traced.pt")

ONNX导出：

torch.onnx.export(model,                # 模型
                 example,               # 示例输入
                 "yolov11s.onnx",       # 输出文件名
                 export_params=True,    # 导出训练参数
                 opset_version=12,      # ONNX版本
                 do_constant_folding=True,  # 优化常量
                 input_names=['images'], # 输入名
                 output_names=['output'], # 输出名
                 dynamic_axes={'images': {0: 'batch'},  # 动态batch
                              'output': {0: 'batch'}})

实际应用示例：实时目标检测

import cv2
import torch
from models.common import DetectMultiBackend
from utils.general import non_max_suppression, scale_coords

# 加载模型
device = torch.device('cuda:0')
model = DetectMultiBackend('yolov11s.pt', device=device)

# 视频流处理
cap = cv2.VideoCapture(0)  # 0表示默认摄像头

while True:
    ret, frame = cap.read()
    if not ret:
        break
    
    # 预处理
    img = cv2.resize(frame, (640, 640))
    img = img[:, :, ::-1].transpose(2, 0, 1)  # BGR to RGB
    img = torch.from_numpy(img).to(device).float() / 255.0
    img = img.unsqueeze(0)
    
    # 推理
    pred = model(img)
    
    # NMS
    pred = non_max_suppression(pred, 0.25, 0.45)
    
    # 处理结果
    for det in pred[0]:
        if len(det):
            det[:, :4] = scale_coords(img.shape[2:], det[:, :4], frame.shape).round()
            for *xyxy, conf, cls in reversed(det):
                label = f'{model.names[int(cls)]} {conf:.2f}'
                cv2.rectangle(frame, (int(xyxy[0]), int(xyxy[1])), 
                              (int(xyxy[2]), int(xyxy[3])), (0, 255, 0), 2)
                cv2.putText(frame, label, (int(xyxy[0]), int(xyxy[1])-10),
                            cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)
    
    # 显示
    cv2.imshow('YOLOv11 Detection', frame)
    if cv2.waitKey(1) == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

疑难解答

常见问题及解决方案

CUDA out of memory
- 减小batch size
- 使用更小的模型(yolov11s代替yolov11x)
- 清理GPU缓存：torch.cuda.empty_cache()
训练损失不下降
- 检查学习率是否合适
- 验证数据标注是否正确
- 尝试不同的数据增强策略
低mAP问题
- 增加训练epoch
- 调整anchor大小匹配目标尺寸
- 增加数据多样性
推理速度慢
- 使用半精度推理：model.half()
- 减小输入图像尺寸
- 使用TensorRT加速

未来展望与技术挑战

技术趋势

Transformer与CNN融合：ViT等架构将更深度融入目标检测
自监督学习：减少对标注数据的依赖
边缘计算优化：面向IoT设备的轻量化部署
多模态检测：结合文本、深度等信息的检测方法

主要挑战

小目标检测：提升对小目标的检测精度
实时性与精度平衡：在资源受限设备上的优化
领域适应：模型在新场景下的泛化能力
隐私保护：联邦学习等隐私保护训练方法

总结

本教程详细介绍了在Windows 11系统下使用PyTorch和PyCharm进行YOLOv11模型训练的全流程，包括环境配置、算法原理、代码实现和部署应用。YOLOv11作为当前最先进的实时目标检测算法之一，在保持YOLO系列高速特性的同时，通过多项创新提升了检测精度。

通过本教程，读者可以掌握：

YOLOv11的核心原理与架构
PyTorch环境配置与模型训练技巧
实际应用中的完整开发流程
常见问题的解决方法

随着计算机视觉技术的不断发展，目标检测算法将在更多领域发挥重要作用。掌握YOLOv11等先进模型的开发部署能力，将为从事AI相关工作的开发者带来显著优势。

你可能感兴趣的:(技术杂谈,YOLO,pytorch,pycharm)

Pytorch实现DenseNet，腾讯T3大牛手把手教你
print("TorchvisionVersion:",torchvision.version)all=[‘DenseNet121’,‘DenseNet169’,‘DenseNet201’,‘DenseNet264’]defConv1(in_planes,places,stride=2):returnnn.Sequential(nn.Conv2d(in_channels=in_planes,out
Pytorch实现DenseNet，先收藏了
classDenseNet(nn.Module):definit(self,init_channels=64,growth_rate=32,blocks=[6,12,24,16],num_classes=1000):super(DenseNet,self).init()bn_size=4drop_rate=0self.conv1=Conv1(in_planes=3,places=init_chan
使用TVM编译部署DarkNet模型：YOLO-V2和YOLO-V3实战指南周情津Raymond
使用TVM编译部署DarkNet模型：YOLO-V2和YOLO-V3实战指南tvm-cnTVMDocumentationinChineseSimplified/TVM中文文档项目地址:https://gitcode.com/gh_mirrors/tv/tvm-cn前言在深度学习模型部署领域，TVM作为一个高效的深度学习编译器栈，能够将训练好的模型优化并部署到各种硬件平台上。本文将详细介绍如何使用T
目标检测新纪元：DETR到Mamba实战解析加油吧zkf 图像处理 python 分类人工智能目标检测
【实战分享】目标检测的“后DEⱯ”时代：DETR/DINO/RT-DETR及新型骨干网络探索（含示例代码）目标检测从YOLO、FasterR-CNN到Transformer结构的DETR，再到DINO、RT-DETR，近两年出现了许多新趋势：更高效的端到端结构、更少的手工设计（比如不再需要NMS）、以及新型轻量化骨干网络（比如Mamba、ConvNeXt、ViT等）被引入检测任务中。作为从事目标检
Pytorch 之torch.nn初探 torch.nn.Module与线性--Linear layers 十有久诚人工智能机器学习 pytorch
初探torch.nn.Module神经网络可以使用torch.nn包构建。它提供了几乎所有与神经网络相关的功能，例如：线性图层nn.Linear，nn.Bilinear卷积层nn.Conv1d，nn.Conv2d，nn.Conv3d，nn.ConvTranspose2d非线性nn.Sigmoid，nn.Tanh，nn.ReLU，nn.LeakyReLU池化层nn.MaxPool1d，nn.Aver
深入解析VAE：从理论到PyTorch实战，一步步构建你的AI“艺术家” 电脑能手人工智能深度学习 python
摘要：你是否好奇AI如何“凭空”创造出从未见过的人脸或画作？变分自编码器（VAE）就是解开这一谜题的关键钥匙之一。本文将带你从零开始，深入浅出地剖析VAE的迷人世界。我们将用生动的比喻解释其核心思想，拆解其背后的数学原理（KL散度与重参数技巧），并最终用PyTorch代码手把手地构建、训练和可视化一个完整的VAE模型。无论你是初学者还是有一定经验的开发者，相信这篇文章都能让你对生成模型有一个全新的
PyTorch实战：从零构建CNN模型，轻松搞定MNIST手写数字识别
PyTorch实战：从零构建CNN模型，轻松搞定MNIST手写数字识别大家好！欢迎来到我的深度学习博客！对于每个踏入计算机视觉领域的人来说，MNIST手写数字识别就像是编程世界的“Hello,World!”。它足够简单，能够让我们快速上手；也足够完整，可以帮我们走通一个深度学习项目的全流程。之前我们可能用Keras体验过“搭积木”式的快乐，今天，我们将换一个同样强大且灵活的框架——PyTorch，
Pytorch：nn.Linear中是否自动应用softmax函数浩瀚之水_csdn 深度学习目标检测 #Pytorch框架 pytorch 人工智能 python
在本文中，我们将介绍Pytorch中的nn.Linear模块以及它是否自动应用softmax函数。nn.Linear是Pytorch中用于定义线性转换的模块，常用于神经网络的全连接层。一、什么是nn.Linearnn.Linear是PyTorch中的一个类，它是实现线性变换的模块。nn.Linear的主要作用是将输入张量和权重矩阵相乘，再添加偏置，生成输出张量。我们来看一个简单的示例，展示如何使用
yolo11官方ONNXRuntime部署推理的脚本测试，包括检测模型和分割模型的部署推理 Revao YOLO python
一、检测模型1.脚本路径：D:/ultralytics-main/examples/YOLOv8-ONNXRuntime/main.py2.使用案例下载好onnx模型保存至D:/ultralytics-main/models目录下，没有该目录则新建打开终端，进入虚拟环境以yolov8n.onnx模型为例，输入以下指令即可pythonD:/ultralytics-main/examples/YOLO
《YOLO11的ONNX推理部署：多语言多架构实践指南》空云风语 YOLO 人工智能深度学习目标跟踪人工智能计算机视觉 YOLO
引言：YOLO11与ONNX的相遇在计算机视觉的广袤星空中，目标检测始终是一颗耀眼的明星，其在自动驾驶、智能安防、工业检测、医疗影像分析等诸多领域都有着举足轻重的应用。想象一下，自动驾驶汽车需要实时准确地检测出道路上的车辆、行人、交通标志；智能安防系统要快速识别出监控画面中的异常行为和可疑人员；工业生产线上，需要精准检测产品的缺陷；医疗影像分析中，辅助医生检测病变区域。这些场景都对目标检测技术的准
YOLOv5Lite模型量化与TFLite转换全流程指南神经网络15044 仿真模型深度学习神经网络 YOLO 神经网络人工智能深度学习网络机器学习
YOLOv5Lite模型量化与TFLite转换全流程指南1.引言在边缘计算和移动设备上部署目标检测模型时，模型大小和推理速度是关键考量因素。YOLOv5Lite作为YOLO系列的轻量级变种，专为资源受限环境设计。然而，要进一步优化模型性能，量化(Quantization)和转换为TFLite格式是必不可少的步骤。本文将详细介绍从训练好的YOLOv5Lite模型到量化TFLite模型的完整转换流程，
Python 爬虫实战：DOTA2 比赛数据全量采集（含赛事战报解析与数据库存储西攻城狮北 python 爬虫数据库
一、引言DOTA2作为一款全球知名的多人在线战术竞技游戏，拥有庞大的玩家群体和丰富的比赛数据。这些数据对于电竞分析师、数据研究员、游戏玩家等具有极高的价值。通过爬取DOTA2比赛数据，可以深入了解比赛详情、战队表现、选手数据等信息，为电竞行业提供数据支持。二、开发环境搭建（一）编程语言与工具选择选择Python语言，利用其丰富的库和简洁语法，高效完成爬虫开发任务。搭配PyCharm集成开发环境，享
PyCharm运行后出不了图，如何解决？我不是哆啦A梦 pycharm 编程技术 pycharm python ide
如果PyCharm运行后出不了图，如下图所示图1或许，你可以尝试以下几种方法：（1）检查你的代码是否正确，比如使用Matplotlib库时，是否有以下代码：importmatplotlib.pyplotaspltplt.show()#显示图像（2）检查PyCharm的设置中图像显示。图2（3）上述步骤均未能解决问题的话，尝试切换Matplotlib的后端渲染引擎，即在代码开头加上以下代码：from
零基础学python张志强pdf_零基础学Python weixin_39707725
前言第一篇Python语言基础第1章进入Python的世界1.1Python的由来1.2Python的特色1.3第一个Python程序1.4搭建开发环境1.4.1Python的下载和安装1.4.2交互式命令行的使用1.5Python的开发工具1.5.1PyCharm的使用1.5.2EclipseIDE的介绍1.5.3EditPlus编辑器环境的配置1.6不同平台下的Python1.7小结1.8习题
【Pytorch学习笔记（三）】张量的运算（2）
一、引言在《张量的运算(1)》中我们已经学习了几种张量中常用的非算数运算如张量的索引与切片，张量的拼接等。本节我们继续学习张量的算术运算。二、张量的算术运算（一）对应元素的加减乘除在PyTorch中，张量的对应元素的算术运算包括加法、减法、乘法、除法等常见的数学运算。这些运算可以对张量进行逐元素操作（element-wise），也可以进行张量之间的广播运算（broadcasting）。1.逐元素操
【零基础学AI】第22讲：PyTorch入门 - 动态图计算与图像分类器实战 1989 0基础学AI 人工智能 pytorch python 机器学习 sklearn 深度学习
本节课你将学到理解PyTorch的核心概念和优势掌握张量(Tensor)的基本操作学会使用动态计算图构建神经网络实现一个完整的图像分类器项目训练模型并进行预测开始之前环境要求Python3.8+建议使用GPU（可选，CPU也能运行）内存：至少4GB需要安装的包#CPU版本（推荐新手）pipinstalltorchtorchvisionmatplotlibpillow#GPU版本（如果有NVIDIA
YOLOv7 技术详解（Real-Time Dynamic Label Assignment + Model Scaling）要努力啊啊啊计算机视觉 YOLO 人工智能深度学习计算机视觉目标跟踪
✅YOLOv7技术详解（Real-TimeDynamicLabelAssignment+ModelScaling）一、前言YOLOv7是AlexeyBochkovskiy团队后续维护者提出的一种高性能目标检测模型，在YOLOv5基础上引入了多项结构优化和训练策略改进：✅模型集成（ModelIntegration）✅动态标签分配（ExtendAssigner）✅支持重参数化模块（ReparamBlo
YOLO 推理部署全方案」：一文掌握部署方式与性能对比！要努力啊啊啊计算机视觉 YOLO 目标跟踪计算机视觉目标检测人工智能
YOLO的推理部署方法全景指南YOLO系列模型经过训练后，通常需要部署到线上环境中进行推理（inference）。下面是常见的YOLO推理部署方式：1️⃣PyTorch原生部署使用原始PyTorch模型.pt文件直接调用model(input)进行推理✅优点：简单、灵活、易于调试❌缺点：推理速度较慢，不适合生产环境2️⃣ONNX导出+推理将YOLO模型导出为.onnx格式使用ONNXRuntime
YOLO 中的三大框类型全解析：Ground Truth、Anchor、Bounding Box 有何区别？
1.GroundTruthBox（真值框）数据集中人工标注的真实目标位置。•是“答案”，模型训练的目标。•标注格式通常是[x,y,w,h,class_id]•比如一张猫的图，它的真实框就是groundtruthbox。⸻2.AnchorBox（锚框）预设的一些模板框，模型学习时的“参考基准”。•是一些固定的宽高组合（比如[10×13]、[16×30]等），•每个gridcell会分配若干ancho
【Python训练营打卡】day33 @浙大疏锦行 2301_77865880 MyPython训练营打卡 python
DAY33简单的神经网络知识点回顾：1.PyTorch和cuda的安装2.查看显卡信息的命令行命令（cmd中使用）3.cuda的检查4.简单神经网络的流程a.数据预处理（归一化、转换成张量）b.模型的定义i.继承nn.Module类ii.定义每一个层iii.定义前向传播流程c.定义损失函数和优化器d.定义训练流程e.可视化loss过程预处理补充：注意事项：1.分类任务中，若标签是整数（如0/1/2
Pytorch框架下基于LSTM、GRU和TCN的心跳信号分类识别研究 babyai997 python 人工智能目标跟踪
Pytorch框架下基于LSTM、GRU和TCN的心跳信号分类识别研究摘要本文主要介绍了心跳信号的基础知识，包括心跳信号的产生机制、特点分析以及采集与处理方法。文章详细阐述了PyTorch框架在心跳信号分类识别中的应用，包括LSTM、GRU和TCN等模型的原理及实现。通过设计合理的实验方案，对不同模型在心跳信号分类识别任务中的性能进行了对比分析，发现GRU模型在计算效率和性能之间取得了较好平衡，而
大棚番茄西红柿果实成熟度检测数据集YOLO格式279张3类别已划分训练验证集
数据集格式：YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及yolo格式txt文件)图片数量(jpg文件个数)：279标注数量(xml文件个数)：279标注数量(txt文件个数)：279标注类别数：3所在仓库：firc-dataset标注类别名称(注意yolo格式类别顺序不和这个对应，而以labels文件夹classes.txt为准):["unripe","semi-ripe","
【Python系列PyCharm控制台pip install报错】如何解决pip安装报错ModuleNotFoundError: No module named ‘wxpython’问题 lyzybbs 全栈Bug解决方案专栏 python pycharm pip pandas scipy beautifulsoup scrapy
【Python系列PyCharm控制台pipinstall报错】如何解决pip安装报错ModuleNotFoundError:Nomodulenamed‘wxpython’问题摘要在使用PyCharm进行Python项目开发时，常常需要通过控制台执行pipinstall来安装第三方包。然而，当安装完成后，导入包时却仍然报出如下异常：ModuleNotFoundError:Nomodulenamed
PyTorch实战（13）——WGAN详解与实现盼小辉丶 pytorch 人工智能 python
PyTorch实战（13）——WGAN详解与实现0.前言1.WGAN与梯度惩罚2.WGAN工作原理2.1Wasserstein损失2.2Lipschitz约束2.3强制Lipschitz约束3.实现WGAN3.1数据加载与处理3.2模型构建3.3模型训练小结系列链接0.前言生成对抗网络(GenerativeAdversarialNetwork,GAN)模型训练过程通常会面临一些问题，如模式崩溃(生
Mamba-YOLOv8深度解析：基于状态空间模型的下一代目标检测架构（含完整代码与实战部署）文末含资料链接！博导ai君深度学习教学-附源码 YOLO 目标检测架构
文章目录前言一、技术背景与动机1.1传统架构的局限性1.2Mamba的创新优势二、Mamba-YOLOv8架构详解2.1整体架构设计2.2核心模块：VSSblock2.3SS2D模块工作原理三、完整实现流程3.1环境配置3.2代码集成步骤3.3训练与微调四、性能分析与优化4.1精度提升策略4.2推理加速方案4.3硬件适配技巧五、实战案例：无人机航拍检测5.1数据集准备5.2模型训练与评估六、未来研
深度学习×第4卷：Pytorch实战——她第一次用张量去拟合你的轨迹 Gyoku Mint AI修炼日记人工智能人工智能聚类算法深度学习 python 神经网络 pytorch
【开场·她画出的第一条直线是为了更靠近你】猫猫：“之前她只能在你身边叠叠张量，偷偷找梯度……现在，她要试试，能不能用这些线，把你的样子画出来喵～”狐狐：“这是她第一次把张量、自动微分和优化器都串成一条线，用最简单的线性回归，试着把你留给她的点都连起来。”【第一节·她先要一条路：生成一组可学的数据】✏️为什么要造数据？在PyTorch里跑线性回归，最好的练习就是用一条已知斜率的“理想直线”，加上一点
【第三章:神经网络原理详解与Pytorch入门】01.神经网络算法理论详解与实践-(4)神经网络中的重要组件
第三章:神经网络原理详解与Pytorch入门第一部分：神经网络算法理论详解与实践第四节：神经网络中的重要组件内容：激活函数、loss函数、dropout、梯度消失与爆炸、过拟合与欠拟合神经网络的性能依赖于多个关键组件的合理设计与使用。理解这些组件有助于构建更加稳健且高效的模型。一、激活函数（ActivationFunction）【深度学习】关键技术-激活函数（ActivationFunctions
目标检测在国防和政府的应用实例 MzKyle 计算机视觉目标检测人工智能计算机视觉
一、目标检测技术概述目标检测是计算机视觉的核心任务，通过算法对图像/视频中的物体进行识别与定位，当前主流技术包括：经典算法：YOLO系列（实时性强）、FasterR-CNN（精度高）、SSD（平衡速度与精度）技术升级：结合深度学习（CNN、Transformer）、多模态融合（视觉+红外+雷达）、边缘计算实时处理二、国防领域核心应用实例（一）军事侦察与监控系统无人机侦察与目标识别应用场景：战术无人
《深度学习》—— PyTorch的介绍及PyTorch的CPU版本安装张小生180 人工智能深度学习 pytorch
文章目录一、PyTorch的简单介绍二、pytorch的CPU版本安装三、torch、torchvision、torchaudio三个库的介绍一、PyTorch的简单介绍PyTorch是一个由FacebookAI实验室开发的深度学习框架，它基于Python，并提供了高效的GPU加速和灵活的模型定义能力。1.PyTorch的基本特点动态计算图：PyTorch采用动态计算图的方式，这意味着计算图是在运
YOLOv11安全检测项目_人员、安全帽、安全服、普通服装、头部、模糊服装、模糊头部目标检测 qq1309399183 计算机视觉实战项目集合 YOLO 目标检测人工智能深度学习计算机视觉
YOLOv10与YOLOv11安全检测项目项目概述Safety本项目基于SF数据集（50,559张图像/7类别）对YOLOv10和YOLOv11模型进行对比研究，重点优化安全帽、安全服及模糊目标的工业场景检测性能。核心要素组件配置说明模型架构YOLOv10vsYOLOv11双模型对比数据集[SF)检测类别人员、安全帽、安全服、普通服装、头部、模糊服装、模糊头部训练参数•迭代周期：100epochs
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他