GPU训练第5页

数据增强：扩充数据集提升模型泛化能力

一个泛化能力强的模型能够在未见数据上表现良好，而过拟合的模型则会在训练数据上表现出色，但在新数据上表现糟糕。

AI天才研究院·2025-03-19 23:06

数据增强：扩充数据集，提升模型的鲁棒性

数据增强：扩充数据集，提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是训练模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。

AI天才研究院·2025-03-19 23:05

NLP高频面试题（三）——普通RNN的梯度消失和梯度爆炸问题

普通RNN（循环神经网络）的梯度消失和梯度爆炸问题是指在训练深层或长序列的RNN模型时出现的两种典型问题：一、梯度消失（VanishingGradient）梯度消失是指在反向传播过程中，梯度逐层传播时变得越来越小

Chaos_Wang_·2025-03-19 23:34

vscode连接远程服务器docker里的容器--使用remote ssh

欢仔要学习·2025-03-19 22:28

使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发

安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架，提供了丰富的工具和库来构建和训练各种深度

UwoiGit·2025-03-19 22:25

MMScan数据集：首个最大的多模态3D场景数据集，包含层次化的语言标注

数据集的建立，不仅推动了3D场景理解的研究进展，还为训练和评估多模态3D感知模型提供了宝贵的资源。

·2025-03-19 21:28

深度革命：ResNet 如何用 “残差连接“ 颠覆深度学习

更令人震撼的是，ResNet将神经网络的深度推至152层，彻底打破了"深层网络无法训练"的魔咒。这场革命的核心，正是一个简单

安意诚Matrix·2025-03-19 20:46

Deepseek的本地化部署软件工具包

选择模型版本参数规模硬件要求（最低）适用场景1.5B/7B8GB内存，无专用GPU文本处理、简单问答14B16GB内存+12GB显存代码生成、逻辑推理32B/70B24GB显存+32GB内存企业级复杂任务执行命令

哈拉少12·2025-03-19 20:14

芯片：CPU和GPU有什么区别？

CPU（中央处理器）和GPU（图形处理单元）是计算机系统中两种非常重要的处理器，它们各自有不同的设计理念、架构特点以及应用领域。

InnoLink_1024·2025-03-19 19:07

A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第9部分——应用

应用尽管预训练为大型语言模型（LLMs）赋予了强大的基础能力，但在部署于专业领域时，LLMs仍经常遇到持续的限制，包括上下文长度受限、容易产生幻觉（hallucination）、推理能力欠佳和固有的偏见

王金-太想进步了·2025-03-19 19:31

Yolov8训练自己的数据集(脱离ultralytics库)

比如在使用v8的时候需要安装ultralytics库，然后再调用YOLO进行训练或者预测，那么就有这几个问题：问题1：安装了ultralytics库后如何使用YOLO呢

爱吃肉的鹏·2025-03-19 17:22

迁移学习基础知识

简介使用迁移学习的优势：1、能够快速的训练出一个理想的结果2、当数据集较小时也能训练出理想的效果。注意：在使用别人预训练的参数模型时，要注意别人的预处理方式。

zhooooooou·2025-03-19 16:44

迁移学习入门

迁移学习1迁移学习的概念预训练模型定义:简单来说别人训练好的模型。

EmbodiedTech·2025-03-19 16:14

使用LoRA微调LLaMA3

步骤一：环境搭建安装必要的Python包pipinstalltransformersdatasetstorch配置GPU环境确保你的环境中配置了CUDA和cuDNN，并验证GPU是否可用。

想胖的壮壮·2025-03-19 16:12

nvidia_uvm 被占用，nvidia-smi 卡死

系统可以识别到多块NVIDIAGPU，且驱动模块已加载，但nvidia_uvm被占用，nvidia-smi卡死，通常是由于以下原因导致：可能原因GPU资源被占用某些进程正在使用NVIDIA驱动，导致模块无法卸载

guganly·2025-03-19 15:08

用户行为路径分析（Google Analytics数据挖掘）

目录用户行为路径分析（GoogleAnalytics数据挖掘）1.引言2.项目背景与意义2.1用户行为路径的重要性2.2GoogleAnalytics数据概述2.3数据规模与挑战3.数据集生成与介绍4.数据预处理与GPU

闲人编程·2025-03-19 14:00

Dify知识库构建流程及示例

3.向量化（Embedding）嵌入模型：调用预训练

cqbelt·2025-03-19 14:54

MNIST数据集&手写数字识别

它提供了一种基于数据流图的编程模型，用于构建和训练机器学习模型。TensorFlow的核心概念是张量（Tensor）和流图（Graph）。

Zoro｜·2025-03-19 13:18

Codeforces Round 995 (Div. 3)

在这第iii天，如果Monocarp准备训练，那么他将完成aia_iai题，同样的，如果Stereocarp也在这天准备训练，那么他将完成bib_ibi题。

polarours·2025-03-19 13:17

医疗影像联邦学习可解释性算法研究

本研究以跨机构医疗影像协作场景为核心，系统性探讨联邦学习框架下可解释性算法的创新路径，重点解决医疗AI模型在分布式训练中的透明度缺失问题。

智能计算研究中心·2025-03-19 11:36

【Python】测试数据生成工具 --- Faker

Faker的应用不仅限于测试，它还广泛应用于数据分析、机器学习训练集的准备以及任何需要大量样本数据的场景。Faker安装前提：已安装python、pip安装命令如下：pipinst

·2025-03-19 11:00

算力未来演进与多场景创新

从技术架构层面来看，异构计算通过整合CPU、GPU、FPGA等多元芯片实现性能跃升，边缘计算则借助分布式节点降低时延并提升响应效率，而量子计算在特定领域的指数级加速潜力已进入验证阶段。

智能计算研究中心·2025-03-19 11:06

融合AMD与NVIDIA GPU集群的MLOps：异构计算环境中的分布式训练架构实践

随着模型规模不断扩大而预算约束日益严格，2-3年更换一次GPU的传统方式已不具可持续性。

·2025-03-19 11:59

深度学习框架PyTorch——从入门到精通（4）数据转换

转换（Transforms）很多时候，数据并不总是以训练机器学习算法所需的最终处理形式出现。所以我们需要使用变换对数据进行一些处理，使其适合训练。

Fansv587·2025-03-19 11:01

深度学习框架PyTorch——从入门到精通（5）构建神经网络

构建神经网络获取训练设备定义类模型层nn.Flattennn.Linearnn.ReLUnn.Sequentialnn.Softmax模型参数补充说明argmax神经网络是由一些层或者模块组成的，这些层和模块会对数据进行各种操作

Fansv587·2025-03-19 11:58

大语言模型的训练数据清洗策略

目录大语言模型的训练数据清洗策略1.数据去重与标准化问题解决方案示例代码（Python实现数据去重）：2.过滤有害内容问题解决方案示例代码（基于关键词过滤有害内容）：3.纠正数据不均衡问题解决方案示例代码

gs80140·2025-03-19 10:23

Megatron-LM训练框架和Deepspeed训练框架最主要的异同和优劣是什么

核心异同点并行策略Megatron-LM核心：以张量并行（TensorParallelism）和流水线并行（PipelineParallelism）为主，结合数据并行。张量并行通过切分模型层（如注意力头、MLP块）到不同设备，利用NVLink高速通信提升效率。流水线并行将不同层分配到不同设备，通过P2P通信协调。DeepSpeed核心：ZeRO优化技术（ZeroRedundancyOptimize

强化学习曾小健·2025-03-19 09:15

OctoTools：一个具有复杂推理可扩展工具的智体框架

现有方法使用外部工具增强大语言模型(LLM)，但仅限于专业领域、有限的工具类型或需要额外的训练数据。本文的OctoTools，是一个无需训练、用户友好且易于扩展的

三谷秋水·2025-03-19 09:09

Windows 图形显示驱动开发-WDDM 3.0功能- IOMMU DMA 重新映射（一）

概述直到WDDM3.0，Dxgkrnl仅支持通过1:1物理重新映射实现IOMMU隔离，这意味着GPU访问的逻辑页被转换为相同的物理页码。

程序员王马·2025-03-19 07:58

Linux中部署DeepSeek R1

DeepSeek-R1本地部署硬件需求表模型规模GPU需求CPU需求内存需求存储需求备注1.5B-GTX16504GB（可选）四核i5/Ryzen3000+16GBDDR450GBSSD需4-bit量化

Java探索者 °·2025-03-19 07:26

深度学习框架PyTorch——从入门到精通（5）自动微分

使用torch.autograd自动微分张量、函数和计算图计算梯度禁用梯度追踪关于计算图的更多信息张量梯度和雅可比乘积在训练神经网络时，最常用的算法是反向传播。

Fansv587·2025-03-19 06:20

标签转换脚本 - VOC格式转COCO格式，即voc2coco，xml2json 附VOC及COCO标签格式详解

专栏目录：YOLO训练/写作脚本目录一览|涉及标签转换、数据扩充、热力图、感受野、精度曲线、数量统计等近百个脚本文件专栏地址：YOLO训练/写作脚本——丰富文章内容，增强实验信服力，助力发文！！！

Limiiiing·2025-03-19 04:57

标签转换脚本 - VOC格式转YOLO格式，即voc2yolo，xml2txt 附VOC及YOLO标签格式详解

专栏目录：YOLO训练/写作脚本目录一览|涉及标签转换、数据扩充、热力图、感受野、精度曲线、数量统计等近百个脚本文件专栏地址：YOLO训练/写作脚本——丰富文章内容，增强实验信服力，助力发文！！！

Limiiiing·2025-03-19 04:26

自建智能算力中心 vs 第三方算力租赁：AI企业的算力博弈与最优解

从ChatGPT到DeepSeek，从自动驾驶到智能医疗，AI模型的训练和推理需求呈现指数级增长。在这场技术革命中，算力已成为企业竞争的“命脉”。

·2025-03-19 03:50

深入GPU渲染流水管线：从顶点到像素的微观世界

现代图形硬件的架构解密与优化实践一、渲染流水线全景解析1.经典渲染管线阶段划分应用阶段几何阶段光栅化阶段像素处理阶段输出合并阶段2.现代GPU架构演进SIMT架构特性：NVIDIASM(StreamingMultiprocessor

晴空了无痕·2025-03-19 01:00

RAG 在多模态数据处理中的应用探索：结合图像与文本生成

目录引言多模态数据处理的挑战与需求数据异质性与融合难题多样化应用场景的需求RAG在图像与文本生成中的应用架构图像检索与文本生成协同跨模态特征融合与生成关键技术与实现细节图像特征提取与表示文本检索与语义理解跨模态生成模型训练应用案例分析智能设计辅助医疗影像报告生成结论引言随着信息技术的飞速发展

hy098543·2025-03-18 22:40

如何计算一个7B的模型训练需要的参数量以及训练时需要的计算资源

计算理论过程见：transformer中多头注意力机制的参数量是多少？1.模型参数量的计算7B参数模型的总参数量是70亿（7billion）。这些参数主要分布在以下几个部分：Transformer层：多头注意力机制（Multi-HeadAttention）前馈神经网络（Feed-ForwardNetwork）嵌入层（EmbeddingLayer）：词嵌入（TokenEmbeddings）位置编码（

yxx122345·2025-03-18 20:59

程序员必看！DeepSeek全栈开发实战指南：从代码生成到性能优化

这两项技术突破对程序员群体意义重大：通信效率飞跃：DeepEP通过NVLink优化实现GPU间158GB/s传输速度，后端开发者训练大模型时可节省60%集群资源推理性能突破：R1模型在H

AI创享派·2025-03-18 20:59

MM-RAIT：多模态检索增强生成（RAG）的认知革命

多模态检索增强生成（RAG）领域迎来了一项里程碑式的突破——MM-RAIT框架通过“评估-训练”双轮驱动，显著提升了主流视觉语言模型的RAG性能，增幅达27%至34%。

花生糖@·2025-03-18 20:58

五、AIGC大模型_05模型的vLLM部署与LangChain调用

0、概述要搭建一个大模型应用服务，通常需要包含以下五层结构，即：基础环境、模型层、推理层、对外接口、外挂应用在了解了模型的微调训练之后，本文将以vLLM、OpenAI、LangChain为例，介绍大模型的推理部署以及对外接口开放调用

学不会lostfound·2025-03-18 19:20

PyTorch 深度学习实战（17）：Asynchronous Advantage Actor-Critic (A3C) 算法与并行训练

本文将介绍强化学习领域的重要里程碑——AsynchronousAdvantageActor-Critic(A3C)算法，并展示如何利用PyTorch实现并行化训练来加速学习过程。

进取星辰·2025-03-18 19:17

自建 DeepSeek 时代已来，联网搜索如何高效实现

基于7B/13B参数量的模型在常规GPU服务器上即可获得商业级响应效果，配合Higress开源AI网关的增强能力，开发者可快速构建具备实时联网搜索能力的智能问答系统。

·2025-03-18 18:38

DeepSeek 3FS 与 JuiceFS：架构与特性比较

在AI业务中，企业需要处理大量的文本、图像、视频等非结构化数据，还需要应对数据量的爆炸式增长，分布式文件系统因此成为AI训练的关键存储技术。

·2025-03-18 18:07

DeepSeek 训练数据模板生成指南

DeepSeek训练数据模板生成指南（一次生成多条高质量数据集）一、核心数据格式规范1.基础结构（JSONL格式）每条数据需包含prompt（输入指令）和completion（期望输出）两个核心字段，采用单行

He.Tech·2025-03-18 18:39

yolov4

V4贡献：亲民政策，单GPU就能训练的非常好，接下来很多小模块都是这个出发点两大核心方法，从数据层面和网络设计层面来进行改善消融实验，感觉能做的都让他给做了，这工作量不轻全部实验都是单GPU完成，不用太担心设备了

zzh-·2025-03-18 16:28

【pytorch(cuda)】基于DQN算法的无人机三维城市空间航线规划（Python代码实现）

本文目录如下：目录⛳️赠与读者1概述一、研究背景与意义二、DQN算法概述三、基于DQN的无人机三维航线规划方法1.环境建模2.状态与动作定义3.奖励函数设计4.深度神经网络训练5.航线规划四、研究挑战与展望

wlz249·2025-03-18 16:28

【保姆级视频教程（一）】YOLOv12环境配置：从零到一，手把手保姆级教程！| 小白也能轻松玩转目标检测！

文章目录1.FlashAttentionWindows端WHL包下载1.1简介1.2下载链接1.3国内镜像站1.4安装方法2.NVIDIAGPU计算能力概述2.1简介2.2计算能力版本与GPU型号对照表

一只云卷云舒·2025-03-18 16:56

yolov8的第一次实验报告

datasets]数据集大小:[2.68Gb]数据集描述:[数据集主要分两个类别：zdjy_ld,zdjy_gd]注释：占道经营流动，占道经营固定3.模型配置3.1基础配置·模型类型:YOLOv8·预训练模型

算法宇宙·2025-03-18 16:55

李开复：AI 2.0 时代的机遇

然而，深度学习模型的训练成本高、数据依赖性强、可解释性差等问题仍然制约着AI技术的进一步发展。李开复先生在《AI2.0时代的机遇》

AGI大模型与大数据研究院·2025-03-18 15:52

YOLOv8n-OBB使用C#在windows10进行部署（CPU）

1.训练YOLOv8-OBB模型1.1数据集制作所用标注工具：X-AnyLabeling下载链接：https://github.com/CVHub520/X-AnyLabeling/releases/download

cd_Ww777·2025-03-18 15:21

推荐频道

GPU训练