模型训练

模型训练与部署注意事项篇---resize

图像大小的影响在YOLOv系列模型的训练和推理部署过程中，图像大小的选择是影响模型性能（精度、速度、泛化能力）的关键因素之一。两者的关系既相互关联，又存在一定的灵活性，具体可从以下几个方面详细分析：一、核心关系：训练与推理图像大小的“基准一致性”YOLOv模型（如YOLOv5、v7、v8等）的训练和推理图像大小通常以**“基准尺寸”**为核心关联，即训练时设定的图像尺寸会作为模型设计的基础，而推理

Atticus-Orion·2025-07-12 12:56

【机器学习笔记Ⅰ】9 特征缩放

特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？

巴伦是只猫·2025-07-12 05:30

AI技术全景图鉴：从模型开发到落地部署的全链路拆解

从数据管理、模型训练到应用落地，再到算力调度和智能运维，一个完整的AI架构需要涵盖多个层面，确保AI技术能够高效、稳定地运行。

大模型玩家·2025-07-11 19:30

基于LIDC-IDRI肺结节肺癌数据集的人工智能深度学习分类良性和恶性肺癌（Python 全代码）全流程解析（二）

基于LIDC-IDRI肺结节肺癌数据集的人工智能深度学习分类良性和恶性肺癌（Python全代码）全流程解析（二）1环境配置和数据集预处理1.1环境配置1.1数据集预处理2深度学习模型训练和评估2.1深度学习模型训练

·2025-07-11 13:44

【人工智能面经第五期：模型训练与优化核心面试深度问答】

作者：“码上有前”文章简介：人工智能面经欢迎小伙伴们点赞、收藏⭐、留言模型训练与优化核心面试深度问答摘要围绕模型训练与优化的训练技巧（正则化、迁移学习）和数据工程（数据增强、标注质量）展开，通过20个关键问题

码上有前·2025-07-11 09:48

AI模型训练新范式：基于同态加密的隐私保护方案

AI模型训练新范式：基于同态加密的隐私保护方案技术解析关键词同态加密（HomomorphicEncryption）、隐私保护机器学习（PPML）、全同态加密（FHE）、安全多方计算（MPC）、加密数据训练摘要本报告系统解析基于同态加密的

AIGC应用创新大全·2025-07-11 06:27

YOLOv5基础 | 万字长文带你深度解析yolov5s.yaml配置文件

配置文件yolov5s.yaml在YOLOv5模型训练过程中发挥着至关重要的作用，属于初学者必知必会的文件！

小哥谈·2025-07-11 06:56

万字长文带你搞懂yolov5和yolov8以及目标检测相关面试

一、与yoloV4相比，yoloV5的改进输入端：在模型训练阶段，使用了Mosaic数据增强、自适应锚框计算、自适应图片缩放基准网络：使用了FOCUS结构和CSP结构Neck网络：在Backbone和最后的

起个别名·2025-07-11 05:24

从数据集视角看——大语言模型（LLMs）的训练、微调和推理

1.大语言模型训练的整体框架大语言模型的训练是一个复杂的过程，涉及数据准备、模型架构、优化策略和推理部署。

爱看烟花的码农·2025-07-10 22:38

【机器学习&深度学习】为什么分类任务中类别比例应接近 1:1？

2.1⚠模型容易“偏科”2.2精确率、召回率失真2.3模型训练失衡，梯度方向偏移三、现实案例中的“灾难性后果”四、如何应对类别不平衡问题？

一叶千舟·2025-07-10 20:24

【动手学深度学习】4.10 实战Kaggle比赛：预测房价

目录4.10实战Kaggle比赛：预测房价1）数据预处理2）模型定义与训练3）模型评估与预测4）模型训练与预测提交5）示例超参数（可调）4.10实战Kaggle比赛：预测房价数据来源：Kaggle房价预测比赛

XiaoJ1234567·2025-07-10 18:07

人工智能开源的大模型训练微调框架LLaMA-Factory

LLaMA-Factory是一个开源的大模型训练微调框架，具有模块化设计和多种高效的训练方法，能够满足不同用户的需求。用户可以通过命令行或Web界面进行操作，实现个性化的语言模型微调。

·2025-07-10 04:37

基于大模型的急性出血坏死性胰腺炎预测技术方案

目录一、算法实现伪代码1.数据预处理与特征工程2.大模型训练（以Transformer为例）3.实时预测与动态调整二、模块流程图1.术前预测流程2.术中动态决策流程3.术后护理流程三、系统集成方案1.系统架构图

LCG元·2025-07-10 02:22

【深度学习第六期深度学习中的归一化与正则化技术：原理、实践与应用】

详细阐述它们的基本原理，包括如何调整数据分布、控制模型复杂度等；通过丰富的实例和对应代码，展示在不同网络架构中这些技术的具体实现方式，以及对模型训练和性能的影响；同时，对比分析各项技术的特点和

码上有前·2025-07-09 23:08

深度神经网络课程设计：从理论到实践

学生将通过源代码示例学习从网络架构设计、数据预处理到模型训练与评估的完整流程，并掌握深度学习的基本概念、组件及技巧。

Vita Libre·2025-07-09 22:04

人工智能-基础篇-18-什么是RAG(检索增强生成：知识库+向量化技术+大语言模型LLM整合的技术框架)

知识幻觉：当问题超出模型训练数据范围时，LLM

weisian151·2025-07-09 20:47

一文读懂 AI 模型训练流程

一文读懂AI模型训练流程在当今数字化时代，AI技术发展得如火如荼，广泛应用于各个领域，而这背后离不开AI模型的训练。AI模型训练流程就像是一场精心策划的“智慧锻造之旅”，每一步都至关重要。

AI赋能·2025-07-09 10:42

03 数据可视化的世界非常广阔，除了已提到的类型，还有许多更细分或前沿的可视化形式。

学习曲线（LearningCurve）用途：分析模型训练过程

晨曦543210·2025-07-09 07:17

AI初学者如何对大模型进行微调？——零基础保姆级实战指南

仅需8GB显存，三步完成个人专属大模型训练四步实战：从环境配置到模型发布步骤1：云端环境搭建（10分钟）推荐使用阿里魔塔ModelScope免费GPU资源：#注册后执行环境初始化pip3install-

·2025-07-09 02:15

Python实现基于POA-CNN-LSTM-Attention鹈鹕优化算法（POA）优化卷积长短期记忆神经网络融合注意力机制进行多变量回归预测的详细项目实例

POA-CNN-LSTM-Attentikon鹈鹕优化算法（POA）优化卷积长短期记忆神经网络融合注意力机制进行她变量回归预测她详细项目实例...1项目背景介绍...1项目目标她意义...1提升她变量回归预测精度...2优化模型训练效率

nantangyuxi·2025-07-08 16:14

一文读懂 Sigmoid 与 Hard Sigmoid 激活函数：从原理到量化部署

在神经网络训练与部署中，激活函数扮演着关键角色，不仅影响模型训练过程，也直接决定了模型部署到实际设备后的性能表现。

·2025-07-08 16:42

基于大模型的颅前窝底脑膜瘤诊疗全流程研究报告

研究背景与目的1.2国内外研究现状1.3研究意义与创新点二、颅前窝底脑膜瘤概述2.1定义与分类2.2发病机制与病因2.3临床表现与症状三、大模型预测原理与方法3.1大模型介绍3.2数据收集与预处理3.3模型训练与验证四

LCG元·2025-07-08 14:00

生成式人工智能实战 | 条件生成对抗网络（conditional Generative Adversarial Network, cGAN）

生成式人工智能实战|条件生成对抗网络0.前言1.条件生成对抗网络1.1GAN基础回顾1.2cGAN核心思想2.cGAN网络架构2.1数学原理2.2网络架构3.实现cGAN3.1环境准备与数据加载3.2模型构建3.3模型训练

盼小辉丶·2025-07-08 14:59

量子计算+AI芯片：光子计算如何重构神经网络硬件生态

点击跳转到网站量子计算+AI芯片：光子计算如何重构神经网络硬件生态——2025年超异构计算架构下的万亿参数模型训练革命产业拐点：英伟达BlackwellUltra发布光互连版GPU，IBM量子处理器突破

·2025-07-08 06:59

深度模型训练，加速数据读取遇到显卡跑不满的问题

实测在pytorch的dataloader中使用prefetch_factor参数的时候，如果数据在机械硬盘上显卡始终是跑不满的，瓶颈在数据预加载速度上，当数据放在固态硬盘的时候就可以跑满。问题排查过程：一直在跑模型，但是数据量比较大，之前有段时间还是比较头疼显卡跑不满的。后来直接用钞能力，加了内存条，将数据缓存后一次性读到内存中终于可以跑满了，然后后面就一直没管这个了，唯一的缺点就是每次开始训练

不是吧这都有重名·2025-07-07 18:30

大模型训练与微调（1）——优化器选择总结

大模型训练与微调（1）——优化器选择总结一、AdamW优化器：成熟稳定的主流选择二、Lion优化器：谷歌提出的高效替代方案三、其他优化器的补充应用四、优化器选择趋势与实验对比五、未来发展方向当前最新的大模型在优化器的选择上

John_今天务必休息一天·2025-07-07 10:32

深度学习实验：GPU加速，突破性能瓶颈

本文将探讨如何利用GPU加速深度学习实验,突破性能瓶颈,提高模型训练和推理的效率。2.核心概念与联系2.1GPU架构GPU(图形处理器)最初是为了加速图形渲染而设计的,但由于其

AI天才研究院·2025-07-06 20:57

Day36 复习日

目录一、对之前的信贷项目，利用神经网络训练下二、尝试进入nn.Module中，查看他的方法模型训练与评估相关参数管理相关模块管理相关设备相关钩子函数相关一、对之前的信贷项目，利用神经网络训练下importtorchimporttorch.nnasnnimporttorch.optimasoptimfromsklearn.model_selectionimporttrain_test_splitfr

cylat·2025-07-06 03:20

YOLO 中的三大框类型全解析：Ground Truth、Anchor、Bounding Box 有何区别？

•是“答案”，模型训练的目标。•标注格式通常是[x,y,w,h,class_id]•比如一张猫的图，它的真实框就是groundtruthbox。

·2025-07-05 16:28

基于大模型预测胸椎管狭窄诊疗全流程的研究报告

疾病定义与分类2.2病因与发病机制2.3流行病学特征三、大模型技术原理与应用现状3.1大模型基本原理3.2在医疗领域的应用案例3.3用于胸椎管狭窄预测的优势四、术前大模型预测4.1预测指标与数据收集4.2模型训练与验证

LCG元·2025-07-05 15:25

PyTorch实战（13）——WGAN详解与实现

详解与实现0.前言1.WGAN与梯度惩罚2.WGAN工作原理2.1Wasserstein损失2.2Lipschitz约束2.3强制Lipschitz约束3.实现WGAN3.1数据加载与处理3.2模型构建3.3模型训练小结系列链接

盼小辉丶·2025-07-05 09:38

Mamba-YOLOv8深度解析：基于状态空间模型的下一代目标检测架构（含完整代码与实战部署）文末含资料链接！

VSSblock2.3SS2D模块工作原理三、完整实现流程3.1环境配置3.2代码集成步骤3.3训练与微调四、性能分析与优化4.1精度提升策略4.2推理加速方案4.3硬件适配技巧五、实战案例：无人机航拍检测5.1数据集准备5.2模型训练与评估六

博导ai君·2025-07-05 06:18

【AI大模型面试八股文】大模型训练中如何应对灾难性遗忘问题？

目录✅面试回答模板：一、什么是灾难性遗忘？举个通俗的例子：二、灾难性遗忘是怎么发生的？常见触发情境：三、我们为什么要关注灾难性遗忘？四、主流解决方案汇总✅1.固定部分参数（FeatureExtraction）✅2.正则化策略（Regularization）✅3.回放机制（Rehearsal/Replay）✅4.参数隔离（ParameterIsolation）✅5.使用提示学习（PromptLear

一叶千舟·2025-07-05 00:17

AI大模型探索之路-训练篇15：大语言模型预训练之全量参数微调

系列篇章AI大模型探索之路-训练篇1：大语言模型微调基础认知AI大模型探索之路-训练篇2：大语言模型预训练基础认知AI大模型探索之路-训练篇3：大语言模型全景解读AI大模型探索之路-训练篇4：大语言模型训练数据集概览

寻道AI小兵·2025-07-04 22:03

破译AI黑箱：如何用20行Python理解ChatGPT？

文章目录一、核心概念：大模型本质二、代码逐行解析（以线性回归为例）三、关键概念详解四、与大模型的本质联系五、大模型训练核心思想六、如何扩展成真实大模型七、总结：AI训练的本质一、核心概念：大模型本质大模型

Ven%·2025-07-04 08:56

利用人名语言分类案例演示RNN、LSTM和GRU的区别（基于PyTorch）

数据预处理模块详解2.1定义字符集和语言类别2.2读取数据2.3人名转换为one-hot编码张量2.4自定义数据集类2.5数据加载器三、模型定义模块详解3.1RNN模型3.2LSTM模型3.3GRU模型四、模型训练与测试模块详解

.30-06Springfield·2025-07-04 00:29

YOLOv8 轴承缺陷检测使用YOLOv8进行训练、评估和可视化预测结果包含1440张图片的轴承缺陷检测数据集 YOLO格式或XML格式

可以直接用于模型训练。YOLOv8轴承缺陷检测importosimporttorchfromIPy

OICQQ67658008·2025-07-03 23:59

用sklearn库中的算法对数据集进行训练和auc评估（个人学习笔记）

题目：运用已给数据集进行模型训练，使用逻辑回归、决策树、随机森林和AdaBoost几个算法进行训练，并打印各个算法训练后的auc评价指标。

ZD困困困·2025-07-03 17:16

深入剖析AI大模型：关于模型训练

今天说的是模型训练，在AI模型里，它是点亮智慧星辰的关键引擎。

chilavert318·2025-07-03 08:06

深度学习学习经验——卷积神经网络（CNN）

卷积神经网络的完整实现项目示例项目目标1.加载数据2.卷积层：图像的特征探测器2.1第一个卷积层3.激活函数：增加非线性4.池化层：信息压缩器5.多层卷积和池化：逐层提取更高层次的特征6.全连接层：分类器7.模型训练和测试完整的项目示例代码总结卷积神经网络

Linductor·2025-07-03 07:02

【硬核拆解】英伟达Blackwell芯片架构如何重构AI算力边界？

点击跳转到网站一、Blackwell诞生的算力危机（2025现状）graphTDA[2025年AI算力需求]-->B[千亿参数模型训练能耗>20GWh]A-->C[10万亿参数模型涌现]A-->D[传统架构内存墙

HeartException·2025-07-02 23:29

华为认证二选一：物联网 VS 人工智能，你的赛道在哪里？

聚焦大模型训练、部署与应用（如昇腾AI解

博睿谷IT99_·2025-07-02 21:42

java opencv 数字识别算法_[机器学习]基于OpenCV实现最简单的数字识别

1.学习分类器根据训练样本，选取模型训练产生数字分类器。这里的样本可以是通用的数字样本库(如NIST等)，也可以是针对应用场景而制作的专门训练样本。

后期小雨·2025-07-02 11:28

基于llama-factory+ollama+vllm加速大模型训推生产

目录一、名称解释1.1产品定义二、llama-factory工具使用2.1基础镜像2.2、模型训练2.2.1以Qwen2.5-7B-Instruct为例

zwxu_·2025-07-02 04:39

Python时域信号特征提取技术要点

使用Python中的NumPy、Pandas和SciPy库可以帮助我们计算这些特征，并为机器学习模型训练准备数据。本文将介绍如何

路怜涯·2025-07-01 19:32

考取华为HCIE-AI有什么用？

主要是为了培养和认证掌握人工智能解决方案架构、设计与应用知识，具备大模型业务场景分析、大模型训练与微调、模型推理部署能力的专家级人才。一、HCIE-AI：专家级能力的权威认证HC

博睿谷IT99_·2025-07-01 18:59

MCP模型上下文协议：AI人工智能模型训练的自动化调参

MCP模型上下文协议：AI人工智能模型训练的自动化调参关键词：MCP模型、自动化调参、AI训练、超参数优化、上下文协议、机器学习、深度学习摘要：本文深入探讨MCP模型上下文协议在AI模型训练自动化调参中的应用

AI天才研究院·2025-07-01 01:40

从零开始：Python实现语音识别的完整教程_副本

我们将从基础概念讲起，逐步深入到实际代码实现，涵盖音频处理、特征提取、模型训练等关键环节，最终构建一个完整的语音识别系统。无论你是初学者还是有一定经验的开发者，都能从本教程中获得实用的知识和技能。

AIGC应用创新大全·2025-06-30 23:55

用Pytorch训练手写签名模型并进行签名识别

整体思路收集至少两个人的手写签名图片，每个人至少20张使用Pytorch进行模型训练使用Flask搭建Web服务使用Html/JavaScript实现前端调用进行签名识别项目结构signature-systemdatatrainuser001001

TBM矩阵·2025-06-30 17:14

遥感影像数据处理-大图滑窗切分为小图

大的达到几万x几万像素，而图像分割算法模型在训练中尺寸适中，比如256x256，512x512，1024x1024等等，如果直接将遥感影像的原图输入模型中进行训练，大概率会提示内存和显存不足，因此针对遥感影像的模型训练

GIS潮流·2025-06-30 15:28

推荐频道