渐进增大训练第6页

华为的云端训练算力与迭代效率

华为云、云端训练、算力、迭代效率、人工智能、深度学习、模型训练、分布式训练、优化算法1.背景介绍人工智能（AI）技术近年来发展迅速，深度学习作为其核心驱动力，在图像识别、自然语言处理、语音识别等领域取得了突破性进展

AI大模型应用之禅·2025-02-20 05:34

使用Yuan 2.0与LangChain构建智能聊天应用：完整指南

相比之前的Yuan1.0，Yuan2.0使用了更广泛的高质量预训练数据，并通过指令微调数据集增强了模型的语义理解、数学推理、编程知识等能力。

scaFHIO·2025-02-20 05:33

训练与优化

训练与优化损失函数与反向传播损失函数能够衡量神经网络输出与目标值之间的误差，同时为反向传播提供依据，计算梯度来优化网络中的参数。torch.nn.L1Loss计算所有预测值与真实值之间的绝对差。

钰见梵星·2025-02-20 04:23

Pytorch实现之利用特征分布的差异来指导GAN的训练

简介简介：FIDGAN通过将FID损失引入GAN的训练过程，显著提升了生成图像的质量。其核心思想是利用特征分布的差异来指导生成器的训练，同时通过使用轻量级的MobileNet-v3提高了计算效率。

这张生成的图像能检测吗·2025-02-20 04:47

【深度学习】学习率调度策略

较大的学习率意味着在每次参数更新时，模型会进行更大幅度的调整，而较小的学习率则意味着细致的、渐进的调整。适当的学习率可以帮助模型跳出局部最优解。

黑白交界·2025-02-20 02:37

使用LangChain与Clarifai模型进行交互

在现代AI应用开发中，Clarifai提供了一个完整的AI生命周期管理平台，包括数据探索、数据标注、模型训练、评估和推理。本文将探讨如何使用LangChain库与Clarifai的模型进行交互。

vaidfl·2025-02-20 02:06

【深度学习pytorch-93】Transformer 相比 RNN 的优势

这意味着，在训练

华东算法王·2025-02-20 02:04

吐血整理！权重持久化方案优化，让你的模型性能飙升

权重持久化方案优化，让你的模型性能飙升引言你是否在做深度学习项目时，遭遇过模型训练结果无法有效保存，导致之前的努力付诸东流的痛苦？又或者在模型权重持久化时，发现保存和加载的速度极慢，严重影响项目进度？

盼达思文体科创·2025-02-20 01:57

训练时数据增强策略调整，让模型性能飙升

训练时数据增强策略调整，让模型性能飙升引言你是否遇到过模型训练效果不佳，明明投入了大量数据，可模型的准确率、泛化能力就是提不上去？其实啊，很多时候问题就出在数据增强策略上。

盼达思文体科创·2025-02-20 01:26

模型版本回滚机制支持，让你的模型训练不再走弯路

模型版本回滚机制支持，让你的模型训练不再走弯路引言你是否遇到过模型训练过程中，因为一个小失误导致之前的努力白费，只能从头再来的糟心事？为什么辛辛苦苦训练出来的模型，突然效果变差，却找不到问题所在？

盼达思文体科创·2025-02-20 01:26

吐血整理！模型热加载能力大比拼，谁才是真正王者？

当你训练出了一个新的、性能更好的模型时，如果不能进行热加

盼达思文体科创·2025-02-20 01:56

吐血整理！过拟合抑制策略调整方法大揭秘，让模型性能飙升

过拟合抑制策略调整方法大揭秘，让模型性能飙升引言你是否遇到过模型在训练集上表现完美，可一到测试集就“原形毕露”的糟心情况？为啥模型训练得好好的，实际应用时却差强人意呢？这其实就是过拟合在捣乱！

盼达思文体科创·2025-02-20 01:56

梯度累积和优化器配置差异，让模型训练效果天差地别！

梯度累积和优化器配置差异，让模型训练效果天差地别！引言你是否还在为模型训练效果不佳而苦恼？明明花费了大量时间和精力，模型的性能却始终无法达到预期。其实，很多时候问题可能就出在梯度累积和优化器配置上。

盼达思文体科创·2025-02-20 01:26

还在为模型权重共享效率发愁？模型权重共享策略优化让效果飙升

模型权重共享策略优化让效果飙升引言你是否在进行模型训练时，常常被漫长的训练时间和巨大的计算资源消耗搞得焦头烂额？为什么明明使用了模型权重共享策略，却还是达不到理想的训练效果和效率？

盼达思文体科创·2025-02-20 01:26

模型保存、训练与验证

模型保存、训练与验证网络模型的保存与读取在PyTorch中，模型的保存与加载有两种主要方式：保存&加载完整模型（包括网络结构和参数）只保存&加载模型参数（推荐方式）可以直接跳过看最后几行。

钰见梵星·2025-02-20 00:21

python中的深度学习框架TensorFlow 和 PyTorch 有什么区别？

这使得TensorFlow在大规模分布式训练和部署时具有优势，但调试和动态修改模型时可能不够灵活。功能全面：TensorFlow提

大懒猫软件·2025-02-20 00:51

人工智能与机器学习入门：决策树应用

尝试使用决策树模型来训练数据，并进行test数据集的测试。什么是决策树决策树，简单来讲可以认为是一个大的ifelse判断树，有了决策树后，测试集中的数据便可以使用该决策树进行判断了。

·2025-02-20 00:24

深度学习torch之19种优化算法（optimizer）解析

Adam、AdamW、NAdam、RAdam以及SparseAdam等，通过对这些算法的公式和参数说明进行详细解析，博客旨在为机器学习工程师和研究人员提供清晰的理论指导，帮助读者选择合适的优化算法提升模型训练效率

@Mr_LiuYang·2025-02-19 23:06

DeepSeek 本地部署硬件配置全解析

而且它可“省钱”了，预训练费用还不到OpenAIGPT-4o模型的十

喜-喜·2025-02-19 23:34

GPU通信革命：跨平面网络效率提升300%的秘密武器

技术解析：突破AI算力瓶颈的底层创新1.技术背景：终结多平面网络CPU中转困境传统多平面网络中，跨平面GPU通信必须经过CPU内存拷贝，导致两大痛点：20-30%的通信带宽浪费在CPU中转环节大规模集群训练时

CodePatentMaster·2025-02-19 22:27

自然语言处理NLP 01语言转换&语言模型

FeatureExtraction）(1)词袋模型（BagofWords,BoW）(2)TF-IDF(3)词嵌入（WordEmbedding）3.模型输入（ModelInput）(1)序列编码(2)预训练模型输入

伊一大数据&人工智能学习日志·2025-02-19 22:56

常用的高性能计算工具有哪些

无论是模拟宇宙的起源、设计新型航空器，还是训练复杂的人工智能模型，HPC都扮演着不可或缺的角色。本文将深入探讨高性能计算的定义、其背后的强大工具，以及它们如何助力各领域的突破性发展。

这题有点难度·2025-02-19 21:24

ColD Fusion，分布式多任务微调的协同 “密码”

）直观解释2.大模型进化史：从Transformer到DeepSeek-R1的AI变革之路3.2W8000字深度剖析25种RAG变体：全网最全~没有之一知乎【柏企】公众号【柏企科技说】【柏企阅文】在预训练模型的基础上进行改进

·2025-02-19 20:46

PyTorch与TensorFlow的对比：哪个框架更适合你的项目？

一、概述PyTorch和TensorFlow都是深度学习框架，它们为构建、训练和部署神经网络提供了强大的工具。尽管它们的最终目标相同，但其设计哲学和实现方式有所不同。

木觞清·2025-02-19 18:59

【nvidia】NCCL禁用P2P后果权衡

计算bound场景：模型参数量较小（如参数量未超出单卡显存容量，使用纯数据并行）或计算密度极高（如大batchsize下的矩阵运算）时，A100的计算能力（FP16/FP32算力）可能被充分利用，此时训练是计算

x66ccff·2025-02-19 18:28

YOLOv11算法与改进版YOLOv11算法对比：性能提升与优化

YOLOv11算法对比：性能提升与优化提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录YOLOv11算法与改进版YOLOv11算法对比：性能提升与优化前言一、YOLOv11算法概述二、训练步骤

m0_54717829·2025-02-19 16:17

生成式AI如何重塑计算机视觉：自监督学习与稀疏计算的革命

生成式AI（如Diffusion模型、自监督学习）的崛起，正在打破这一瓶颈——通过更高效的训练范式与计算架构，让机器学会“从无标注数据中看见世界”。（示意图：

ProgramHan·2025-02-19 16:46

吸烟YOLO数据集，COCO格式

抽烟吸烟数据集,标签txt，图像已经分好了测试集，验证集，训练集1️⃣可以直接导入YOLO进行训练，没有细分类，里面有的类，闲鱼9.9解君愁，明人不说暗话闲鱼搜索莓格米米私聊

鳄鱼的眼药水·2025-02-19 15:59

Chameleon跨端框架——壹个理想主义团队的开源作品

下面正文开始~背景解决方案原理久经考验生产应用举例易用性好多态协议学习成本低渐进式接入业内对比后期规划理想主义历经近20个月打磨，滴滴跨端方案chameleon终于开源了github.com/didi/

weixin_34049032·2025-02-19 14:56

探索 Open WebUI：功能全面的开源交互平台

目录探索OpenWebUI：功能全面的开源交互平台轻松部署兼容多API集成精细权限和用户组管理跨设备响应式设计移动渐进式Web应用（PWA）全面支持Markdown和LaTeX免提语音/视频通话模型构建器原生

gs80140·2025-02-19 14:52

linux第八章 git连接本地仓库和gitee

博主主页：@ᰔᩚ.一怀明月ꦿ❤️‍专栏系列：线性代数，C初学者入门训练，题解C，C的使用文章，「初学」C++，linux座右铭：“不要等到什么都没有了，才下定决心去做”大家觉不错的话，就恳求大家点点关注

ᰔᩚ. 一怀明月ꦿ·2025-02-19 12:08

Boss直聘-AI行业岗位与薪资水平调研

直聘唯品会AI产品经理PM35-65K*14薪无智能产品规划与设计、数据分析、行业调研、推动项目、协同作业boss直聘京东智能机器人产品运营运营20-40K*15薪无智能客服机器人运营boss直聘字节跳动AI训练技术项目经理

姚瑞南·2025-02-19 10:23

AI架构师必知必会系列：强化学习在金融领域的应用

文章目录AI架构师必知必会系列：强化学习在金融领域的应用1.背景介绍1.1问题的由来1.2研究现状1.3研究意义1.4本文结构2.核心概念与联系1.强化学习交易系统的总体架构2.强化学习模型训练流程3.

AI天才研究院·2025-02-19 09:45

关于DeepSeek与ChatGPT等模型的原始训练数据

DeepSeek与ChatGPT等模型的原始训练数据是否一样训练数据的相似性与差异性相似性：DeepSeek和ChatGPT等模型在训练数据上有一定的重叠。

月光技术杂谈·2025-02-19 09:44

蓝耘服务器与DeepSeek的结合：引领智能化时代的新突破

AI目录蓝耘服务器与DeepSeek的结合：引领智能化时代的新突破一、蓝耘服务器的技术优势1、高性能计算能力2、可扩展性与高效存储3、绿色节能设计二、DeepSeek：智能算法的引擎1、高效的深度学习训练与推理

Lethehong·2025-02-19 08:36

Pytorch实现之粒子群优化算法在GAN中的应用

简介简介：主要是采用了粒子群优化（PSO）算法来优化GAN的一个训练。PSO是一种是一种基于种群的随机优化技术。这种优化技术是通过粒子群进行的，粒子群在每次迭代中都会更新自己。

这张生成的图像能检测吗·2025-02-19 07:30

DeepSeek自研AI芯片，AI算力新变革？

AI算力告急，成本掣肘发展当下，AI技术迅猛发展，从科研领域的复杂模型训练，到日常生活里智能语音助手的实时交互，算力成了决定AI发展的关键因素。作为大模型领域的后起之秀，DeepSeek对计算资源

·2025-02-19 07:19

Pytorch实现论文之一种基于扰动卷积层和梯度归一化的生成对抗网络

简介简介：提出了一种针对鉴别器的梯度惩罚方法和在鉴别器中采用扰动卷积，拟解决锐梯度空间引起的训练不稳定性问题和判别器的记忆问题。

这张生成的图像能检测吗·2025-02-19 06:51

Pytorch实现论文：利用推土机距离与梯度惩罚在ACGAN中训练。

在训练数据充足、分布均

这张生成的图像能检测吗·2025-02-19 06:51

Pytorch实现论文之三元DCGAN生成RGB图像用于红外图像着色生成

简介简介：采用了三次DCGAN单独生成单通道图像之后进行组成RGB图像放入鉴别器中检测，并在鉴别器和生成器的损失训练中采用梯度方法来提升或者降低权重。该方法将用于获得红外图像着色的生成。

这张生成的图像能检测吗·2025-02-19 05:50

【数据结构】清华出版社-刘小晶、朱蓉《数据结构渐进实践指导》第一章(个人手打版)

文章目录1_1_SqList.cpp1_1_LinkList.cpp1_1_SqList.cpp#include#include#definesql_size100//线性表初始分配空间的容量#definekuo10//线性表扩展空间的量#defineERROR0#defineOK1#defineOVERFLOW-2typedefintElemType;//数据元素的抽象数据类型，一般为intty

shixiexunnie·2025-02-19 05:18

微调alpaca-lora遇到的一些问题

目录一、环境简介二、混合精度训练Tensor相互计算会报错三、推理加载lora报错：SafetensorError:Errorwhiledeserializingheader:InvalidHeaderDeserialization

自学AI的鲨鱼儿·2025-02-19 05:42

LeetCode解决方案集：编程与面试技能提升

本文还有配套的精品资源，点击获取简介：LeetCode是一个编程训练平台，提供了大量编程题目，用于提升开发者的算法技能和面试准备。

徐子贡·2025-02-19 04:37

Python库 - transformers

它提供了大量的预训练模型，这些模型可以用于各种NLP任务，如文本分类、问答、翻译、摘要生成等。

司南锤·2025-02-19 03:28

conda更换环境版本（比如torch版本）

pytorch官网torch过往的版本创建新环境condacreate--namemyenvpython=3.8condaactivatemyenvconda虚拟环境中安装CUDA和CUDNN深度学习用显卡训练的时候

挨打且不服66·2025-02-19 03:57

流行编程语言全解析：优势、应用与短板

机器学习与人工智能：构建和训练模型。典型示例：OpenAI在很多人工智能项目中广泛使用Python，如GPT系列模型的研发。网络爬虫：轻松从网页

a小胡哦·2025-02-19 03:27

LLaMA系列大模型调研与整理-llama-alpaca-lora

alpaca-lora5.Chinese-LLaMA-Alpaca6.BELLE大模型综述ASurveyofLargeLanguageModels关键词：大模型，LLaMA，Alpaca，Lora，Belle，模型训练

AI大模型-大飞·2025-02-19 02:17

deepseek和ChatGPT 4o比较

后训练+RL/RLHFDeepSeekR1等推理模型是在通用模型的基础上进行“特训”（后训练+SFT/RL/RLHF），使其不仅知道得多还用得好

调皮的芋头·2025-02-19 02:46

采用分布式部署deepseek

分布式部署DeepSeek涉及使用多个计算节点来加速模型训练或提升推理效率。下面是一个基本的指南，帮助您了解如何进行分布式部署。

慧香一格·2025-02-19 02:14

《Ollama 与 DeepSeek 整合应用入门指南》一、二、三章

无需网络连接的数据隐私保护跨平台架构设计：支持Windows/macOS/Linux全平台模型管理引擎：自动化处理模型依赖与版本控制1.2DeepSeek模型特性多模态处理能力：文本生成、代码理解、数学推理中文优化架构：针对中文语料的特殊训练策略模型家族图谱

Allen-Steven·2025-02-19 01:05

推荐频道

渐进增大训练

华为的云端训练算力与迭代效率

使用Yuan 2.0与LangChain构建智能聊天应用：完整指南

训练与优化

Pytorch实现之利用特征分布的差异来指导GAN的训练

【深度学习】学习率调度策略

使用LangChain与Clarifai模型进行交互

【深度学习pytorch-93】Transformer 相比 RNN 的优势

吐血整理！权重持久化方案优化，让你的模型性能飙升

训练时数据增强策略调整，让模型性能飙升

模型版本回滚机制支持，让你的模型训练不再走弯路

吐血整理！模型热加载能力大比拼，谁才是真正王者？

吐血整理！过拟合抑制策略调整方法大揭秘，让模型性能飙升

梯度累积和优化器配置差异，让模型训练效果天差地别！

还在为模型权重共享效率发愁？模型权重共享策略优化让效果飙升

模型保存、训练与验证

python中的深度学习框架TensorFlow 和 PyTorch 有什么区别？

人工智能与机器学习入门：决策树应用

深度学习torch之19种优化算法（optimizer）解析

DeepSeek 本地部署硬件配置全解析

GPU通信革命：跨平面网络效率提升300%的秘密武器

自然语言处理NLP 01语言转换&语言模型

常用的高性能计算工具有哪些

ColD Fusion，分布式多任务微调的协同 “密码”

PyTorch与TensorFlow的对比：哪个框架更适合你的项目？

【nvidia】NCCL禁用P2P后果权衡

YOLOv11算法与改进版YOLOv11算法对比：性能提升与优化

生成式AI如何重塑计算机视觉：自监督学习与稀疏计算的革命

吸烟YOLO数据集，COCO格式

Chameleon跨端框架——壹个理想主义团队的开源作品

探索 Open WebUI：功能全面的开源交互平台

linux第八章 git连接本地仓库和gitee

Boss直聘-AI行业岗位与薪资水平调研

AI架构师必知必会系列：强化学习在金融领域的应用

关于DeepSeek与ChatGPT等模型的原始训练数据

蓝耘服务器与DeepSeek的结合：引领智能化时代的新突破

Pytorch实现之粒子群优化算法在GAN中的应用

DeepSeek自研AI芯片，AI算力新变革？

Pytorch实现论文之一种基于扰动卷积层和梯度归一化的生成对抗网络

Pytorch实现论文：利用推土机距离与梯度惩罚在ACGAN中训练。

Pytorch实现论文之三元DCGAN生成RGB图像用于红外图像着色生成

【数据结构】清华出版社-刘小晶、朱蓉《数据结构渐进实践指导》第一章(个人手打版)

微调alpaca-lora遇到的一些问题

LeetCode解决方案集：编程与面试技能提升

Python库 - transformers

conda更换环境版本（比如torch版本）

流行编程语言全解析：优势、应用与短板

LLaMA系列大模型调研与整理-llama-alpaca-lora

deepseek和ChatGPT 4o比较

采用分布式部署deepseek

《Ollama 与 DeepSeek 整合应用入门指南》一、二、三章