比赛&训练

深度学习torch之19种优化算法（optimizer）解析

Adam、AdamW、NAdam、RAdam以及SparseAdam等，通过对这些算法的公式和参数说明进行详细解析，博客旨在为机器学习工程师和研究人员提供清晰的理论指导，帮助读者选择合适的优化算法提升模型训练效率

@Mr_LiuYang·2025-02-19 23:06

DeepSeek 本地部署硬件配置全解析

而且它可“省钱”了，预训练费用还不到OpenAIGPT-4o模型的十

喜-喜·2025-02-19 23:34

GPU通信革命：跨平面网络效率提升300%的秘密武器

技术解析：突破AI算力瓶颈的底层创新1.技术背景：终结多平面网络CPU中转困境传统多平面网络中，跨平面GPU通信必须经过CPU内存拷贝，导致两大痛点：20-30%的通信带宽浪费在CPU中转环节大规模集群训练时

CodePatentMaster·2025-02-19 22:27

自然语言处理NLP 01语言转换&语言模型

FeatureExtraction）(1)词袋模型（BagofWords,BoW）(2)TF-IDF(3)词嵌入（WordEmbedding）3.模型输入（ModelInput）(1)序列编码(2)预训练模型输入

伊一大数据&人工智能学习日志·2025-02-19 22:56

常用的高性能计算工具有哪些

无论是模拟宇宙的起源、设计新型航空器，还是训练复杂的人工智能模型，HPC都扮演着不可或缺的角色。本文将深入探讨高性能计算的定义、其背后的强大工具，以及它们如何助力各领域的突破性发展。

这题有点难度·2025-02-19 21:24

只能说算法做题全凭运气

问题描述在一款多人游戏中，每局比赛需要多个玩家参与。如果发现两名玩家至少一起玩过两局比赛，则可以认为这两名玩家互为队友。

幼儿园口算大王·2025-02-19 21:52

ColD Fusion，分布式多任务微调的协同 “密码”

）直观解释2.大模型进化史：从Transformer到DeepSeek-R1的AI变革之路3.2W8000字深度剖析25种RAG变体：全网最全~没有之一知乎【柏企】公众号【柏企科技说】【柏企阅文】在预训练模型的基础上进行改进

·2025-02-19 20:46

蓝桥杯备赛经验帖

蓝桥杯备赛经验帖作者：blue时间：2025.2.1文章目录蓝桥杯备赛经验帖1.为什么有这篇文章2.赛制3.比赛流程4.如何准备5.其他建议6.一些感悟1.为什么有这篇文章笔者近期发现，观看我写的两道第十五届蓝桥杯题解的人数逐渐增多

Blue.ztl·2025-02-19 19:03

PyTorch与TensorFlow的对比：哪个框架更适合你的项目？

一、概述PyTorch和TensorFlow都是深度学习框架，它们为构建、训练和部署神经网络提供了强大的工具。尽管它们的最终目标相同，但其设计哲学和实现方式有所不同。

木觞清·2025-02-19 18:59

【nvidia】NCCL禁用P2P后果权衡

计算bound场景：模型参数量较小（如参数量未超出单卡显存容量，使用纯数据并行）或计算密度极高（如大batchsize下的矩阵运算）时，A100的计算能力（FP16/FP32算力）可能被充分利用，此时训练是计算

x66ccff·2025-02-19 18:28

YOLOv11算法与改进版YOLOv11算法对比：性能提升与优化

YOLOv11算法对比：性能提升与优化提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录YOLOv11算法与改进版YOLOv11算法对比：性能提升与优化前言一、YOLOv11算法概述二、训练步骤

m0_54717829·2025-02-19 16:17

生成式AI如何重塑计算机视觉：自监督学习与稀疏计算的革命

生成式AI（如Diffusion模型、自监督学习）的崛起，正在打破这一瓶颈——通过更高效的训练范式与计算架构，让机器学会“从无标注数据中看见世界”。（示意图：

ProgramHan·2025-02-19 16:46

吸烟YOLO数据集，COCO格式

抽烟吸烟数据集,标签txt，图像已经分好了测试集，验证集，训练集1️⃣可以直接导入YOLO进行训练，没有细分类，里面有的类，闲鱼9.9解君愁，明人不说暗话闲鱼搜索莓格米米私聊

鳄鱼的眼药水·2025-02-19 15:59

linux第八章 git连接本地仓库和gitee

博主主页：@ᰔᩚ.一怀明月ꦿ❤️‍专栏系列：线性代数，C初学者入门训练，题解C，C的使用文章，「初学」C++，linux座右铭：“不要等到什么都没有了，才下定决心去做”大家觉不错的话，就恳求大家点点关注

ᰔᩚ. 一怀明月ꦿ·2025-02-19 12:08

零基础被迫参加CTF比赛？CTF高频解题技巧与经验分享

CTF（CaptureTheFlag）比赛中的高频解题技巧通常涵盖了以下几类技术，涉及从逆向工程、二进制漏洞利用到Web安全、密码学等多个领域。

网络安全宇哥·2025-02-19 11:31

Boss直聘-AI行业岗位与薪资水平调研

直聘唯品会AI产品经理PM35-65K*14薪无智能产品规划与设计、数据分析、行业调研、推动项目、协同作业boss直聘京东智能机器人产品运营运营20-40K*15薪无智能客服机器人运营boss直聘字节跳动AI训练技术项目经理

姚瑞南·2025-02-19 10:23

AI架构师必知必会系列：强化学习在金融领域的应用

文章目录AI架构师必知必会系列：强化学习在金融领域的应用1.背景介绍1.1问题的由来1.2研究现状1.3研究意义1.4本文结构2.核心概念与联系1.强化学习交易系统的总体架构2.强化学习模型训练流程3.

AI天才研究院·2025-02-19 09:45

关于DeepSeek与ChatGPT等模型的原始训练数据

DeepSeek与ChatGPT等模型的原始训练数据是否一样训练数据的相似性与差异性相似性：DeepSeek和ChatGPT等模型在训练数据上有一定的重叠。

月光技术杂谈·2025-02-19 09:44

蓝耘服务器与DeepSeek的结合：引领智能化时代的新突破

AI目录蓝耘服务器与DeepSeek的结合：引领智能化时代的新突破一、蓝耘服务器的技术优势1、高性能计算能力2、可扩展性与高效存储3、绿色节能设计二、DeepSeek：智能算法的引擎1、高效的深度学习训练与推理

Lethehong·2025-02-19 08:36

Pytorch实现之粒子群优化算法在GAN中的应用

简介简介：主要是采用了粒子群优化（PSO）算法来优化GAN的一个训练。PSO是一种是一种基于种群的随机优化技术。这种优化技术是通过粒子群进行的，粒子群在每次迭代中都会更新自己。

这张生成的图像能检测吗·2025-02-19 07:30

DeepSeek自研AI芯片，AI算力新变革？

AI算力告急，成本掣肘发展当下，AI技术迅猛发展，从科研领域的复杂模型训练，到日常生活里智能语音助手的实时交互，算力成了决定AI发展的关键因素。作为大模型领域的后起之秀，DeepSeek对计算资源

·2025-02-19 07:19

Pytorch实现论文之一种基于扰动卷积层和梯度归一化的生成对抗网络

简介简介：提出了一种针对鉴别器的梯度惩罚方法和在鉴别器中采用扰动卷积，拟解决锐梯度空间引起的训练不稳定性问题和判别器的记忆问题。

这张生成的图像能检测吗·2025-02-19 06:51

Pytorch实现论文：利用推土机距离与梯度惩罚在ACGAN中训练。

在训练数据充足、分布均

这张生成的图像能检测吗·2025-02-19 06:51

Pytorch实现论文之三元DCGAN生成RGB图像用于红外图像着色生成

简介简介：采用了三次DCGAN单独生成单通道图像之后进行组成RGB图像放入鉴别器中检测，并在鉴别器和生成器的损失训练中采用梯度方法来提升或者降低权重。该方法将用于获得红外图像着色的生成。

这张生成的图像能检测吗·2025-02-19 05:50

微调alpaca-lora遇到的一些问题

目录一、环境简介二、混合精度训练Tensor相互计算会报错三、推理加载lora报错：SafetensorError:Errorwhiledeserializingheader:InvalidHeaderDeserialization

自学AI的鲨鱼儿·2025-02-19 05:42

LeetCode解决方案集：编程与面试技能提升

本文还有配套的精品资源，点击获取简介：LeetCode是一个编程训练平台，提供了大量编程题目，用于提升开发者的算法技能和面试准备。

徐子贡·2025-02-19 04:37

Python库 - transformers

它提供了大量的预训练模型，这些模型可以用于各种NLP任务，如文本分类、问答、翻译、摘要生成等。

司南锤·2025-02-19 03:28

conda更换环境版本（比如torch版本）

pytorch官网torch过往的版本创建新环境condacreate--namemyenvpython=3.8condaactivatemyenvconda虚拟环境中安装CUDA和CUDNN深度学习用显卡训练的时候

挨打且不服66·2025-02-19 03:57

流行编程语言全解析：优势、应用与短板

机器学习与人工智能：构建和训练模型。典型示例：OpenAI在很多人工智能项目中广泛使用Python，如GPT系列模型的研发。网络爬虫：轻松从网页

a小胡哦·2025-02-19 03:27

LLaMA系列大模型调研与整理-llama-alpaca-lora

alpaca-lora5.Chinese-LLaMA-Alpaca6.BELLE大模型综述ASurveyofLargeLanguageModels关键词：大模型，LLaMA，Alpaca，Lora，Belle，模型训练

AI大模型-大飞·2025-02-19 02:17

deepseek和ChatGPT 4o比较

后训练+RL/RLHFDeepSeekR1等推理模型是在通用模型的基础上进行“特训”（后训练+SFT/RL/RLHF），使其不仅知道得多还用得好

调皮的芋头·2025-02-19 02:46

采用分布式部署deepseek

分布式部署DeepSeek涉及使用多个计算节点来加速模型训练或提升推理效率。下面是一个基本的指南，帮助您了解如何进行分布式部署。

慧香一格·2025-02-19 02:14

《Ollama 与 DeepSeek 整合应用入门指南》一、二、三章

无需网络连接的数据隐私保护跨平台架构设计：支持Windows/macOS/Linux全平台模型管理引擎：自动化处理模型依赖与版本控制1.2DeepSeek模型特性多模态处理能力：文本生成、代码理解、数学推理中文优化架构：针对中文语料的特殊训练策略模型家族图谱

Allen-Steven·2025-02-19 01:05

【JAVA工程师从0开始学AI】，第四步：闭包与高阶函数——用Python的“魔法函数“重构Java思维

这里没有类的枷锁，函数既是武器又是盾牌，高阶函数组合出的"代码万花筒"，正是AI数据处理、模型训练的核心密码。本文将用J

架构默片·2025-02-19 01:03

腾讯云大模型知识引擎×DeepSeek赋能文旅

其核心优势包括：动态知识更新：突破传统大模型预训练数据的时间

繁依Fanyi·2025-02-19 00:55

huggingface/pytorch-image-models

huggingface/pytorch-image-models1.使用技巧1.1.训练指令单卡：pythontrain.py--pretrained--input-size3224224--mean000

GarryLau·2025-02-19 00:23

PyTorch `.pth` 转 ONNX：从模型训练到跨平台部署

PyTorch.pth转ONNX：从模型训练到跨平台部署在深度学习里，模型的格式决定了它的可用性。如果你是PyTorch用户，你可能熟悉.pth文件，它用于存储训练好的模型。

MO__YE·2025-02-18 23:46

什么是Scaling Laws（缩放定律）；DeepSeek的Scaling Laws

ScalingLaws（缩放定律）ScalingLaws（缩放定律）在人工智能尤其是深度学习领域具有重要意义，以下是相关介绍及示例：定义与内涵ScalingLaws主要描述了深度学习模型在规模（如模型参数数量、训练数据量

ZhangJiQun&MXP·2025-02-18 23:14

智能算力中心万卡GPU集群架构深度解析

超万卡集群缩短训练时间，加速迭代，助力市场趋势应对。在超万卡集群中，高效稳定地训练大模型面临双重挑战：确保集群算力最大化、网

科技互联人生·2025-02-18 23:13

PyTorch `.pth` 转 ONNX：从模型训练到跨平台部署

PyTorch.pth转ONNX：从模型训练到跨平台部署在深度学习里，模型的格式决定了它的可用性。如果你是PyTorch用户，你可能熟悉.pth文件，它用于存储训练好的模型。

MO__YE·2025-02-18 23:12

如何训练LLM“思考”（像o1和DeepSeek-R1一样, 高级推理模型解析

2024年9月，OpenAI发布了它的o1模型，该模型基于大规模强化学习训练，赋予了它“高级推理”能力。不幸的是，他们是如何做到这一点的细节从未被公开披露。

果冻人工智能·2025-02-18 22:06

商汤绝影端到端自动驾驶的迭代优化

自动驾驶,端到端,迭代优化,深度学习,感知,规划,控制,模型训练,数据增强,模型微调1.背景介绍随着人工智能和计算机视觉技术的飞速发展，自动驾驶汽车从科幻走进了现实。

AGI大模型与大数据研究院·2025-02-18 22:33

2. 从HuggingFace下载千问模型、数据、微调并运行

视频链接（1）3.从HuggingFace下载千问模型、数据、微调并运行（上）_哔哩哔哩_bilibili在本课程中，我们将带你下载并本地运行一个大模型，进行模型的微调训练等,视频播放量525、弹幕量0

ApiChain·2025-02-18 20:45

解剖DeepSeek四把刀，一场深到源码，大到行业，细到人心盛宴

他们公开的是经过蒸馏的“成品模型”，而非原始训练框架：就像给你组装好的乐高战舰，却藏起了设计图纸。这种半开放式开源既能吸引开发者构建生态，又

leluckys·2025-02-18 19:33

SFT（监督微调）和RLHF（基于人类反馈的强化学习）的区别

和RLHF（基于人类反馈的强化学习）的区别STF（SupervisedFine-Tuning）和RLHF（ReinforcementLearningfromHumanFeedback）是两种不同的模型训练方法

钟小宇·2025-02-18 18:11

【机器学习】半监督和无监督极限学习机SS-US-ELM附Matlab代码

2.2ELM的学习过程介绍ELM的学习算法和训练过程。三、半监督极限学习机（SS-ELM）3.1SS-ELM的提

默默科研仔·2025-02-18 18:09

DeepSeek为什么超越了OpenAI

其中，技术架构的突破最具革命性——DeepSeek创造性地采用"混合专家系统+领域预训练"架构，在特定领域的推理效率比OpenAI的GPT-4提升40%以上（根据2023年MLPerch基准测试）。

·2025-02-18 17:19

DeepSeek的训练与优化流程

DeepSeek的训练与优化流程一、数据工程体系1.多模态数据融合处理动态数据湖架构：实时摄入互联网文本、科学论文、专利文献、传感器数据等20+数据源日均处理原始数据量达1.2PB，支持200+文件格式自动解析智能清洗流水线

程序猿000001号·2025-02-18 17:01

机器学习基本篇

1基本概念机器学习，分为回归，分类，聚类，降维有监督学习回归，分类，有特征，有标签，进行训练，然后对新数据进行预测无监督学习聚类，降维。

胖胖的小肥猫·2025-02-18 16:51

deepseek本地部署后做微调训练实现智能对话的一些建议

在本地部署大模型后，进行微调和训练以实现智能对话，通常需要按照以下步骤操作。以下是详细的指导内容：1.准备数据集在微调大模型之前，需要准备适合的训练数据集。

慧香一格·2025-02-18 14:34

推荐频道

比赛&训练

深度学习torch之19种优化算法（optimizer）解析

DeepSeek 本地部署硬件配置全解析

GPU通信革命：跨平面网络效率提升300%的秘密武器

自然语言处理NLP 01语言转换&语言模型

常用的高性能计算工具有哪些

只能说算法做题全凭运气

ColD Fusion，分布式多任务微调的协同 “密码”

蓝桥杯备赛经验帖

PyTorch与TensorFlow的对比：哪个框架更适合你的项目？

【nvidia】NCCL禁用P2P后果权衡

YOLOv11算法与改进版YOLOv11算法对比：性能提升与优化

生成式AI如何重塑计算机视觉：自监督学习与稀疏计算的革命

吸烟YOLO数据集，COCO格式

linux第八章 git连接本地仓库和gitee

零基础被迫参加CTF比赛？CTF高频解题技巧与经验分享

Boss直聘-AI行业岗位与薪资水平调研

AI架构师必知必会系列：强化学习在金融领域的应用

关于DeepSeek与ChatGPT等模型的原始训练数据

蓝耘服务器与DeepSeek的结合：引领智能化时代的新突破

Pytorch实现之粒子群优化算法在GAN中的应用

DeepSeek自研AI芯片，AI算力新变革？

Pytorch实现论文之一种基于扰动卷积层和梯度归一化的生成对抗网络

Pytorch实现论文：利用推土机距离与梯度惩罚在ACGAN中训练。

Pytorch实现论文之三元DCGAN生成RGB图像用于红外图像着色生成

微调alpaca-lora遇到的一些问题

LeetCode解决方案集：编程与面试技能提升

Python库 - transformers

conda更换环境版本（比如torch版本）

流行编程语言全解析：优势、应用与短板

LLaMA系列大模型调研与整理-llama-alpaca-lora

deepseek和ChatGPT 4o比较

采用分布式部署deepseek

《Ollama 与 DeepSeek 整合应用入门指南》一、二、三章

【JAVA工程师从0开始学AI】，第四步：闭包与高阶函数——用Python的“魔法函数“重构Java思维

腾讯云大模型知识引擎×DeepSeek赋能文旅

huggingface/pytorch-image-models

PyTorch `.pth` 转 ONNX：从模型训练到跨平台部署

什么是Scaling Laws（缩放定律）；DeepSeek的Scaling Laws

智能算力中心万卡GPU集群架构深度解析

PyTorch `.pth` 转 ONNX：从模型训练到跨平台部署

如何训练LLM“思考”（像o1和DeepSeek-R1一样, 高级推理模型解析

商汤绝影端到端自动驾驶的迭代优化

2. 从HuggingFace下载千问模型、数据、微调并运行

解剖DeepSeek四把刀，一场深到源码，大到行业，细到人心盛宴

SFT（监督微调）和RLHF（基于人类反馈的强化学习）的区别

【机器学习】半监督和无监督极限学习机SS-US-ELM附Matlab代码

DeepSeek为什么超越了OpenAI

DeepSeek的训练与优化流程

机器学习基本篇

deepseek本地部署后做微调训练实现智能对话的一些建议