CNN训练准确度低第34页

【深度学习pytorch-93】Transformer 相比 RNN 的优势

这意味着，在训练

华东算法王·2025-02-20 02:04

吐血整理！权重持久化方案优化，让你的模型性能飙升

权重持久化方案优化，让你的模型性能飙升引言你是否在做深度学习项目时，遭遇过模型训练结果无法有效保存，导致之前的努力付诸东流的痛苦？又或者在模型权重持久化时，发现保存和加载的速度极慢，严重影响项目进度？

盼达思文体科创·2025-02-20 01:57

训练时数据增强策略调整，让模型性能飙升

训练时数据增强策略调整，让模型性能飙升引言你是否遇到过模型训练效果不佳，明明投入了大量数据，可模型的准确率、泛化能力就是提不上去？其实啊，很多时候问题就出在数据增强策略上。

盼达思文体科创·2025-02-20 01:26

模型版本回滚机制支持，让你的模型训练不再走弯路

模型版本回滚机制支持，让你的模型训练不再走弯路引言你是否遇到过模型训练过程中，因为一个小失误导致之前的努力白费，只能从头再来的糟心事？为什么辛辛苦苦训练出来的模型，突然效果变差，却找不到问题所在？

盼达思文体科创·2025-02-20 01:26

吐血整理！模型热加载能力大比拼，谁才是真正王者？

当你训练出了一个新的、性能更好的模型时，如果不能进行热加

盼达思文体科创·2025-02-20 01:56

吐血整理！过拟合抑制策略调整方法大揭秘，让模型性能飙升

过拟合抑制策略调整方法大揭秘，让模型性能飙升引言你是否遇到过模型在训练集上表现完美，可一到测试集就“原形毕露”的糟心情况？为啥模型训练得好好的，实际应用时却差强人意呢？这其实就是过拟合在捣乱！

盼达思文体科创·2025-02-20 01:56

梯度累积和优化器配置差异，让模型训练效果天差地别！

梯度累积和优化器配置差异，让模型训练效果天差地别！引言你是否还在为模型训练效果不佳而苦恼？明明花费了大量时间和精力，模型的性能却始终无法达到预期。其实，很多时候问题可能就出在梯度累积和优化器配置上。

盼达思文体科创·2025-02-20 01:26

还在为模型权重共享效率发愁？模型权重共享策略优化让效果飙升

模型权重共享策略优化让效果飙升引言你是否在进行模型训练时，常常被漫长的训练时间和巨大的计算资源消耗搞得焦头烂额？为什么明明使用了模型权重共享策略，却还是达不到理想的训练效果和效率？

盼达思文体科创·2025-02-20 01:26

模型保存、训练与验证

模型保存、训练与验证网络模型的保存与读取在PyTorch中，模型的保存与加载有两种主要方式：保存&加载完整模型（包括网络结构和参数）只保存&加载模型参数（推荐方式）可以直接跳过看最后几行。

钰见梵星·2025-02-20 00:21

python中的深度学习框架TensorFlow 和 PyTorch 有什么区别？

这使得TensorFlow在大规模分布式训练和部署时具有优势，但调试和动态修改模型时可能不够灵活。功能全面：TensorFlow提

大懒猫软件·2025-02-20 00:51

人工智能与机器学习入门：决策树应用

尝试使用决策树模型来训练数据，并进行test数据集的测试。什么是决策树决策树，简单来讲可以认为是一个大的ifelse判断树，有了决策树后，测试集中的数据便可以使用该决策树进行判断了。

·2025-02-20 00:24

深度学习torch之19种优化算法（optimizer）解析

Adam、AdamW、NAdam、RAdam以及SparseAdam等，通过对这些算法的公式和参数说明进行详细解析，博客旨在为机器学习工程师和研究人员提供清晰的理论指导，帮助读者选择合适的优化算法提升模型训练效率

@Mr_LiuYang·2025-02-19 23:06

DeepSeek 本地部署硬件配置全解析

而且它可“省钱”了，预训练费用还不到OpenAIGPT-4o模型的十

喜-喜·2025-02-19 23:34

GPU通信革命：跨平面网络效率提升300%的秘密武器

技术解析：突破AI算力瓶颈的底层创新1.技术背景：终结多平面网络CPU中转困境传统多平面网络中，跨平面GPU通信必须经过CPU内存拷贝，导致两大痛点：20-30%的通信带宽浪费在CPU中转环节大规模集群训练时

CodePatentMaster·2025-02-19 22:27

自然语言处理NLP 01语言转换&语言模型

FeatureExtraction）(1)词袋模型（BagofWords,BoW）(2)TF-IDF(3)词嵌入（WordEmbedding）3.模型输入（ModelInput）(1)序列编码(2)预训练模型输入

伊一大数据&人工智能学习日志·2025-02-19 22:56

C++ 中的运算符优先级

下表将按运算符优先级从高到低列出各个运算符，具有较高优先级的运算符出现在表格的上面，具有较低优先级的

Sirius·Black·2025-02-19 21:54

常用的高性能计算工具有哪些

无论是模拟宇宙的起源、设计新型航空器，还是训练复杂的人工智能模型，HPC都扮演着不可或缺的角色。本文将深入探讨高性能计算的定义、其背后的强大工具，以及它们如何助力各领域的突破性发展。

这题有点难度·2025-02-19 21:24

从代码到专利：如何用自注意力机制实现高效序列转换？——深度解析Google的Transformer架构

在传统的序列转换任务（如机器翻译、语音识别等）中，循环神经网络（RNN）和卷积神经网络（CNN）是常用的模型架构。然而，这些模型存在以下问题：

CodePatentMaster·2025-02-19 21:53

破局与重构：水务企业数字化转型路径探索

一、水务行业数字化发展趋势随着国家新型智慧城市建设的推进，供水市场存在市场趋于饱和、市场过度分散、集约化程度低、传统供排水

·2025-02-19 20:48

《DeepSeek模型压缩：在高效与性能间寻平衡》

量化：用低精度表达，换存储空间与计算效率量化技术是DeepSeek模型压缩的关键手段之一，它将模型中的高精度浮点数参数转换为低比特数的整数或定点数，从而实现存储空间的大幅缩减与计算速度的提升。从

·2025-02-19 20:47

ColD Fusion，分布式多任务微调的协同 “密码”

）直观解释2.大模型进化史：从Transformer到DeepSeek-R1的AI变革之路3.2W8000字深度剖析25种RAG变体：全网最全~没有之一知乎【柏企】公众号【柏企科技说】【柏企阅文】在预训练模型的基础上进行改进

·2025-02-19 20:46

【大模型】量化、剪枝、蒸馏

下面是每种技术的详细介绍：1.量化（Quantization）量化是将浮点数表示的模型参数（通常是32位浮点数）转换为低精度表示（如8位整数）。

油泼辣子多加·2025-02-19 18:02

PyTorch与TensorFlow的对比：哪个框架更适合你的项目？

一、概述PyTorch和TensorFlow都是深度学习框架，它们为构建、训练和部署神经网络提供了强大的工具。尽管它们的最终目标相同，但其设计哲学和实现方式有所不同。

木觞清·2025-02-19 18:59

【nvidia】NCCL禁用P2P后果权衡

计算bound场景：模型参数量较小（如参数量未超出单卡显存容量，使用纯数据并行）或计算密度极高（如大batchsize下的矩阵运算）时，A100的计算能力（FP16/FP32算力）可能被充分利用，此时训练是计算

x66ccff·2025-02-19 18:28

YOLOv11算法与改进版YOLOv11算法对比：性能提升与优化

YOLOv11算法对比：性能提升与优化提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录YOLOv11算法与改进版YOLOv11算法对比：性能提升与优化前言一、YOLOv11算法概述二、训练步骤

m0_54717829·2025-02-19 16:17

生成式AI如何重塑计算机视觉：自监督学习与稀疏计算的革命

生成式AI（如Diffusion模型、自监督学习）的崛起，正在打破这一瓶颈——通过更高效的训练范式与计算架构，让机器学会“从无标注数据中看见世界”。（示意图：

ProgramHan·2025-02-19 16:46

【深度学习】计算机视觉（CV）-目标检测-DETR（DEtection TRansformer）—— 基于 Transformer 的端到端目标检测

DETR（DEtectionTRansformer）是FacebookAI（FAIR）于2020年提出的端到端目标检测算法，它基于Transformer架构，消除了FasterR-CNN、YOLO等方法中的候选框

IT古董·2025-02-19 16:12

Golang 面试题

答案：Goroutine是Go语言中的轻量级线程，由Go运行时管理，初始栈大小约为2KB，可以动态扩展和收缩，创建和切换成本非常低。

ox0080·2025-02-19 15:37

遥感影像目标检测：从CNN（Faster-RCNN）到Transformer（DETR）

我国高分辨率对地观测系统重大专项已全面启动，高空间、高光谱、高时间分辨率和宽地面覆盖于一体的全球天空地一体化立体对地观测网逐步形成，将成为保障国家安全的基础性和战略性资源。未来10年全球每天获取的观测数据将超过10PB，遥感大数据时代已然来临。一：深度卷积网络知识1.深度学习在遥感图像识别中的范式和问题2.深度学习的历史发展历程3.机器学习，深度学习等任务的基本处理流程4.卷积神经网络的基本原理5

岁月如歌，青春不败·2025-02-19 15:05

芯麦GC1267R单相双极驱动电机预驱动器解析：变速功能与PWM兼容性设计

其核心特性包括：单相双极驱动架构：支持全桥驱动，适配低至2.5V的电机电压。PWM兼容性：可通过外部PWM信号实现精准调速（频率范围1kHz~100kHz）。低功耗设计：静态电流低至1μA（休眠模式

深圳市青牛科技实业有限公司小芋圆·2025-02-19 15:31

吸烟YOLO数据集，COCO格式

抽烟吸烟数据集,标签txt，图像已经分好了测试集，验证集，训练集1️⃣可以直接导入YOLO进行训练，没有细分类，里面有的类，闲鱼9.9解君愁，明人不说暗话闲鱼搜索莓格米米私聊

鳄鱼的眼药水·2025-02-19 15:59

Chameleon跨端框架——壹个理想主义团队的开源作品

下面正文开始~背景解决方案原理久经考验生产应用举例易用性好多态协议学习成本低渐进式接入业内对比后期规划理想主义历经近20个月打磨，滴滴跨端方案chameleon终于开源了github.com/didi/

weixin_34049032·2025-02-19 14:56

医学顶会 MICCAI‘24 | COVID19 至肺炎：使用 CNN Transformer 位置感知特征编码网络对多区域肺部严重程度进行分类

本文内容只为星球内部成员学习和学术交流，请勿用作他用论文信息题目：COVID19toPneumonia:MultiRegionLungSeverityClassificationusingCNNTransformerPosition-AwareFeatureEncodingNetworkCOVID19

小白学视觉·2025-02-19 14:24

Redis在实际应用中的最佳实践：缓存加速、分布式锁与消息队列

Redis在实际应用中的最佳实践：缓存加速、分布式锁与消息队列Redis作为一个高性能的内存数据库，凭借其高吞吐量、低延迟的特性，已成为开发者在构建现代应用时的首选技术之一。

一碗黄焖鸡三碗米饭·2025-02-19 12:10

linux第八章 git连接本地仓库和gitee

博主主页：@ᰔᩚ.一怀明月ꦿ❤️‍专栏系列：线性代数，C初学者入门训练，题解C，C的使用文章，「初学」C++，linux座右铭：“不要等到什么都没有了，才下定决心去做”大家觉不错的话，就恳求大家点点关注

ᰔᩚ. 一怀明月ꦿ·2025-02-19 12:08

智能工单，一键报障｜云智慧轻帆云打造连锁企业服务管理新体验

连锁企业的规模化发展和市场竞争，企业IT运营能力面临诸多挑战：故障处理效率低：门店数量多，分布分散，故障发生时难以在第一时间快速响应解决，影响客户体验。

·2025-02-19 11:53

Boss直聘-AI行业岗位与薪资水平调研

直聘唯品会AI产品经理PM35-65K*14薪无智能产品规划与设计、数据分析、行业调研、推动项目、协同作业boss直聘京东智能机器人产品运营运营20-40K*15薪无智能客服机器人运营boss直聘字节跳动AI训练技术项目经理

姚瑞南·2025-02-19 10:23

AI架构师必知必会系列：强化学习在金融领域的应用

文章目录AI架构师必知必会系列：强化学习在金融领域的应用1.背景介绍1.1问题的由来1.2研究现状1.3研究意义1.4本文结构2.核心概念与联系1.强化学习交易系统的总体架构2.强化学习模型训练流程3.

AI天才研究院·2025-02-19 09:45

关于DeepSeek与ChatGPT等模型的原始训练数据

DeepSeek与ChatGPT等模型的原始训练数据是否一样训练数据的相似性与差异性相似性：DeepSeek和ChatGPT等模型在训练数据上有一定的重叠。

月光技术杂谈·2025-02-19 09:44

蓝耘服务器与DeepSeek的结合：引领智能化时代的新突破

AI目录蓝耘服务器与DeepSeek的结合：引领智能化时代的新突破一、蓝耘服务器的技术优势1、高性能计算能力2、可扩展性与高效存储3、绿色节能设计二、DeepSeek：智能算法的引擎1、高效的深度学习训练与推理

Lethehong·2025-02-19 08:36

电磁铁的磁芯材质

电磁铁的磁芯通常采用软铁材质，因其具有高磁导率和低矫顽力，使得电磁铁能够在通电时迅速产生强磁场，断电后磁场又能迅速消失。一、电磁铁与磁芯材质电磁铁是一种利用电流产生磁场的装置。

JZMSYYQ·2025-02-19 08:05

Pytorch实现之粒子群优化算法在GAN中的应用

简介简介：主要是采用了粒子群优化（PSO）算法来优化GAN的一个训练。PSO是一种是一种基于种群的随机优化技术。这种优化技术是通过粒子群进行的，粒子群在每次迭代中都会更新自己。

这张生成的图像能检测吗·2025-02-19 07:30

用deepseek学大模型08-卷积神经网络(CNN)

yuanbao.tencent.com从入门到精通卷积神经网络(CNN),着重介绍的目标函数，损失函数，梯度下降标量和矩阵形式的数学推导，pytorch真实能跑的代码案例以及模型,数据，预测结果的可视化展示

wyg_031113·2025-02-19 07:30

DeepSeek自研AI芯片，AI算力新变革？

AI算力告急，成本掣肘发展当下，AI技术迅猛发展，从科研领域的复杂模型训练，到日常生活里智能语音助手的实时交互，算力成了决定AI发展的关键因素。作为大模型领域的后起之秀，DeepSeek对计算资源

·2025-02-19 07:19

Pytorch实现论文之一种基于扰动卷积层和梯度归一化的生成对抗网络

简介简介：提出了一种针对鉴别器的梯度惩罚方法和在鉴别器中采用扰动卷积，拟解决锐梯度空间引起的训练不稳定性问题和判别器的记忆问题。

这张生成的图像能检测吗·2025-02-19 06:51

Pytorch实现论文：利用推土机距离与梯度惩罚在ACGAN中训练。

在训练数据充足、分布均

这张生成的图像能检测吗·2025-02-19 06:51

Pytorch实现论文之三元DCGAN生成RGB图像用于红外图像着色生成

简介简介：采用了三次DCGAN单独生成单通道图像之后进行组成RGB图像放入鉴别器中检测，并在鉴别器和生成器的损失训练中采用梯度方法来提升或者降低权重。该方法将用于获得红外图像着色的生成。

这张生成的图像能检测吗·2025-02-19 05:50

微调alpaca-lora遇到的一些问题

目录一、环境简介二、混合精度训练Tensor相互计算会报错三、推理加载lora报错：SafetensorError:Errorwhiledeserializingheader:InvalidHeaderDeserialization

自学AI的鲨鱼儿·2025-02-19 05:42

LeetCode解决方案集：编程与面试技能提升

本文还有配套的精品资源，点击获取简介：LeetCode是一个编程训练平台，提供了大量编程题目，用于提升开发者的算法技能和面试准备。

徐子贡·2025-02-19 04:37

Python库 - transformers

它提供了大量的预训练模型，这些模型可以用于各种NLP任务，如文本分类、问答、翻译、摘要生成等。

司南锤·2025-02-19 03:28

推荐频道

CNN训练准确度低

【深度学习pytorch-93】Transformer 相比 RNN 的优势

吐血整理！权重持久化方案优化，让你的模型性能飙升

训练时数据增强策略调整，让模型性能飙升

模型版本回滚机制支持，让你的模型训练不再走弯路

吐血整理！模型热加载能力大比拼，谁才是真正王者？

吐血整理！过拟合抑制策略调整方法大揭秘，让模型性能飙升

梯度累积和优化器配置差异，让模型训练效果天差地别！

还在为模型权重共享效率发愁？模型权重共享策略优化让效果飙升

模型保存、训练与验证

python中的深度学习框架TensorFlow 和 PyTorch 有什么区别？

人工智能与机器学习入门：决策树应用

深度学习torch之19种优化算法（optimizer）解析

DeepSeek 本地部署硬件配置全解析

GPU通信革命：跨平面网络效率提升300%的秘密武器

自然语言处理NLP 01语言转换&语言模型

C++ 中的运算符优先级

常用的高性能计算工具有哪些

从代码到专利：如何用自注意力机制实现高效序列转换？——深度解析Google的Transformer架构

破局与重构：水务企业数字化转型路径探索

《DeepSeek模型压缩：在高效与性能间寻平衡》

ColD Fusion，分布式多任务微调的协同 “密码”

【大模型】量化、剪枝、蒸馏

PyTorch与TensorFlow的对比：哪个框架更适合你的项目？

【nvidia】NCCL禁用P2P后果权衡

YOLOv11算法与改进版YOLOv11算法对比：性能提升与优化

生成式AI如何重塑计算机视觉：自监督学习与稀疏计算的革命

【深度学习】计算机视觉（CV）-目标检测-DETR（DEtection TRansformer）—— 基于 Transformer 的端到端目标检测

Golang 面试题

遥感影像目标检测：从CNN（Faster-RCNN）到Transformer（DETR）

芯麦GC1267R单相双极驱动电机预驱动器解析：变速功能与PWM兼容性设计

吸烟YOLO数据集，COCO格式

Chameleon跨端框架——壹个理想主义团队的开源作品

医学顶会 MICCAI‘24 | COVID19 至肺炎：使用 CNN Transformer 位置感知特征编码网络对多区域肺部严重程度进行分类

Redis在实际应用中的最佳实践：缓存加速、分布式锁与消息队列

linux第八章 git连接本地仓库和gitee

智能工单，一键报障｜云智慧轻帆云打造连锁企业服务管理新体验

Boss直聘-AI行业岗位与薪资水平调研

AI架构师必知必会系列：强化学习在金融领域的应用

关于DeepSeek与ChatGPT等模型的原始训练数据

蓝耘服务器与DeepSeek的结合：引领智能化时代的新突破

电磁铁的磁芯材质

Pytorch实现之粒子群优化算法在GAN中的应用

用deepseek学大模型08-卷积神经网络(CNN)

DeepSeek自研AI芯片，AI算力新变革？

Pytorch实现论文之一种基于扰动卷积层和梯度归一化的生成对抗网络

Pytorch实现论文：利用推土机距离与梯度惩罚在ACGAN中训练。

Pytorch实现论文之三元DCGAN生成RGB图像用于红外图像着色生成

微调alpaca-lora遇到的一些问题

LeetCode解决方案集：编程与面试技能提升

Python库 - transformers