E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
CNN训练准确度低
【深度学习pytorch-93】Transformer 相比 RNN 的优势
这意味着,在
训练
华东算法王
·
2025-02-20 02:04
DL-pytorch
深度学习
pytorch
transformer
吐血整理!权重持久化方案优化,让你的模型性能飙升
权重持久化方案优化,让你的模型性能飙升引言你是否在做深度学习项目时,遭遇过模型
训练
结果无法有效保存,导致之前的努力付诸东流的痛苦?又或者在模型权重持久化时,发现保存和加载的速度极慢,严重影响项目进度?
盼达思文体科创
·
2025-02-20 01:57
经验分享
训练
时数据增强策略调整,让模型性能飙升
训练
时数据增强策略调整,让模型性能飙升引言你是否遇到过模型
训练
效果不佳,明明投入了大量数据,可模型的准确率、泛化能力就是提不上去?其实啊,很多时候问题就出在数据增强策略上。
盼达思文体科创
·
2025-02-20 01:26
经验分享
模型版本回滚机制支持,让你的模型
训练
不再走弯路
模型版本回滚机制支持,让你的模型
训练
不再走弯路引言你是否遇到过模型
训练
过程中,因为一个小失误导致之前的努力白费,只能从头再来的糟心事?为什么辛辛苦苦
训练
出来的模型,突然效果变差,却找不到问题所在?
盼达思文体科创
·
2025-02-20 01:26
经验分享
吐血整理!模型热加载能力大比拼,谁才是真正王者?
当你
训练
出了一个新的、性能更好的模型时,如果不能进行热加
盼达思文体科创
·
2025-02-20 01:56
经验分享
吐血整理!过拟合抑制策略调整方法大揭秘,让模型性能飙升
过拟合抑制策略调整方法大揭秘,让模型性能飙升引言你是否遇到过模型在
训练
集上表现完美,可一到测试集就“原形毕露”的糟心情况?为啥模型
训练
得好好的,实际应用时却差强人意呢?这其实就是过拟合在捣乱!
盼达思文体科创
·
2025-02-20 01:56
经验分享
梯度累积和优化器配置差异,让模型
训练
效果天差地别!
梯度累积和优化器配置差异,让模型
训练
效果天差地别!引言你是否还在为模型
训练
效果不佳而苦恼?明明花费了大量时间和精力,模型的性能却始终无法达到预期。其实,很多时候问题可能就出在梯度累积和优化器配置上。
盼达思文体科创
·
2025-02-20 01:26
经验分享
还在为模型权重共享效率发愁?模型权重共享策略优化让效果飙升
模型权重共享策略优化让效果飙升引言你是否在进行模型
训练
时,常常被漫长的
训练
时间和巨大的计算资源消耗搞得焦头烂额?为什么明明使用了模型权重共享策略,却还是达不到理想的
训练
效果和效率?
盼达思文体科创
·
2025-02-20 01:26
经验分享
模型保存、
训练
与验证
模型保存、
训练
与验证网络模型的保存与读取在PyTorch中,模型的保存与加载有两种主要方式:保存&加载完整模型(包括网络结构和参数)只保存&加载模型参数(推荐方式)可以直接跳过看最后几行。
钰见梵星
·
2025-02-20 00:21
小土堆PyTorch深度学习
深度学习
人工智能
python中的深度学习框架TensorFlow 和 PyTorch 有什么区别?
这使得TensorFlow在大规模分布式
训练
和部署时具有优势,但调试和动态修改模型时可能不够灵活。功能全面:TensorFlow提
大懒猫软件
·
2025-02-20 00:51
python
深度学习
tensorflow
pytorch
人工智能与机器学习入门:决策树应用
尝试使用决策树模型来
训练
数据,并进行test数据集的测试。什么是决策树决策树,简单来讲可以认为是一个大的ifelse判断树,有了决策树后,测试集中的数据便可以使用该决策树进行判断了。
·
2025-02-20 00:24
决策树机器学习入门
深度学习torch之19种优化算法(optimizer)解析
Adam、AdamW、NAdam、RAdam以及SparseAdam等,通过对这些算法的公式和参数说明进行详细解析,博客旨在为机器学习工程师和研究人员提供清晰的理论指导,帮助读者选择合适的优化算法提升模型
训练
效率
@Mr_LiuYang
·
2025-02-19 23:06
论文阅读
深度学习
optimizer
Adam
学习率调整
优化算法
DeepSeek 本地部署硬件配置全解析
而且它可“省钱”了,预
训练
费用还不到OpenAIGPT-4o模型的十
喜-喜
·
2025-02-19 23:34
人工智能
深度学习
DeepSeek配置要求
GPU通信革命:跨平面网络效率提升300%的秘密武器
技术解析:突破AI算力瓶颈的底层创新1.技术背景:终结多平面网络CPU中转困境传统多平面网络中,跨平面GPU通信必须经过CPU内存拷贝,导致两大痛点:20-30%的通信带宽浪费在CPU中转环节大规模集群
训练
时
CodePatentMaster
·
2025-02-19 22:27
人工智能
深度学习
机器学习
自然语言处理
微服务
服务器
AIGC
自然语言处理NLP 01语言转换&语言模型
FeatureExtraction)(1)词袋模型(BagofWords,BoW)(2)TF-IDF(3)词嵌入(WordEmbedding)3.模型输入(ModelInput)(1)序列编码(2)预
训练
模型输入
伊一大数据&人工智能学习日志
·
2025-02-19 22:56
自然语言处理
自然语言处理
人工智能
语言模型
nlp
机器学习
深度学习
C++ 中的运算符优先级
下表将按运算符优先级从高到
低
列出各个运算符,具有较高优先级的运算符出现在表格的上面,具有较低优先级的
Sirius·Black
·
2025-02-19 21:54
C++专栏
精品文章
开发语言
c++
常用的高性能计算工具有哪些
无论是模拟宇宙的起源、设计新型航空器,还是
训练
复杂的人工智能模型,HPC都扮演着不可或缺的角色。本文将深入探讨高性能计算的定义、其背后的强大工具,以及它们如何助力各领域的突破性发展。
这题有点难度
·
2025-02-19 21:24
人工智能
学习
从代码到专利:如何用自注意力机制实现高效序列转换?——深度解析Google的Transformer架构
在传统的序列转换任务(如机器翻译、语音识别等)中,循环神经网络(RNN)和卷积神经网络(
CNN
)是常用的模型架构。然而,这些模型存在以下问题:
CodePatentMaster
·
2025-02-19 21:53
transformer
深度学习
人工智能
AIGC
架构
破局与重构:水务企业数字化转型路径探索
一、水务行业数字化发展趋势随着国家新型智慧城市建设的推进,供水市场存在市场趋于饱和、市场过度分散、集约化程度
低
、传统供排水
·
2025-02-19 20:48
数据库人工智能数据挖掘
《DeepSeek模型压缩:在高效与性能间寻平衡》
量化:用
低
精度表达,换存储空间与计算效率量化技术是DeepSeek模型压缩的关键手段之一,它将模型中的高精度浮点数参数转换为
低
比特数的整数或定点数,从而实现存储空间的大幅缩减与计算速度的提升。从
·
2025-02-19 20:47
人工智能深度学习
ColD Fusion,分布式多任务微调的协同 “密码”
)直观解释2.大模型进化史:从Transformer到DeepSeek-R1的AI变革之路3.2W8000字深度剖析25种RAG变体:全网最全~没有之一知乎【柏企】公众号【柏企科技说】【柏企阅文】在预
训练
模型的基础上进行改进
·
2025-02-19 20:46
人工智能
【大模型】量化、剪枝、蒸馏
下面是每种技术的详细介绍:1.量化(Quantization)量化是将浮点数表示的模型参数(通常是32位浮点数)转换为
低
精度表示(如8位整数)。
油泼辣子多加
·
2025-02-19 18:02
深度学习
剪枝
人工智能
算法
PyTorch与TensorFlow的对比:哪个框架更适合你的项目?
一、概述PyTorch和TensorFlow都是深度学习框架,它们为构建、
训练
和部署神经网络提供了强大的工具。尽管它们的最终目标相同,但其设计哲学和实现方式有所不同。
木觞清
·
2025-02-19 18:59
pytorch
tensorflow
人工智能
【nvidia】NCCL禁用P2P后果权衡
计算bound场景:模型参数量较小(如参数量未超出单卡显存容量,使用纯数据并行)或计算密度极高(如大batchsize下的矩阵运算)时,A100的计算能力(FP16/FP32算力)可能被充分利用,此时
训练
是计算
x66ccff
·
2025-02-19 18:28
linux
p2p
服务器
网络协议
YOLOv11算法与改进版YOLOv11算法对比:性能提升与优化
YOLOv11算法对比:性能提升与优化提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录YOLOv11算法与改进版YOLOv11算法对比:性能提升与优化前言一、YOLOv11算法概述二、
训练
步骤
m0_54717829
·
2025-02-19 16:17
YOLO
算法
目标跟踪
生成式AI如何重塑计算机视觉:自监督学习与稀疏计算的革命
生成式AI(如Diffusion模型、自监督学习)的崛起,正在打破这一瓶颈——通过更高效的
训练
范式与计算架构,让机器学会“从无标注数据中看见世界”。(示意图:
ProgramHan
·
2025-02-19 16:46
人工智能
计算机视觉
学习
【深度学习】计算机视觉(CV)-目标检测-DETR(DEtection TRansformer)—— 基于 Transformer 的端到端目标检测
DETR(DEtectionTRansformer)是FacebookAI(FAIR)于2020年提出的端到端目标检测算法,它基于Transformer架构,消除了FasterR-
CNN
、YOLO等方法中的候选框
IT古董
·
2025-02-19 16:12
深度学习
人工智能
深度学习
计算机视觉
目标检测
Golang 面试题
答案:Goroutine是Go语言中的轻量级线程,由Go运行时管理,初始栈大小约为2KB,可以动态扩展和收缩,创建和切换成本非常
低
。
ox0080
·
2025-02-19 15:37
#
北漂+滴滴出行
程序员面试指南
Golang
golang
开发语言
后端
遥感影像目标检测:从
CNN
(Faster-R
CNN
)到Transformer(DETR)
我国高分辨率对地观测系统重大专项已全面启动,高空间、高光谱、高时间分辨率和宽地面覆盖于一体的全球天空地一体化立体对地观测网逐步形成,将成为保障国家安全的基础性和战略性资源。未来10年全球每天获取的观测数据将超过10PB,遥感大数据时代已然来临。一:深度卷积网络知识1.深度学习在遥感图像识别中的范式和问题2.深度学习的历史发展历程3.机器学习,深度学习等任务的基本处理流程4.卷积神经网络的基本原理5
岁月如歌,青春不败
·
2025-02-19 15:05
生态遥感
目标检测
cnn
transformer
遥感
遥感影像
芯麦GC1267R单相双极驱动电机预驱动器解析:变速功能与PWM兼容性设计
其核心特性包括:单相双极驱动架构:支持全桥驱动,适配
低
至2.5V的电机电压。PWM兼容性:可通过外部PWM信号实现精准调速(频率范围1kHz~100kHz)。低功耗设计:静态电流
低
至1μA(休眠模式
深圳市青牛科技实业有限公司 小芋圆
·
2025-02-19 15:31
芯麦
单片机
智能马桶
摄像机
机器人技术
电动牙刷
吸烟YOLO数据集,COCO格式
抽烟吸烟数据集,标签txt,图像已经分好了测试集,验证集,
训练
集1️⃣可以直接导入YOLO进行
训练
,没有细分类,里面有的类,闲鱼9.9解君愁,明人不说暗话闲鱼搜索莓格米米私聊
鳄鱼的眼药水
·
2025-02-19 15:59
YOLO
人工智能
深度学习
Chameleon跨端框架——壹个理想主义团队的开源作品
下面正文开始~背景解决方案原理久经考验生产应用举例易用性好多态协议学习成本
低
渐进式接入业内对比后期规划理想主义历经近20个月打磨,滴滴跨端方案chameleon终于开源了github.com/didi/
weixin_34049032
·
2025-02-19 14:56
javascript
前端
runtime
ViewUI
医学顶会 MICCAI‘24 | COVID19 至肺炎:使用
CNN
Transformer 位置感知特征编码网络对多区域肺部严重程度进行分类
本文内容只为星球内部成员学习和学术交流,请勿用作他用论文信息题目:COVID19toPneumonia:MultiRegionLungSeverityClassificationusing
CNN
TransformerPosition-AwareFeatureEncodingNetworkCOVID19
小白学视觉
·
2025-02-19 14:24
医学图像处理论文解读
cnn
transformer
分类
深度学习
医学图像处理
医学图像顶会
论文解读
Redis在实际应用中的最佳实践:缓存加速、分布式锁与消息队列
Redis在实际应用中的最佳实践:缓存加速、分布式锁与消息队列Redis作为一个高性能的内存数据库,凭借其高吞吐量、
低
延迟的特性,已成为开发者在构建现代应用时的首选技术之一。
一碗黄焖鸡三碗米饭
·
2025-02-19 12:10
Redis技术全景解析
redis
java
后端
架构
微服务
linux第八章 git连接本地仓库和gitee
博主主页:@ᰔᩚ.一怀明月ꦿ❤️专栏系列:线性代数,C初学者入门
训练
,题解C,C的使用文章,「初学」C++,linux座右铭:“不要等到什么都没有了,才下定决心去做”大家觉不错的话,就恳求大家点点关注
ᰔᩚ. 一怀明月ꦿ
·
2025-02-19 12:08
linux
git
linux
智能工单,一键报障|云智慧轻帆云打造连锁企业服务管理新体验
连锁企业的规模化发展和市场竞争,企业IT运营能力面临诸多挑战:故障处理效率
低
:门店数量多,分布分散,故障发生时难以在第一时间快速响应解决,影响客户体验。
·
2025-02-19 11:53
Boss直聘-AI行业岗位与薪资水平调研
直聘唯品会AI产品经理PM35-65K*14薪无智能产品规划与设计、数据分析、行业调研、推动项目、协同作业boss直聘京东智能机器人产品运营运营20-40K*15薪无智能客服机器人运营boss直聘字节跳动AI
训练
技术项目经理
姚瑞南
·
2025-02-19 10:23
AI行业资讯
AI行业产品调研
人工智能
自然语言处理
AIGC
经验分享
笔记
AI架构师必知必会系列:强化学习在金融领域的应用
文章目录AI架构师必知必会系列:强化学习在金融领域的应用1.背景介绍1.1问题的由来1.2研究现状1.3研究意义1.4本文结构2.核心概念与联系1.强化学习交易系统的总体架构2.强化学习模型
训练
流程3.
AI天才研究院
·
2025-02-19 09:45
AI实战
AI大模型企业级应用开发实战
DeepSeek
R1
&
大数据AI人工智能大模型
大数据
人工智能
语言模型
AI
LLM
Java
Python
架构设计
Agent
RPA
关于DeepSeek与ChatGPT等模型的原始
训练
数据
DeepSeek与ChatGPT等模型的原始
训练
数据是否一样
训练
数据的相似性与差异性相似性:DeepSeek和ChatGPT等模型在
训练
数据上有一定的重叠。
月光技术杂谈
·
2025-02-19 09:44
大模型初探
chatgpt
deepseek
训练数据
语料库
AI模型
训练样本
数据分类
蓝耘服务器与DeepSeek的结合:引领智能化时代的新突破
AI目录蓝耘服务器与DeepSeek的结合:引领智能化时代的新突破一、蓝耘服务器的技术优势1、高性能计算能力2、可扩展性与高效存储3、绿色节能设计二、DeepSeek:智能算法的引擎1、高效的深度学习
训练
与推理
Lethehong
·
2025-02-19 08:36
热点时事
服务器
运维
deepseek
python
电磁铁的磁芯材质
电磁铁的磁芯通常采用软铁材质,因其具有高磁导率和
低
矫顽力,使得电磁铁能够在通电时迅速产生强磁场,断电后磁场又能迅速消失。一、电磁铁与磁芯材质电磁铁是一种利用电流产生磁场的装置。
JZMSYYQ
·
2025-02-19 08:05
磁场设备
材质
材料工程
功能测试
制造
Pytorch实现之粒子群优化算法在GAN中的应用
简介简介:主要是采用了粒子群优化(PSO)算法来优化GAN的一个
训练
。PSO是一种是一种基于种群的随机优化技术。这种优化技术是通过粒子群进行的,粒子群在每次迭代中都会更新自己。
这张生成的图像能检测吗
·
2025-02-19 07:30
优质GAN模型训练自己的数据集
生成对抗网络
人工智能
神经网络
pytorch
算法
深度学习
计算机视觉
用deepseek学大模型08-卷积神经网络(
CNN
)
yuanbao.tencent.com从入门到精通卷积神经网络(
CNN
),着重介绍的目标函数,损失函数,梯度下降标量和矩阵形式的数学推导,pytorch真实能跑的代码案例以及模型,数据,预测结果的可视化展示
wyg_031113
·
2025-02-19 07:30
机器学习
人工智能
DeepSeek自研AI芯片,AI算力新变革?
AI算力告急,成本掣肘发展当下,AI技术迅猛发展,从科研领域的复杂模型
训练
,到日常生活里智能语音助手的实时交互,算力成了决定AI发展的关键因素。作为大模型领域的后起之秀,DeepSeek对计算资源
·
2025-02-19 07:19
人工智能深度学习机器学习算法
Pytorch实现论文之一种基于扰动卷积层和梯度归一化的生成对抗网络
简介简介:提出了一种针对鉴别器的梯度惩罚方法和在鉴别器中采用扰动卷积,拟解决锐梯度空间引起的
训练
不稳定性问题和判别器的记忆问题。
这张生成的图像能检测吗
·
2025-02-19 06:51
GAN系列
优质GAN模型训练自己的数据集
pytorch
人工智能
机器学习
生成对抗网络
神经网络
计算机视觉
深度学习
Pytorch实现论文:利用推土机距离与梯度惩罚在ACGAN中
训练
。
在
训练
数据充足、分布均
这张生成的图像能检测吗
·
2025-02-19 06:51
优质GAN模型训练自己的数据集
pytorch
人工智能
深度学习
gan
机器学习
生成对抗网络
Pytorch实现论文之三元DCGAN生成RGB图像用于红外图像着色生成
简介简介:采用了三次DCGAN单独生成单通道图像之后进行组成RGB图像放入鉴别器中检测,并在鉴别器和生成器的损失
训练
中采用梯度方法来提升或者降低权重。该方法将用于获得红外图像着色的生成。
这张生成的图像能检测吗
·
2025-02-19 05:50
GAN系列
优质GAN模型训练自己的数据集
人工智能
python
生成对抗网络
深度学习
pytorch
机器学习
计算机视觉
微调alpaca-lora遇到的一些问题
目录一、环境简介二、混合精度
训练
Tensor相互计算会报错三、推理加载lora报错:SafetensorError:Errorwhiledeserializingheader:InvalidHeaderDeserialization
自学AI的鲨鱼儿
·
2025-02-19 05:42
#
训练
个人笔记
深度学习
LLM
LeetCode解决方案集:编程与面试技能提升
本文还有配套的精品资源,点击获取简介:LeetCode是一个编程
训练
平台,提供了大量编程题目,用于提升开发者的算法技能和面试准备。
徐子贡
·
2025-02-19 04:37
Python库 - transformers
它提供了大量的预
训练
模型,这些模型可以用于各种NLP任务,如文本分类、问答、翻译、摘要生成等。
司南锤
·
2025-02-19 03:28
PYTHON库
python机器学习
python
开发语言
上一页
30
31
32
33
34
35
36
37
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他