E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
比赛&训练
深度学习torch之19种优化算法(optimizer)解析
Adam、AdamW、NAdam、RAdam以及SparseAdam等,通过对这些算法的公式和参数说明进行详细解析,博客旨在为机器学习工程师和研究人员提供清晰的理论指导,帮助读者选择合适的优化算法提升模型
训练
效率
@Mr_LiuYang
·
2025-02-19 23:06
论文阅读
深度学习
optimizer
Adam
学习率调整
优化算法
DeepSeek 本地部署硬件配置全解析
而且它可“省钱”了,预
训练
费用还不到OpenAIGPT-4o模型的十
喜-喜
·
2025-02-19 23:34
人工智能
深度学习
DeepSeek配置要求
GPU通信革命:跨平面网络效率提升300%的秘密武器
技术解析:突破AI算力瓶颈的底层创新1.技术背景:终结多平面网络CPU中转困境传统多平面网络中,跨平面GPU通信必须经过CPU内存拷贝,导致两大痛点:20-30%的通信带宽浪费在CPU中转环节大规模集群
训练
时
CodePatentMaster
·
2025-02-19 22:27
人工智能
深度学习
机器学习
自然语言处理
微服务
服务器
AIGC
自然语言处理NLP 01语言转换&语言模型
FeatureExtraction)(1)词袋模型(BagofWords,BoW)(2)TF-IDF(3)词嵌入(WordEmbedding)3.模型输入(ModelInput)(1)序列编码(2)预
训练
模型输入
伊一大数据&人工智能学习日志
·
2025-02-19 22:56
自然语言处理
自然语言处理
人工智能
语言模型
nlp
机器学习
深度学习
常用的高性能计算工具有哪些
无论是模拟宇宙的起源、设计新型航空器,还是
训练
复杂的人工智能模型,HPC都扮演着不可或缺的角色。本文将深入探讨高性能计算的定义、其背后的强大工具,以及它们如何助力各领域的突破性发展。
这题有点难度
·
2025-02-19 21:24
人工智能
学习
只能说算法做题全凭运气
问题描述在一款多人游戏中,每局
比赛
需要多个玩家参与。如果发现两名玩家至少一起玩过两局
比赛
,则可以认为这两名玩家互为队友。
幼儿园口算大王
·
2025-02-19 21:52
算法
java
开发语言
ColD Fusion,分布式多任务微调的协同 “密码”
)直观解释2.大模型进化史:从Transformer到DeepSeek-R1的AI变革之路3.2W8000字深度剖析25种RAG变体:全网最全~没有之一知乎【柏企】公众号【柏企科技说】【柏企阅文】在预
训练
模型的基础上进行改进
·
2025-02-19 20:46
人工智能
蓝桥杯备赛经验帖
蓝桥杯备赛经验帖作者:blue时间:2025.2.1文章目录蓝桥杯备赛经验帖1.为什么有这篇文章2.赛制3.
比赛
流程4.如何准备5.其他建议6.一些感悟1.为什么有这篇文章笔者近期发现,观看我写的两道第十五届蓝桥杯题解的人数逐渐增多
Blue.ztl
·
2025-02-19 19:03
竞赛经验帖
蓝桥杯
职场和发展
PyTorch与TensorFlow的对比:哪个框架更适合你的项目?
一、概述PyTorch和TensorFlow都是深度学习框架,它们为构建、
训练
和部署神经网络提供了强大的工具。尽管它们的最终目标相同,但其设计哲学和实现方式有所不同。
木觞清
·
2025-02-19 18:59
pytorch
tensorflow
人工智能
【nvidia】NCCL禁用P2P后果权衡
计算bound场景:模型参数量较小(如参数量未超出单卡显存容量,使用纯数据并行)或计算密度极高(如大batchsize下的矩阵运算)时,A100的计算能力(FP16/FP32算力)可能被充分利用,此时
训练
是计算
x66ccff
·
2025-02-19 18:28
linux
p2p
服务器
网络协议
YOLOv11算法与改进版YOLOv11算法对比:性能提升与优化
YOLOv11算法对比:性能提升与优化提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录YOLOv11算法与改进版YOLOv11算法对比:性能提升与优化前言一、YOLOv11算法概述二、
训练
步骤
m0_54717829
·
2025-02-19 16:17
YOLO
算法
目标跟踪
生成式AI如何重塑计算机视觉:自监督学习与稀疏计算的革命
生成式AI(如Diffusion模型、自监督学习)的崛起,正在打破这一瓶颈——通过更高效的
训练
范式与计算架构,让机器学会“从无标注数据中看见世界”。(示意图:
ProgramHan
·
2025-02-19 16:46
人工智能
计算机视觉
学习
吸烟YOLO数据集,COCO格式
抽烟吸烟数据集,标签txt,图像已经分好了测试集,验证集,
训练
集1️⃣可以直接导入YOLO进行
训练
,没有细分类,里面有的类,闲鱼9.9解君愁,明人不说暗话闲鱼搜索莓格米米私聊
鳄鱼的眼药水
·
2025-02-19 15:59
YOLO
人工智能
深度学习
linux第八章 git连接本地仓库和gitee
博主主页:@ᰔᩚ.一怀明月ꦿ❤️专栏系列:线性代数,C初学者入门
训练
,题解C,C的使用文章,「初学」C++,linux座右铭:“不要等到什么都没有了,才下定决心去做”大家觉不错的话,就恳求大家点点关注
ᰔᩚ. 一怀明月ꦿ
·
2025-02-19 12:08
linux
git
linux
零基础被迫参加CTF
比赛
?CTF高频解题技巧与经验分享
CTF(CaptureTheFlag)
比赛
中的高频解题技巧通常涵盖了以下几类技术,涉及从逆向工程、二进制漏洞利用到Web安全、密码学等多个领域。
网络安全宇哥
·
2025-02-19 11:31
经验分享
web安全
安全
网络
安全架构
Boss直聘-AI行业岗位与薪资水平调研
直聘唯品会AI产品经理PM35-65K*14薪无智能产品规划与设计、数据分析、行业调研、推动项目、协同作业boss直聘京东智能机器人产品运营运营20-40K*15薪无智能客服机器人运营boss直聘字节跳动AI
训练
技术项目经理
姚瑞南
·
2025-02-19 10:23
AI行业资讯
AI行业产品调研
人工智能
自然语言处理
AIGC
经验分享
笔记
AI架构师必知必会系列:强化学习在金融领域的应用
文章目录AI架构师必知必会系列:强化学习在金融领域的应用1.背景介绍1.1问题的由来1.2研究现状1.3研究意义1.4本文结构2.核心概念与联系1.强化学习交易系统的总体架构2.强化学习模型
训练
流程3.
AI天才研究院
·
2025-02-19 09:45
AI实战
AI大模型企业级应用开发实战
DeepSeek
R1
&
大数据AI人工智能大模型
大数据
人工智能
语言模型
AI
LLM
Java
Python
架构设计
Agent
RPA
关于DeepSeek与ChatGPT等模型的原始
训练
数据
DeepSeek与ChatGPT等模型的原始
训练
数据是否一样
训练
数据的相似性与差异性相似性:DeepSeek和ChatGPT等模型在
训练
数据上有一定的重叠。
月光技术杂谈
·
2025-02-19 09:44
大模型初探
chatgpt
deepseek
训练数据
语料库
AI模型
训练样本
数据分类
蓝耘服务器与DeepSeek的结合:引领智能化时代的新突破
AI目录蓝耘服务器与DeepSeek的结合:引领智能化时代的新突破一、蓝耘服务器的技术优势1、高性能计算能力2、可扩展性与高效存储3、绿色节能设计二、DeepSeek:智能算法的引擎1、高效的深度学习
训练
与推理
Lethehong
·
2025-02-19 08:36
热点时事
服务器
运维
deepseek
python
Pytorch实现之粒子群优化算法在GAN中的应用
简介简介:主要是采用了粒子群优化(PSO)算法来优化GAN的一个
训练
。PSO是一种是一种基于种群的随机优化技术。这种优化技术是通过粒子群进行的,粒子群在每次迭代中都会更新自己。
这张生成的图像能检测吗
·
2025-02-19 07:30
优质GAN模型训练自己的数据集
生成对抗网络
人工智能
神经网络
pytorch
算法
深度学习
计算机视觉
DeepSeek自研AI芯片,AI算力新变革?
AI算力告急,成本掣肘发展当下,AI技术迅猛发展,从科研领域的复杂模型
训练
,到日常生活里智能语音助手的实时交互,算力成了决定AI发展的关键因素。作为大模型领域的后起之秀,DeepSeek对计算资源
·
2025-02-19 07:19
人工智能深度学习机器学习算法
Pytorch实现论文之一种基于扰动卷积层和梯度归一化的生成对抗网络
简介简介:提出了一种针对鉴别器的梯度惩罚方法和在鉴别器中采用扰动卷积,拟解决锐梯度空间引起的
训练
不稳定性问题和判别器的记忆问题。
这张生成的图像能检测吗
·
2025-02-19 06:51
GAN系列
优质GAN模型训练自己的数据集
pytorch
人工智能
机器学习
生成对抗网络
神经网络
计算机视觉
深度学习
Pytorch实现论文:利用推土机距离与梯度惩罚在ACGAN中
训练
。
在
训练
数据充足、分布均
这张生成的图像能检测吗
·
2025-02-19 06:51
优质GAN模型训练自己的数据集
pytorch
人工智能
深度学习
gan
机器学习
生成对抗网络
Pytorch实现论文之三元DCGAN生成RGB图像用于红外图像着色生成
简介简介:采用了三次DCGAN单独生成单通道图像之后进行组成RGB图像放入鉴别器中检测,并在鉴别器和生成器的损失
训练
中采用梯度方法来提升或者降低权重。该方法将用于获得红外图像着色的生成。
这张生成的图像能检测吗
·
2025-02-19 05:50
GAN系列
优质GAN模型训练自己的数据集
人工智能
python
生成对抗网络
深度学习
pytorch
机器学习
计算机视觉
微调alpaca-lora遇到的一些问题
目录一、环境简介二、混合精度
训练
Tensor相互计算会报错三、推理加载lora报错:SafetensorError:Errorwhiledeserializingheader:InvalidHeaderDeserialization
自学AI的鲨鱼儿
·
2025-02-19 05:42
#
训练
个人笔记
深度学习
LLM
LeetCode解决方案集:编程与面试技能提升
本文还有配套的精品资源,点击获取简介:LeetCode是一个编程
训练
平台,提供了大量编程题目,用于提升开发者的算法技能和面试准备。
徐子贡
·
2025-02-19 04:37
Python库 - transformers
它提供了大量的预
训练
模型,这些模型可以用于各种NLP任务,如文本分类、问答、翻译、摘要生成等。
司南锤
·
2025-02-19 03:28
PYTHON库
python机器学习
python
开发语言
conda更换环境版本(比如torch版本)
pytorch官网torch过往的版本创建新环境condacreate--namemyenvpython=3.8condaactivatemyenvconda虚拟环境中安装CUDA和CUDNN深度学习用显卡
训练
的时候
挨打且不服66
·
2025-02-19 03:57
python
python
流行编程语言全解析:优势、应用与短板
机器学习与人工智能:构建和
训练
模型。典型示例:OpenAI在很多人工智能项目中广泛使用Python,如GPT系列模型的研发。网络爬虫:轻松从网页
a小胡哦
·
2025-02-19 03:27
python
java
c++
c语言
javascript
swift
r语言
LLaMA系列大模型调研与整理-llama-alpaca-lora
alpaca-lora5.Chinese-LLaMA-Alpaca6.BELLE大模型综述ASurveyofLargeLanguageModels关键词:大模型,LLaMA,Alpaca,Lora,Belle,模型
训练
AI大模型-大飞
·
2025-02-19 02:17
llama
AI大模型
AI
职场和发展
人工智能
deepseek和ChatGPT 4o比较
后
训练
+RL/RLHFDeepSeekR1等推理模型是在通用模型的基础上进行“特训”(后
训练
+SFT/RL/RLHF),使其不仅知道得多还用得好
调皮的芋头
·
2025-02-19 02:46
chatgpt
人工智能
采用分布式部署deepseek
分布式部署DeepSeek涉及使用多个计算节点来加速模型
训练
或提升推理效率。下面是一个基本的指南,帮助您了解如何进行分布式部署。
慧香一格
·
2025-02-19 02:14
AI
学习
分布式
deepseek
《Ollama 与 DeepSeek 整合应用入门指南》一、二、三章
无需网络连接的数据隐私保护跨平台架构设计:支持Windows/macOS/Linux全平台模型管理引擎:自动化处理模型依赖与版本控制1.2DeepSeek模型特性多模态处理能力:文本生成、代码理解、数学推理中文优化架构:针对中文语料的特殊
训练
策略模型家族图谱
Allen-Steven
·
2025-02-19 01:05
ollama
deepseek
【JAVA工程师从0开始学AI】,第四步:闭包与高阶函数——用Python的“魔法函数“重构Java思维
这里没有类的枷锁,函数既是武器又是盾牌,高阶函数组合出的"代码万花筒",正是AI数据处理、模型
训练
的核心密码。本文将用J
架构默片
·
2025-02-19 01:03
JAVA工程师从0开始学AI
人工智能
java
python
腾讯云大模型知识引擎×DeepSeek赋能文旅
其核心优势包括:动态知识更新:突破传统大模型预
训练
数据的时间
繁依Fanyi
·
2025-02-19 00:55
python
huggingface/pytorch-image-models
huggingface/pytorch-image-models1.使用技巧1.1.
训练
指令单卡:pythontrain.py--pretrained--input-size3224224--mean000
GarryLau
·
2025-02-19 00:23
ML&DL
pytorch
python
huggingface
PyTorch `.pth` 转 ONNX:从模型
训练
到跨平台部署
PyTorch.pth转ONNX:从模型
训练
到跨平台部署在深度学习里,模型的格式决定了它的可用性。如果你是PyTorch用户,你可能熟悉.pth文件,它用于存储
训练
好的模型。
MO__YE
·
2025-02-18 23:46
人工智能
什么是Scaling Laws(缩放定律);DeepSeek的Scaling Laws
ScalingLaws(缩放定律)ScalingLaws(缩放定律)在人工智能尤其是深度学习领域具有重要意义,以下是相关介绍及示例:定义与内涵ScalingLaws主要描述了深度学习模型在规模(如模型参数数量、
训练
数据量
ZhangJiQun&MXP
·
2025-02-18 23:14
教学
2024大模型以及算力
2021
论文
人工智能
自然语言处理
神经网络
语言模型
深度学习
智能算力中心万卡GPU集群架构深度解析
超万卡集群缩短
训练
时间,加速迭代,助力市场趋势应对。在超万卡集群中,高效稳定地
训练
大模型面临双重挑战:确保集群算力最大化、网
科技互联人生
·
2025-02-18 23:13
科技
数码
人工智能
人工智能
gpu算力
硬件架构
PyTorch `.pth` 转 ONNX:从模型
训练
到跨平台部署
PyTorch.pth转ONNX:从模型
训练
到跨平台部署在深度学习里,模型的格式决定了它的可用性。如果你是PyTorch用户,你可能熟悉.pth文件,它用于存储
训练
好的模型。
MO__YE
·
2025-02-18 23:12
pytorch
人工智能
python
如何
训练
LLM“思考”(像o1和DeepSeek-R1一样, 高级推理模型解析
2024年9月,OpenAI发布了它的o1模型,该模型基于大规模强化学习
训练
,赋予了它“高级推理”能力。不幸的是,他们是如何做到这一点的细节从未被公开披露。
果冻人工智能
·
2025-02-18 22:06
AI员工
人工智能
chatgpt
深度学习
商汤绝影端到端自动驾驶的迭代优化
自动驾驶,端到端,迭代优化,深度学习,感知,规划,控制,模型
训练
,数据增强,模型微调1.背景介绍随着人工智能和计算机视觉技术的飞速发展,自动驾驶汽车从科幻走进了现实。
AGI大模型与大数据研究院
·
2025-02-18 22:33
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
2. 从HuggingFace下载千问模型、数据、微调并运行
视频链接(1)3.从HuggingFace下载千问模型、数据、微调并运行(上)_哔哩哔哩_bilibili在本课程中,我们将带你下载并本地运行一个大模型,进行模型的微调
训练
等,视频播放量525、弹幕量0
ApiChain
·
2025-02-18 20:45
gpt
大模型
语言模型
人工智能
python
解剖DeepSeek四把刀,一场深到源码,大到行业,细到人心盛宴
他们公开的是经过蒸馏的“成品模型”,而非原始
训练
框架:就像给你组装好的乐高战舰,却藏起了设计图纸。这种半开放式开源既能吸引开发者构建生态,又
leluckys
·
2025-02-18 19:33
AI大模型
AI编程
SFT(监督微调)和RLHF(基于人类反馈的强化学习)的区别
和RLHF(基于人类反馈的强化学习)的区别STF(SupervisedFine-Tuning)和RLHF(ReinforcementLearningfromHumanFeedback)是两种不同的模型
训练
方法
钟小宇
·
2025-02-18 18:11
LLM
人工智能
语言模型
【机器学习】半监督和无监督极限学习机SS-US-ELM附Matlab代码
2.2ELM的学习过程介绍ELM的学习算法和
训练
过程。三、半监督极限学习机(SS-ELM)3.1SS-ELM的提
默默科研仔
·
2025-02-18 18:09
粉丝福利
机器学习
人工智能
DeepSeek为什么超越了OpenAI
其中,技术架构的突破最具革命性——DeepSeek创造性地采用"混合专家系统+领域预
训练
"架构,在特定领域的推理效率比OpenAI的GPT-4提升40%以上(根据2023年MLPerch基准测试)。
·
2025-02-18 17:19
deepseek
DeepSeek的
训练
与优化流程
DeepSeek的
训练
与优化流程一、数据工程体系1.多模态数据融合处理动态数据湖架构:实时摄入互联网文本、科学论文、专利文献、传感器数据等20+数据源日均处理原始数据量达1.2PB,支持200+文件格式自动解析智能清洗流水线
程序猿000001号
·
2025-02-18 17:01
DeepSeek
训练
优化
机器学习基本篇
1基本概念机器学习,分为回归,分类,聚类,降维有监督学习回归,分类,有特征,有标签,进行
训练
,然后对新数据进行预测无监督学习聚类,降维。
胖胖的小肥猫
·
2025-02-18 16:51
机器学习
deepseek本地部署后做微调
训练
实现智能对话的一些建议
在本地部署大模型后,进行微调和
训练
以实现智能对话,通常需要按照以下步骤操作。以下是详细的指导内容:1.准备数据集在微调大模型之前,需要准备适合的
训练
数据集。
慧香一格
·
2025-02-18 14:34
AI
学习
deepseek
服务器
AI
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他