E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
671B
deepseek(1)——deepseek 整体架构
deepseek最新的主要是两个模型:通用多模态大模型deepseek-v3,
671B
,通用模型,用于常见日常问题推理模型deepseek-r1,
671B
,推理模型,擅长处理复杂、需要多步思考的问题,适合做深度研究
哦豁灬
·
2025-03-27 20:14
学习笔记
深度学习
大模型
deepseek
LLM
大模型
Deepseek V3、豆包、百度秒哒在AI人工智能无代码编程方面的差异分析?
一、技术背景与核心优势对比工具名称DeepseekV3豆包百度秒哒技术架构参数量:
671B
(实际激活37B)创新点:MLA(多头潜在注意力)与DeepSeekMoE结构支持上下文长度128k训练成本低(
gzgenius
·
2025-03-27 16:39
DeepSeek
AI
思路
百度
人工智能
deepseek
学习
【深度学习】DeepSeek模型介绍与部署
原文链接:DeepSeek-V31.介绍DeepSeek-V3,一个强大的混合专家(MoE)语言模型,拥有
671B
总参数,其中每个token激活37B参数。
Nerous_
·
2025-03-21 19:15
深度学习
深度学习
人工智能
OpenBayes 教程上新丨单卡A6000轻松部署Gemma 3,精准识别黄仁勋演讲实拍
3月12日晚间,谷歌发布了「单卡大魔王」Gemma3,号称是能在单个GPU或TPU上运行的最强模型,真实战绩也证实了官方blog所言非虚——其27B版本击败
671B
的满血DeepSeekV3,以及o3-
·
2025-03-20 18:00
惊人的贵!DeepSeek-R1 本地部署成本不同方案大对比,成本优化建议也一并奉上!你能部署的起吗?
关于DeepSeek-R1本地部署的成本信息,费用范围因部署方案和硬件配置差异较大,具体可分为以下三类情况:一、企业级满血版部署(
671B
参数)硬件采购成本服务器集群:含8张NVIDIAA100/H100
涛涛讲AI
·
2025-03-18 04:47
大模型
大模型
DeepSeek-R1模型1.5b、7b、8b、14b、32b、70b和
671b
有啥区别?
deepseek-r1的1.5b、7b、8b、14b、32b、70b和
671b
有啥区别?
facaixxx2024
·
2025-03-17 06:01
AI大模型
人工智能
算法
深度学习
HuggingFace下载模型并导入Ollama指南
DeepSeek官方也将完整满血版DeepSeek-R1:
671B
模型镜像托管在此仓库,但是目前国内无法直接从HugingFace下载。
Repetion_Maxumim
·
2025-03-15 14:00
embedding
语言模型
人工智能
自然语言处理
ai
DeepSeek R1 本地部署实战教程来了,带可视化界面,非常详细!
相关阅读:DeepSeek-R1本地部署配置清单DeepSeek-R11.5b、7b、8b、14b、32b、70b、
671b
都是什么鬼?如何部
·
2025-03-14 17:57
java
在M4 Mac Mini集群上运行DeepSeek V3
671B
直接来看在8台M4Pro64GBMacMini集群(总内存512GB)上运行DeepSeekv3(
671B
)的结果:模型首个Token时间(秒)每秒Token数DeepSeekV3671B(4位)2.915.37Llama3.1405B
强化学习曾小健
·
2025-03-12 22:18
Deepseek原理与使用
macos
DeepSeek该选蒸馏版还是满血版
针对不同版本的DeepSeek,需要从多个维度综合分析:1.模型规模与基础能力
671B
模型在理论上具备更强的底层推理能力:更大参数量意味着更强的模式识别、逻辑推理和知识储备能力,尤其在跨领域、开放域任务中优势显著
飞翔的FOX
·
2025-03-12 04:35
人工智能
OpenBayes 教程上新 | 性能比肩满血版 DeepSeek-R1,QwQ-32B 一键部署教程上线
在多个关键基准测试上,其以32B的参数量,超越了OpenAI-o1-mini,比肩
671B
参数的满血版DeepSeek-R1。
·
2025-03-11 07:43
DeepSeek-R1
671B
VS DeepSeek V3,搭建和部署各自架构都需要什么样的硬件条件和成本? R1跟V3对比有何优劣,哪个更适合?
DeepSeek-R1671B技术全景透视DeepSeek-R1671B的B指的是训练参数的单位billion(十亿)同理1.5b=15亿,7b=70亿1.1参数规模与架构创新参数规模:6710亿参数(
671B
寒鸦xxx
·
2025-03-09 09:44
科技研究所
架构
经验分享
媲美满血R1+,刚刚,阿里推理模型QwQ-32B开源
小尺寸,不要
671B
,只要32B,推理门槛低QwQ-32B与其他领先模型的性能对比,包括DeepSeek-R1-Distilled-Qwen
X.Cristiano
·
2025-03-06 17:03
深度学习
QwQ-32B
Qwen
深度学习
大模型训练内存预估计算方法
方法论大模型在训练过程中,需要预估需要多少显存进行参数的存储,需要进行预估.来方便GPU的购买.举例以DeepSeek-V3模型为例,总共有
671B
个参数.B=Billion(十亿),因此,
671B
模型指拥有
junjunzai123
·
2025-03-05 13:29
人工智能
深度学习
机器学习
DeepSeek 各版本的区别
DeepSeek各版本的区别主要体现在参数规模、架构设计、性能表现、硬件需求以及适用场景等方面,具体对比如下:一、参数规模与模型架构基础版(DeepSeek-V3)参数规模:6710亿参数(
671B
),
dushky
·
2025-03-05 12:25
ai
语言模型
AI编程
在 MacBook 上设置 DeepSeek R1 (8B) 的 3 个步骤
推荐文章《24GBGPU中的DeepSeekR1:UnslothAI针对
671B
参数模型进行动态量化》权重1,DeepSeek类《
知识大胖
·
2025-03-03 11:04
NVIDIA
GPU和大语言模型开发教程
deepseek
ollama
openwebui
deepseek R1
671B
满血/量化 本地部署记录(ollama\sglang)
ollama运行量化671BdeepseekR1ollama准备下载并解压软件curl-Lhttps://ollama.com/download/ollama-linux-amd64.tgz-oollama-linux-amd64.tgzsudotar-C/usr-xzfollama-linux-amd64.tgz配置环境变量exportOLLAMA_HOST=0.0.0.0:11434expor
qq_43367614
·
2025-03-03 07:32
AIGC
python
671B
满血版DeepSeek R1隐藏入口,优秀平台推荐!
DatawhaleDatawhale推荐平台:AskManyAI**DeepSeek官网挤爆了,各种前几天大火的第三方平台也接连崩溃。我整理了一下问题,可以分成3类:回答卡顿,慢的要死,半天出不来结果,得反复重试服务器崩了,不知道啥时候能修复挂羊头卖狗肉,用8B蒸馏小模型冒充DeepSeekR1满血版,回答效果很差不能联网搜索不能支持图片对话不能支持文档对话这两天找遍各个渠道,深度体验了市面上接近
·
2025-02-25 07:57
datawhale
DeepSeek 和 Qwen 模型快速部署指南
导读:DeepSeek-V3&DeepSeek-R1模型对比特性DeepSeek-V3DeepSeek-R1模型大小总参数量6710亿(
671B
),MoE架构,每个token激活370亿参数总参数量与V3
moton2017
·
2025-02-24 18:47
深度学习
运维
模型部署
DeepSeek
Qwen
大型语言模型
LLM
人工智能
AI
Ubuntu DeepSeek磁盘空间不够解决办法
然后尝试
671B
,下载到60%,报磁盘空间不足。尝
achirandliu
·
2025-02-24 10:23
ubuntu
DeepSeek
空间不足
671B
Ubuntu22
本地运行 DeepSeek-R1 的成本究竟多高?
DeepSeek让人们对大规模生成式模型的追求更进一步,甚至有人想在本地跑下规模高达
671B
参数的版本。但要在家里开这种“巨无霸”,可不是闹着玩的:光是推理就对硬件提出了非常高的要求。
·
2025-02-21 02:13
前端javascript
国鑫DeepSeek
671B
本地部署方案:以高精度、高性价比重塑AI推理新标杆
随着DeepSeek大模型应用火爆全球,官方服务器总是被挤爆。而且基于企业对数据安全、网络、算力的更高需求,模型本地化部署的需求日益增长,如何在有限预算内实现高效、精准的AI推理能力,成为众多企业的核心诉求。国鑫作为深耕AI领域的技术先锋,推出基于4台48GRTX4090或8台24GRTX4090服务器的2套DeepSeek“满血”版本地部署方案,以FP16高精度、高性价比、强扩展性三大优势,为企
Gooxi国鑫
·
2025-02-20 20:17
人工智能
服务器
本地运行 DeepSeek-R1 的成本究竟多高?
DeepSeek让人们对大规模生成式模型的追求更进一步,甚至有人想在本地跑下规模高达
671B
参数的版本。但要在家里开这种“巨无霸”,可不是闹着玩的:光是推理就对硬件提出了非常高的要求。
·
2025-02-20 00:52
前端javascript
通俗诠释 DeepSeek-V3 模型的 “
671B
” ,“37B”与 “128K”,用生活比喻帮你理解模型的秘密!
我们用日常生活的比喻来解释:一、数字含义:模型“大脑”的三大指标“
671B
”:总知识库容量含义:模型总共学习了6710亿条知识(671Billion参数)。类比:相当于一座图书馆的总藏书量。数字越大,
涛涛讲AI
·
2025-02-17 19:44
大模型
生活
deepseek
人工智能
大模型
python
DeepSeek的崛起之路:从技术突破到行业变革
技术爆发(2024-2025)2024年末:发布DeepSeek-V3(
671B
参数),性能超越多数开源模型,逼近GPT-4等闭源标杆。2025年1月:推出R1系列(660B参数),通过
诚信爱国敬业友善
·
2025-02-17 18:05
心得
人工智能
ai
DeepSeek
国产框架让单卡24G显存跑DeepSeek-R1
671B
大模型:推理速度飙升28倍
清华团队用CPU/GPU协同计算,让4090跑起
671B
参数全量模型!”大家好,我是蚝油菜花。如果你也经历过——看着API调用账单瑟瑟发抖,微调一次模型吃掉半月算力预算️盯着OOM报错抓狂,为了
蚝油菜花
·
2025-02-17 00:32
每日
AI
项目与应用实例
人工智能
开源
华为昇腾部署 DeepSeek-R1 (
671B
) 大模型实战指南
概述本指南详细讲解如何在华为昇腾Atlas800IA2服务器集群上部署DeepSeek-R1671B大模型,涵盖从环境准备到服务化部署的全流程。通过本教程,您将掌握:模型权重转换与量化方法昇腾专用镜像的使用技巧多机分布式推理配置生产级服务化部署方案一、部署前准备1.1硬件要求部署类型服务器配置显存要求BF16推理4台Atlas800IA28*64GBW8A8量化推理2台Atlas800IA28*6
歌刎
·
2025-02-15 05:35
模型部署
最前沿的大模型训练部署实践手册
华为
服务器
ai
人工智能
AIGC
通义灵码全新上线模型选择功能,新增支持 DeepSeek-V3 和 DeepSeek-R1 模型
与此同时,通义灵码也紧跟步伐,全新上线模型选择功能,支持基于百炼的DeepSeek-V3和DeepSeek-R1满血版
671B
模型,为AI编程领域注入新活力。
阿里云云原生
·
2025-02-15 02:34
阿里云
云原生
AI程序员
通义灵码
通义灵码全新上线模型选择功能,新增支持 DeepSeek-V3 和 DeepSeek-R1 模型
与此同时,通义灵码也紧跟步伐,全新上线模型选择功能,支持基于百炼的DeepSeek-V3和DeepSeek-R1满血版
671B
模型,为AI编程领域注入新活力。
TONGYI_Lingma
·
2025-02-13 22:54
阿里云
云原生
AI程序员
通义灵码
DeepSeek V3 两周使用总结
官方宣称:(1)基于自研的MoE模型和
671B
参数,在14.8Ttoken上进行了预训练;(2)多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405
AI生成曾小健
·
2025-02-12 11:12
LLM大语言模型
Deepseek原理与使用
人工智能
完整的
671B
R1塞进本地,详尽教程来了!
李锡涵DatawhaleDatawhale干货作者:李锡涵,编译:机器之心本文作者:李锡涵(XihanLi)作者简介:伦敦大学学院(UCL)计算机系博士研究生,谷歌开发者专家,主要研究方向为学习优化,在NeurIPS、ICLR、AAMAS、CIKM等会议发表过学术论文,CircuitTransformer作者,图书《简明的TensorFlow2》(https://tf.wiki)作者过年这几天,D
·
2025-02-08 10:08
datawhale
运行 Deepseek 视觉模型的方法
推荐文章《24GBGPU中的DeepSeekR1:UnslothAI针对
671B
参数模型进行动态量化》权重1,DeepSeek类《在RaspberryPi上运行语音识别和LLaMA-2GPTWhisperASR
知识大胖
·
2025-02-05 13:30
NVIDIA
GPU和大语言模型开发教程
deepseek
人工智能
Codeforces
671B
Robin Hood 二分答案
B.RobinHoodtimelimitpertest1secondmemorylimitpertest256megabytesinputstandardinputoutputstandardoutputWeallknowtheimpressivestoryofRobinHood.RobinHooduseshisarcheryskillsandhiswitstostealthemoneyfromr
HARD_UNDERSTAND
·
2020-09-16 11:35
Codeforces
二分/三分
想法题
codeforces
上一页
1
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他