E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
推理
DeepSeek 各版本的区别
训练数据:14.8万亿Token预训练,
推理
速度较快(每秒
dushky
·
2025-03-05 12:25
ai
语言模型
AI编程
Efficient Large Language Models: A Survey
高效的大型语言模型综述摘要1引言2模型为中心的方法3数据为中心的方法4LLM框架5结论摘要大型语言模型(LLM)在自然语言理解、语言生成和复杂
推理
等重要任务中表现出了非凡的能力,并有可能对我们的社会产生重大影响
UnknownBody
·
2025-03-05 09:00
Survey
Paper
语言模型
人工智能
自然语言处理
pytorch 模型测试
在使用PyTorch进行模型测试时,一般包含加载测试数据、加载训练好的模型、进行
推理
以及评估模型性能等步骤。以下为你详细介绍每个步骤及对应的代码示例。
小赖同学啊
·
2025-03-05 07:24
人工智能
pytorch
人工智能
python
2025年初-值得关注的几款
推理
模型
1Claude3.7SonnetClaude3.7Sonnet是由AI研究公司Anthropic开发的最新混合
推理
模型,于2025年2月24日发布。
数据分析能量站
·
2025-03-05 01:24
机器学习
人工智能
大语言模型原理与工程实践:大语言模型
推理
工程
推理
加速:算子优化
其中,
推理
(Inference)过程是大语言模型的核心环节之一。然而,随着模型规模的不断扩大,
推理
过程中的计算复杂度和延时也逐渐成为制约模型应用的重要因素。
AI天才研究院
·
2025-03-04 22:32
计算
DeepSeek
R1
&
大数据AI人工智能大模型
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
大模型
推理
速度测评的实战代码
今天给大家带来的文章是大模型
推理
速度测评的实战代码,希望能对学习大模型的同学们有所帮助
herosunly
·
2025-03-04 21:59
大模型
推理速度
人工智能
实战代码
AI边缘处理设备怎么合理分配宽带和运行资源
边缘设备通常面临有限的资源,但需要处理大量的数据流和计算任务,尤其是在AI
推理
和实时数据处理的场景下。
码农的日常搅屎棍
·
2025-03-04 19:42
嵌入式硬件
深度学习
神经网络
Deepseek的底层架构思维构成
通过低秩联合压缩技术,将键(Key)和值(Value)矩阵压缩到潜在空间,显著减少
推理
时的显存占用。例如,MLA可将显存需求降至传统多头注意力(MHA)的个位数百分比。
堕落年代
·
2025-03-04 19:09
AI
架构
人工智能
蚂蚁技术研究院发布
推理
大模型强化学习框架,邀请开发者共同助力 AGI 生态
AReaL源自开源项目ReaLHF,旨在训练每个人都可以复现和贡献的大型
推理
模型(LRM)。AReaL是蚂蚁技术研究院为开发一个完全开放和包容的AGI世界迈出的一步。
·
2025-03-04 10:52
开源开源项目介绍
北大版,86页DeepSeek黑科技手册!比清华版更炸裂(免费下载)
这份文档刚在学术圈炸锅,作为国内首个系统性拆解
推理
大模型(DeepSeek-R1)落地方案的公开资料,其价值不仅在于揭示了一款国产模型的工程实践,更折射出大模型技术从实验室走向产业化的关键路径。
2501_90850230
·
2025-03-04 09:55
素材资源
人工智能
DeepSeek
科技
人工智能
小白也能十分钟打造自己的
推理
大模型!unsloth+Colab+DeepSeek-R1-Distill-Llama-8B轻松上手
小白也能十分钟打造自己的
推理
大模型!
AI超元域
·
2025-03-04 07:08
sql
llama
数据库
ai
人工智能
AI编程
私有部署 ChatGLM3-6B
1.在AutoDL平台上租赁GPUGPU型号:RTX4090PyTorch版本:2.5.1**(推荐使用2.0及以上的版本,以获得最佳的
推理
性能)**2.开启学术资源加速source/etc/network_turbo3
张申傲
·
2025-03-04 03:16
langchain
人工智能
aigc
chatgpt
ai
DeepSeek-OpenSourceWeek-第六天-Inference System Overview
开源周的第6天,DeepSeek对DeepSeek-V3/R1
推理
系统进行了深入概述。本文将深入探讨该系统的设计原则、优化策略以及性能统计数据,重点突出在吞吐量和延迟优化方面取得的显著进展。
数据分析能量站
·
2025-03-04 01:57
机器学习
人工智能
DeepSeek-R1:通过强化学习激励大型语言模型的
推理
能力
摘要我们介绍了第一代
推理
模型DeepSeek-R1-Zero和DeepSeek-R1。
AI专题精讲
·
2025-03-03 22:05
大模型专题系列
语言模型
人工智能
自然语言处理
清华「DeepSeek从入门到精通」正式发布!104页超全解析使用教程
还有些用的是chatGPT的训练方式,要知道,DeepSeek和chatGPT是两种模型,一个是
推理
型,一个是指令型,这是驴唇不对马嘴啊。
职场程序猿
·
2025-03-03 18:28
deepseek
ai
数据挖掘与数据分析的区别是什么
从分析的过程来看,数据分析更侧重于统计学上面的一些方法,经过人的
推理
演译得到结论;数据挖掘更侧
中琛源科技
·
2025-03-03 17:24
GPT-4.5
通过扩展无监督学习,GPT-4.5增强了识别模式、建立联系和创造性洞察的能力,尽管它并不是专门为
推理
任务设计的。早期测试者表示,与GPT-4.5交互的
开发者每周简报
·
2025-03-03 15:38
人工智能
本地部署大语言模型-DeepSeek
DeepSeek是国内顶尖AI团队「深度求索」开发的多模态大模型,具备数学
推理
、代码生成等深度能力,堪称"AI界的六边形战士"。
NightReader
·
2025-03-03 15:36
语言模型
人工智能
自然语言处理
DeepSeek-R1 技术报告解读:用强化学习激发大模型的
推理
潜能
文章目录1.背景2.DeepSeek-R1训练流程2.1DeepSeek-R1-Zero:纯强化学习2.2DeepSeek-R1:冷启动+多阶段训练3.蒸馏小模型3.1蒸馏流程与优势3.2蒸馏vs.直接RL4.实验结果4.1主模型表现4.2蒸馏模型表现5.关键创新与思考6.总结参考链接**导读:**DeepSeek-R1是近期发布的一款开源大模型,它将纯强化学习与多阶段训练策略相结合,大幅提升了模
跑起来总会有风
·
2025-03-03 14:04
ai
AI编程
论文阅读
让 DeepSeek 更“聪明”:一键解析 PDF 和 Word 文档的 GUI 小工具,轻松处理复杂文档
DeepSeek-r1:1.5b是一款强大的语言模型,能够根据输入的自然语言进行
推理
和生成,但其原生本地部署环境并不支持直接上传文档进行解析。
Python测试之道
·
2025-03-03 12:10
测试提效
python
python
人工智能
测试用例
在 MacBook 上设置 DeepSeek R1 (8B) 的 3 个步骤
简介DeepSeek最近发布了R1模型,该模型在本地AI
推理
方面表现出色。如果您希望在MacBook上运行它,Ollama提供了一种无缝的方式来下载和管理模型。
知识大胖
·
2025-03-03 11:04
NVIDIA
GPU和大语言模型开发教程
deepseek
ollama
openwebui
测试工程师必备!多格式接口用例结合deepseek生成工具完整实现与实战验证
为了解决这一问题,本文将实现一款基于PyQt5的多格式接口用例生成工具,支持从文档导入到解析、
推理
生成、导出等全流程功能。
Python测试之道
·
2025-03-03 10:00
python
测试提效
python
deepseek
YOLO 中 SPFF 模块的优化与 Focal Modulation 替代研究
FocalModulation替换SPPF4.实验与对比分析4.1代码替换YOLO模型中的SPPF4.2训练对比5.AblationStudy(消融实验)5.1不同模块的对比实验5.2目标尺寸对比分析6.模型部署与
推理
优化
向哆哆
·
2025-03-03 10:57
YOLO
yolov8
DeepSeek-R1:重新定义
推理
性能的开源人工智能
挑战与未来方向影响与愿景2025年1月20日–DeepSeek推出了DeepSeek-R1,这是一款突破性的开源人工智能
推理
模型,旨在与OpenAI的o1等专有对手竞争。该模型在M
知识小报童
·
2025-03-03 08:11
DeepSeek前言内容整理
开源
人工智能
深度学习
机器学习
神经网络
自然语言处理
语言模型
本地部署 DeepSeek-R1-671B 满血版大模型
DeepSeek-R1大模型具备深度思考和
推理
能力,在数学、代码、自然语言
推理
等任务上都有着极大的提升。
Physicaloser
·
2025-03-03 07:05
人工智能
人工智能
语言模型
ai
超越GPT-4o!开源大模型DeepSeek满血版部署实战指南
自2024年12月DeepSeek发布对标GPT-4o的v3版本以来,其数学与代码
推理
能力已实现显著超越;而2025年1月推出的r1版本更是在多项基准测试中与GPT-4o的o1版本平分秋色。
剑圣土豆
·
2025-03-03 07:34
大模型部署
开源
自然语言处理
人工智能
Svelte 开发 AI 应用:高效轻量级前端框架的 AI 集成探索
本文将探讨如何利用Svelte构建高效的AI应用,包括AIAPI集成、前端
推理
优化、可视化分析、Web组件开发等关键
赵大仁
·
2025-03-03 06:57
大语言模型
前端
AI
人工智能
前端框架
DeepSeek R1:揭示适度思考在信息处理中的关键作用
摘要DeepSeekR1是一款先进的大型
推理
模型,研究发现其在信息过载时性能显著下降。当减少过度思考,即不过度分析信息时,DeepSeekR1的计算成本可降低43%。
耶耶Norsea
·
2025-03-03 05:21
网络杂烩
人工智能
大模型隐空间
推理
论文阅读笔记
TrainingLargeLanguageModelstoReasoninaContinuousLatentSpace一.简介机构:Meta代码:任务:特点:方法:1.1摘要现状:大语言模型往往局限在“languagespace"进行
推理
猴猴猪猪
·
2025-03-03 03:57
AIGC
python
实验记录
人工智能
深度学习
《AI大模型开发笔记》DeepSeek技术创新点
革命性的上下文处理机制实现长文本
推理
成本断崖式下降,综合算力需求锐减90%,开启高效AI新纪元!
Richard Chijq
·
2025-03-03 03:57
AI大模型开发笔记
人工智能
笔记
【AI大模型应用开发】精读ToT:论文到源码,看透ToT思维树的实现流程
上篇文章(【AI大模型应用开发】从CoT到ToT,再到ReAct,提升大模型
推理
能力的方式探索(含代码))我们学习了当下提高大模型
推理
能力的几个主要技术,从CoT(ChainofThought)到TOT
同学小张
·
2025-03-03 02:24
大模型
笔记
经验分享
人工智能
AIGC
思维树
大模型
如何掌握deepseek的
推理
思路:3个高级AI指令技巧,小白也能轻松上手!
不是新模型发布,也不是算力升级,而是Deepseek——这类AI学会像人类一样
推理
。但是有时候,Deepseek的
推理
你会觉得还不够?
小机学AI大模型
·
2025-03-03 01:13
小机带您AI入门(提示词)
人工智能
全民AI入门清华大学 deepseek 从入门到精通 pdf 免费下载
•DeepSeek-R1是其开源的
推理
模型,擅长处理复杂任务且可免费商用。下载地址:链接:https://pan.quark.cn/s/b2e0b986332a提取码:4XNy
宇飞林海
·
2025-03-02 23:30
人工智能
pdf
小白也能十分钟打造自己的
推理
大模型!unsloth+Colab轻松上手
简介:DeepSeek-R1-Distill-Llama-8B是一个基于Llama架构的8B参数语言模型,经过深度蒸馏(distillation)处理,旨在提高
推理
效率和精度。
X.Cristiano
·
2025-03-02 23:28
DeepSeek-R1
Llama-8B
sql2text
人工智能
北京大学:2本手册,拓展AI应用深度与广度
深入剖析DeepSeek-R1在复杂逻辑
推理
、数学和编程任务中的优异表现,揭示其在
推理
密集型任务、教育、科研、知识应用和文档分析等领域的独特优势,为AIGC领域的从业者和爱好者提供了深入了解DeepSeek
2501_90766876
·
2025-03-02 21:48
pdf
基于阿里云PAI平台快速部署DeepSeek大模型实战指南
在多项国际评测中,DeepSeek-R1模型在
推理
能力、多语言支持和长上下文处理(最高128K)方面表现卓越,尤其在企业级场景中展现出以下优势:高性能
推理
:单张A10显卡即可部署7B参数模型,
推理
速度提升
硅基打工人
·
2025-03-02 14:19
AI
阿里云
云计算
经验分享
人工智能
java
spring
spring
boot
SQL-o1:一种用于Text-to-SQL的自奖励启发式动态搜索方法
为了解决这些问题,我们提出了SQL-o1,一种基于自奖励的启发式搜索方法,旨在增强LLMs在SQL查询生成中的
推理
能力。SQL-o1结合了蒙特卡洛树搜索(MCTS)进行过程级
数之何
·
2025-03-02 12:25
人工智能
ai
语言模型
sql
Deepseek相关梳理
11月20日,
推理
模型DeepSeek-R1-Lite预览版上线。12月26日,DeepSeek-V3首个版本上线并开源。2025年1月20日,正式发
stars and seas
·
2025-03-02 11:50
人工智能
DeepMind首席科学家最新万字访谈:模型「慢思考」,能力大幅提升!
JackRae指出,
推理
模型是AI发展的新范式,
推理
模型并非追求即时响应,而是通过增加
推理
时的思考时间来提升答案质量,这导致了一种新的ScalingLaw,“慢思考”模式是提升AI性能的有效途径。
·
2025-03-02 09:43
datawhale
边缘AI
推理
模型更新的秘密武器——Nginx的在线升级魔法
在当今快速发展的物联网和边缘计算时代,如何确保部署于边缘节点上的AI
推理
模型能够及时、高效地进行在线更新,成为了技术团队面临的一项重要挑战。
墨夶
·
2025-03-02 08:25
Nginx学习资料1
人工智能
nginx
运维
【模型部署】大模型部署工具对比:SGLang, Ollama, VLLM, LLaMA.cpp如何选择?
以下是对比分析:性能VLLM(VirtualTensorLanguage):VLLM是一个高性能的
推理
库,特别适用于长序列任务。
深度求索者
·
2025-03-02 08:19
llama
人工智能
穿越AI边界:深度集成DeepSeek API与云平台的实践之路
DeepSeek作为一款领先的大型语言生成模型,凭借其强大的
推理
和生成能力,已经被越来越多的开发者和行业专家所青睐。
云边有个稻草人
·
2025-03-02 07:45
热门文章
人工智能
DeepSeek
大数据
集成DeepSeek
API
DeepSeek算法
阿里云百炼平台集成
【llm对话系统】 LLM 大模型
推理
python实现:vLLM 框架
在LLM的应用中,
推理
(Inference)阶段至关重要。它指的是利用训练好的LLM模型,根据输入(Prompt)生成文本的过程。
kakaZhui
·
2025-03-02 06:06
人工智能
AIGC
chatgpt
python
llama
Python vLLM 实战应用指南
参数说明4.实战应用场景4.1构建聊天机器人示例对话:4.2文本补全输出示例:4.3自定义模型服务启动服务调用服务5.性能优化5.1GPU加速5.2动态批处理6.总结vLLM是一种高性能的开源深度学习
推理
引擎
ghostwritten
·
2025-03-02 06:34
python
python
开发语言
DeepSeek R1 详解:思维链、强化学习和蒸馏
Deepseek的基准在
推理
任务(数学、编码和科学)
前网易架构师-高司机
·
2025-03-02 05:58
2025年最新-深度学习+AI
DeepSeek和AI工具
深度学习
Deepseek
硅基流动:免费领取2000万Token,畅享AI大模型盛宴!
其核心团队来自清华大学、MIT等顶尖高校,致力于为企业和开发者提供高性能的AI模型
推理
和训练解决方案。
·
2025-03-02 01:05
ai开发
如何更加优雅提问:浅谈提示词
ISO/IEC23894人工智能系统工程标准第一步:理论基础构建目标:通过结构化分析与实践验证,提升提示词设计的精准度、可控性与生成效率一、提示词设计的核心方法论分阶目标拆解基础层:明确任务类型(生成、
推理
愚戏师
·
2025-03-01 23:42
语言模型
人工智能
自然语言处理
基于问答对的实体识别和意图识别的知识图谱问答
推理
问答对数据questionanswer省直医保的参保范围是什么?中央直属、省直属在哈尔滨的机关、事业单位、社会团体及其职工和退休人员。参加省直医保的单位缴费基数如何确定和缴纳?在职职工(以下简称职工)个人月缴费基数按本人上年度月平均工资确定,由单位代扣代缴,用人单位月缴费基数按本单位参保职工个人月缴费基数之和确定。缴费费率:用人单位8%(含生育0.5%)、职工个人2%。缴费方式:用人单位、职工按月
风清扬【coder】
·
2025-03-01 21:04
自然语言分析处理
知识图谱
人工智能
自然语言处理
英特尔开发板试用:结合OAK深度相机进行评测
最近英特尔官方发布了一篇文章:主要介绍了如何将英特尔开发板(小挪吒)与OAK深度相机结合使用,并通过OpenVINO™工具套件进行开发和性能评测OAK相机:作为深度数据采集的核心设备,其深度测距功能与OpenVINO™
推理
相结合
OAK中国_官方
·
2025-03-01 20:56
数码相机
第十五个问题-什么是CoT?
Chain-of-Thought(CoT)思维链技术详解一、核心概念Chain-of-Thought(思维链)是一种通过引导大语言模型展示逐步
推理
过程来提升复杂问题解决能力的技术。
释迦呼呼
·
2025-03-01 20:53
AI一千问
算法
人工智能
语言模型
机器学习
深度学习
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他