E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
确定性推理
DeepSeek-V3/R1上线背后的超低
推理
成本技术揭秘
百度智能云针对此次模型上线提供了行业领先的超低
推理
价格,低至DeepSeek官方刊例价3-5折,当前还可享受限时免费服务。
·
2025-02-11 11:33
百度算法
『大模型笔记』国外大神对DeepSeek R1的科普!
时间线
推理
与Agent
推理
模型≠Agent
推理
为什么重要
推理
需要变得廉价R1的重要意义AI的发展走势预训练规模扩张的路走不通了
推理
阶段的规模定律缩小模型体量(新的规模定律?)强化学习(新的规模定律?)
AI大模型前沿研究
·
2025-02-11 09:02
大模型笔记
笔记
Deepseek
deepseek
R1
Deepseek
v3
GPT
O1
GPT
O3
2025年Python领域最新国际动态与技术趋势解析(截至2025年2月)
一、AI与Python的深度融合:从模型部署到开发工具OpenAI与谷歌的模型竞赛OpenAI近期推出的免费
推理
模型o3-mini在数学代码生成和物理模拟领域表现突出,尤其在Python生态中,开发者可通过
虫洞没有虫
·
2025-02-11 08:57
Python资讯
python
开发语言
人工智能(Artificial Intelligence,简称AI)
这些任务包括学习、
推理
、问题解决、感知、语言理解等。人
Kingdom_Garden
·
2025-02-11 07:50
人工智能
AI知识库和全文检索的区别
1、AI知识库的作用AI知识库是基于人工智能技术构建的智能系统,能够理解、
推理
和生成信息。
xixingzhe2
·
2025-02-11 07:44
AI
人工智能
2025清华:DeepSeek从入门到精通.pdf(附下载)
DeepSeek是一家中国科技公司,专注于通用人工智能(AGI)的研发,其开源
推理
模型DeepSeek-R1在处理复杂任务方面表现出色,并且可以免费商用。
AI方案2025
·
2025-02-11 04:55
DeepSeek
一文搞定多种Deepseek R1 部署方法,总有一款适合你
它不仅在数学、编程、自然语言
推理
等任务上全面对标甚至超越了OpenAI的o1,而且训练成本仅
sznormal
·
2025-02-11 04:21
人工智能
【AI学习】DeepSeek为什么强?
四个方面:模型的智能水平、训练成本、
推理
成本和用户体验。一、DeepSeek的智能水平DeepSeekV3的智能水平,技术报告展现的性能对比图:是什么导致了DeepSeek的模型性能,是模型架构吗?
bylander
·
2025-02-11 03:17
AI学习
人工智能
学习
gpt
开启AI视觉
推理
新篇章:阿里云通义千问QVQ-72B-Preview模型深度解析
近年来,人工智能领域取得了显著进展,其中多模态
推理
模型的兴起尤为引人注目。这些模型能够理解和处理多种类型的信息,例如文本、图像和视频,从而实现更高级别的智能。
·
2025-02-11 03:57
前端
【LangChain编程:从入门到实践】构建记忆系统
【LangChain编程:从入门到实践】构建记忆系统关键词:LangChain,编程范式,记忆系统,对话系统,AI,NLP,知识库,
推理
1.背景介绍在人工智能领域,对话系统的研究与应用已经取得了显著的进展
杭州大厂Java程序媛
·
2025-02-11 01:57
DeepSeek
R1
&
AI人工智能与大数据
java
python
javascript
kotlin
golang
架构
人工智能
AI 场景下,函数计算 GPU 实例模型存储最佳实践
作者:有松当前,函数计算FC已被广泛应用在各种AI场景下,函数计算支持通过使用容器镜像部署AI
推理
应用,并且提供多种选项来访问训练好的模型。
·
2025-02-10 23:53
云原生
【AI论文】LIMO:
推理
中少即是多
摘要:我们提出了一项重大发现,这一发现挑战了我们对大型语言模型中复杂
推理
能力涌现方式的理解。传统观点认为,复杂的
推理
任务需要大量的训练数据(超过10万例)。
东临碣石82
·
2025-02-10 16:55
人工智能
互联网企业线上业务拓展与开源AI智能名片2+1链动模式S2B2C商城小程序的创新应用
然而,这一过程充满了挑战与不
确定性
,互联网泡沫的破灭使企业深刻反思,开始关注用户价值的实现。在此背景下,“开源AI智能名片2+1链动模式S2B2C商城小程序”应运而生,成为互联网企业转型升
说私域
·
2025-02-10 16:51
人工智能
小程序
开源
荣耀已接入DeepSeek-R1,荣耀手机系统版本MagicOS8.0及以上用户可用
以下是关于这一事件的详细介绍:DeepSeek-R1的强大能力DeepSeek-R1是一款先进的语言模型,具备强大的自然语言处理能力、逻辑
推理
能力和上下文理解能
2501_90444774
·
2025-02-10 14:10
人工智能
virtualenv
tornado
scikit-learn
智能手机
DeepSpeed 在三台T4卡上部署deepseek-r1:32b
如果你只需要使用DeepSpeed在三台T4卡上部署deepseek-r1:32b模型进行
推理
,而不进行训练,可以按照以下步骤进行部署。
推理
部署的重点是利用多台机器和多块GPU来加速模型的
推理
过程。
MonkeyKing.sun
·
2025-02-10 14:33
deepspeed
模型
deepseek和chatgpt能力对比
它的能力在一些评测中表现良好,特别是在中文理解、数学
推理
和代码能力方面。
分享是一种传递,一种快乐
·
2025-02-10 12:51
chatgpt
华为云 + 硅基流动搭建满血版 Deepseek-R1 部署指南
而华为云与硅基流动联合推出的基于昇腾云服务的DeepSeekR1
推理
服务,更是为大家带来了更优的使用体验和部署方案。今天,我就来详细介绍一下如何基于华为云与硅基流动部署满血版Deepseek-R1。
Vincent_Han
·
2025-02-10 12:20
华为云
Deepseek
硅基流动与华为云联合推出基于昇腾云的DeepSeek R1&;V3
推理
服务
经过硅基流动和华为云团队连日攻坚,现在,双方联合首发并上线基于华为云昇腾云服务的DeepSeekR1/V3
推理
服务。
光锥智能
·
2025-02-10 12:14
华为云
谈大语言模型动态思维流编排
但是就目前而言,这种分析,
推理
能力还是不能能准确地做出
推理
另一方面,对于大多数特定的问题而言,人类本身具有了成熟,有效的分析问题
姚家湾
·
2025-02-10 10:31
语言模型
人工智能
自然语言处理
自动驾驶新风口:DeepSeek-R1 的“车端革命”
DeepSeek-R1模型是一个开源
推理
模型,可以随意蒸馏形成小模型,那么这种模型,对未来任何产业都能够产生很大的影响。那么我们汽车行业的智能驾驶/自动驾驶呢?
大模型入门学习
·
2025-02-10 07:30
自动驾驶
人工智能
机器学习
DeepSeek
大模型
大模型教程
大模型入门
IFPP-02
COVID-19之后,出现了明显的回流(onshoring)趋势,这是由多种因素驱动的,包括供应链中断、地缘政治紧张和贸易不
确定性
。2.
SofterICer
·
2025-02-10 06:49
eSIM
服务器
什么是AI人工智能
首先,AI指的是让计算机系统能够执行人类智慧任务,比如学习、
推理
和决策的能力。就像我们人类一样,它们可以通过数据进行分析,做出判断。但它们是如何工作的呢?
西洲啊
·
2025-02-10 03:57
AI
人工智能
DeepSeek:如何表达需求
表达公式:目标+选项+评估标准适配策略:
推理
模型:要求AI进行逻
小稻草打打打
·
2025-02-10 00:31
AI相关
人工智能
多头注意力机制的创新优化:MLA架构解析
摘要MLA(Multi-headLatentAttention)架构是对Transformer模型中多头注意力(MHA)结构的创新优化,旨在提高
推理
阶段的效率并降低资源消耗。
耶耶Norsea
·
2025-02-09 23:22
网络杂烩
Deepseek
片段阅读:行测高分的关键突破口
在公务员考试的行测科目中,片段阅读占据着举足轻重的地位,它不仅题量可观,更是对考生阅读理解、归纳概括、逻辑
推理
等综合能力的全方位考查。
张小小大智慧
·
2025-02-09 23:21
行测
行测
解锁DeepSeek大模Q型:超实用提示词技巧大放送
DeepSeek大模型简介DeepSeek是由深度求索(DeepSeekInc.)团队开发的大型预训练语言模型,以其高效
推理
、多模态融合及对垂直领域的深度优化而著称。
计算机学长
·
2025-02-09 20:04
通用大语言模型
人工智能
DeLLMa框架:优化复杂决策的新路径
标题:DeLLMa框架:优化复杂决策的新路径文章信息摘要:DeLLMa框架通过整合大型语言模型(LLMs)和结构化数据,优化了在不
确定性
条件下的决策过程,特别是在处理复杂决策问题时,能够增强决策的严谨性和精确性
XianxinMao
·
2025-02-09 16:07
人工智能
模型 反脆弱
从不
确定性
中获益。1反脆弱模型的应用1.1钛方科技的智能化转型与反脆弱能力构建钛方科技成立于2015年,是一家专注于智能触觉技术研发与产业化应用的科技型中小企业。
图王大胜
·
2025-02-09 15:32
思维模型
人工智能
决策
团队管理
认知
企业发展
战略规划
交叉熵和它的朋友
交叉熵与熵的关系熵用于衡量随机变量的不
确定性
,定义为:H(P)=−∑iP(i)logP(i)H(P)=-\sum_{i}
Jamence
·
2025-02-09 15:59
AI数学知识
人工智能
语言模型
chatgpt
数学与光学:光的传播和干涉的数学描述
文章将结合数学公式和编程实例,提供清晰的逻辑
推理
和分析过程,以帮助读者更好地理解和掌握这些核心概念。目录大纲《数学与光学
AI天才研究院
·
2025-02-09 14:22
计算
ChatGPT
DeepSeek
R1
&
大数据AI人工智能大模型
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
【Windows/C++/yolo开发部署03】将实例分割模型ONNX导出为 TensorRT 引擎:完整记录
CSDN文库目录写在前面环境准备1.使用trtexec将ONNX模型转换为TensorRT引擎2.验证TensorRT引擎2.1TensorRT版本2.2GPU信息2.3TensorRT引擎信息2.4
推理
请求
认识祂
·
2025-02-09 13:42
CV计算机视觉
Ultralytics
yolo
实例分割
模型部署
DeepSeek-R1 原理解析及 Linux 本地部署详细教程
一、引言DeepSeek-R1作为幻方量化旗下大模型公司DeepSeek研发的系列
推理
模型,2025年横空出世,被誉为国运级产品。
power-辰南
·
2025-02-09 12:05
人工智能
linux
deepseek
大模型
语言模型
人工智能
蒸馏:让DeepSeek用“移魂大法”增强你的小模型
在DeepSeekR1的技术报告中,使用DeepSeek-R1生成的
推理
数据,微调了几个广泛使用的开源模型。评估结果表明,蒸馏后的较
AI生成曾小健
·
2025-02-09 11:58
Deepseek原理与使用
人工智能
大话商品模型
商品模型术语名词解释达尔文体系是天猫发起的一套全新的商品管理体系,它不同于淘宝原来的分类法(基于类目属性体系)的管理思路,而是以最细粒度的产品节点(CSPU)为核心,使用系统和运营机制的方式维护一套丰富、准确的产品库,通过产品实现聚合、管控商品,以确保商品信息的
确定性
云夢南行
·
2025-02-09 10:56
java
混合专家模型 (MoE) 最全详细图解
在本篇博文中,我们将深入探讨MoEs的核心组件、训练方法,以及在
推理
过程中需要考量的各种因素简短总结混合专家模型(MoEs):与稠密模型相比,预训练速度更快与具有相同参数数量的模型相比
DFCED
·
2025-02-09 10:23
人工智能算法前沿
AIGC算法学术工业技术前沿
混合专家网络
MOE
DeepSeek
人工智能
深度学习
大模型
DeepSeek-V3 技术报告 (核心技术,接近5万字)
为了实现高效的
推理
和成本效益的训练,DeepSeek-V3采用了Multi-headLatentAttention(MLA)和DeepSeekMoE架构,这些架构在DeepSeek-V2中得到了彻底验证
zhangjiaofa
·
2025-02-09 10:21
DeepSeek
R1&
AI人工智能大模型
DeepSeek
V3
DeepSeek-V3 Technical Report
2架构2.1基本架构2.2多token预测3基础设施3.1计算集群3.2训练框架3.2.1双管和计算通信重叠3.2.2跨节点全对全通信的高效实现3.2.3以最小的开销节省大量内存3.3FP8训练3.4
推理
和部署
UnknownBody
·
2025-02-09 08:35
LLM
Daily
Technical
Report
人工智能
语言模型
自然语言处理
14.4K+ Star!GPT Researcher:一个基于AI的智能研究助手
GPTResearcher的设计灵感来源于最新的Plan-and-Solve和RAG论文,目标是解决错误信息、速度、
确定性
和可靠性问题,通过并行化智能体工作而不是同步
鱼满满记
·
2025-02-09 07:00
AI应用
Github项目
python
人工智能
ai
一文搞懂DeepSeek - 开源模型R1
DeepSeek-R1作为一款开源的大型语言模型,在数学、编程和
推理
等多个任务上表现出了强大的性能。
程序员辣条
·
2025-02-09 01:12
开源
人工智能
Agent
大模型
大模型教程
大模型项目
DeepSeek
DeepSeek使用技巧,强烈建议收藏
前言在AI技术飞速发展的当下,DeepSeek作为国产大模型的佼佼者,凭借免费使用、开源生态以及行业领先的
推理
能力,成为了众多用户的智能得力助手。
suyukangchen
·
2025-02-09 00:37
DeepSeek
ai
多厂商宣布接入DeepSeek,迅易科技能帮助客户按需实现数智化革新
2025年伊始,国产高性能AI
推理
模型DeepSeek在全球AI领域掀起了一股热潮,凭借其卓越的多场景理解与生成能力迅速“出圈”,不仅彻底改写了全球AI应用市场的格局,也为AI技术的未来发展路径树立了新的标杆
·
2025-02-08 19:59
多厂商宣布接入DeepSeek,迅易科技能帮助客户按需实现数智化革新
2025年伊始,国产高性能AI
推理
模型DeepSeek在全球AI领域掀起了一股热潮,凭借其卓越的多场景理解与生成能力迅速“出圈”,不仅彻底改写了全球AI应用市场的格局,也为AI技术的未来发展路径树立了新的标杆
·
2025-02-08 19:58
什么叫鲁棒性?
一个具有鲁棒性的系统或算法能够在面对不
确定性
、异常情况或意外输入时仍然保持良好的性能和效果。具体来说,鲁棒性可以表现为以下几个方面:健壮性:鲁棒性可以体现在系统或算法对于异常或无效输入的处理能力。
众乐乐_2008
·
2025-02-08 13:49
日常代码
java
DeepSeek-V3 横空出世:
推理
速度飙升,开源模型新王者诞生!
这款模型不仅在
推理
速度上实现了质的飞跃,更是在主流榜单中与世界上最先进的闭源模型平分秋色,甚至位列开源模型榜首!
霍格沃兹测试开发学社
·
2025-02-08 13:47
开源
deepseek
大语言模型
人工智能
测试用例
测试工具
python
大语言模型多token预测技术
传统的基于下一个token预测的训练方法虽简单有效,但在获取语言、世界知识和
推理
能力方面效率不高。
deepdata_cn
·
2025-02-08 09:21
NLP
语言模型
人工智能
自然语言处理
【AIGC魔童】DeepSeek v3
推理
部署:DeepSeek-Infer/ModelScope/ollama
【AIGC魔童】DeepSeekv3
推理
部署:DeepSeek-Infer/ModelScope/ollama(1)快速使用(2)
推理
部署2.1使用DeepSeek-Infer部署DeepSeek2.2
LeeZhao@
·
2025-02-08 09:47
DeepSeek
v3专栏
AIGC
人工智能
面试
自然语言处理
语言模型
ChatGPT入门- GPT 4.0 新手使用手册(结合案例讲解)
2.上下文保持与逻辑
推理
:相比于前几代模型,GPT4.0在对话过程中能够更好地保持上下文的连续性,并进行逻辑
推理
。这意味着用户可以与它进行更深入的对话,而不必担心模型丢失之前的上下文信息。
玩AI的小胡子
·
2025-02-08 09:42
chatgpt
gpt
人工智能
AIGC
【Ollama+Deepseek】本地化部署运行Deepseek模型
一、前言最近国内的深度求索公司发布的DeepSeek-r1
推理
模型,其凭借强大的
推理
能力、擅长复杂任务、低成本以及开源等优势,短时间内迅速成为了全球AI领域的焦点。
·
2025-02-08 06:32
DeepSeek-R1深度报告:基于Python强化学习的前沿长链
推理
模型揭秘与实战——兼谈SEO优化与实用经验分享
【DeepSeek-R1深度报告:基于Python强化学习的前沿长链
推理
模型揭秘与实战——兼谈SEO优化与实用经验分享】配合此文章使用,效果更佳:DeepSeek-R1深度报告——50道相关面试题——深刻理解相关概念
快撑死的鱼
·
2025-02-08 05:19
算法工程师面试宝典(面试必备)
python
搜索引擎
开发语言
DeepSeek模型与OpenAI模型原理和技术架构的异同分析
OpenAI模型原理和技术架构的异同分析一、模型原理(一)DeepSeekR1DeepSeekR1的核心原理是基于强化学习(RL)的训练方式,其创新之处在于不依赖任何监督微调(SFT)数据,仅通过强化学习实现
推理
能力的自主进化
程序猿000001号
·
2025-02-08 04:10
DeepSeek
大模型
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他