E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
确定性推理
如何在VSCode中免费使用DeepSeek R1:本地大模型编程助手全攻略
1.1开源的
推理
王者1.2性能实测对比二、三步搭建本地AI编程环境2.1硬件准备指南2.2三大部署方案详解方案一:LMStudio(新手友好)方案二:Ollama(Docker玩家首选)方案三:Jan(
tamak
·
2025-02-12 19:38
vscode
ide
编辑器
DeepSeek
最通俗易懂的方式,由浅入深地讲讲DeepSeek(深度求索)
简单说,DeepSeek是一家专注做通用人工智能(AGI)的中国公司,目标就是让AI能像人类一样理解、
推理
、解决复杂问题。
Jing_saveSlave
·
2025-02-12 19:07
AI
ai
chatgpt
AI编程
上海站 | 2025 Seeed x LeRobot 具身智能黑客松报名开启!
SeeedxLeRobot具身智能黑客松现邀请所有对在机器人领域训练模仿学习策略,并实时进行
推理
部署感兴趣的人,共同创造具有影响力的创新解决方案。
·
2025-02-12 18:01
人工智能hackthon
人工智能能否超过人类智能
论人工智能能否超过人类智能首先是智能的量纲问题:是逻辑、
推理
、抽象、想象、语言、情感、自我意识还是其它。
CaiGbro
·
2025-02-12 17:53
哲学思考
人工智能
普惠AI 如何在 Anolis OS 8 上部署生产可用的 DeepSeek
推理
服务
背景介绍DeepSeek-R1DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型
推理
能力。
·
2025-02-12 17:52
操作系统人工智能开源
DeepSeek-R1蒸馏技术:让小模型“继承”大模型的
推理
超能力
最近有不少朋友来询问Deepseek的核心技术,陆续针对DeepSeek-R1论文中的核心内容进行解读,并且用大家都能听懂的方式来解读。当大模型成为“老师”,小模型也能变“学霸”想象一下,一位经验丰富的数学老师(大模型)将自己解题的思维过程一步步拆解,手把手教给学生(小模型)。学生通过模仿老师的思路和技巧,最终也能独立解决复杂的题目——这就是“”模型蒸馏(Distillation)“”的核心思想。
马拉AI
·
2025-02-12 15:34
人工智能
机器学习
深度学习
pytorch深度学习模型
推理
和部署、pytorch&ONNX&tensorRT模型转换以及python和C++版本部署
目录1.采用pytorch进行
推理
2.采用onnx进行
推理
2.1pytorch转换为onnx2.2onnx
推理
3.采用tensorrt进行
推理
(python环境)3.1onnx转engine文件3.2tensorrt
机械心
·
2025-02-12 10:40
深度学习
python
pytorch
OpenAI重磅更新:发布目前最强
推理
模型ChatGPT-o1,新鲜测试出炉,草莓快要成熟了
这次更新标志着OpenAI在人工智能
推理
能力上的重大突破,推出了其最新的大语言模型——o1-preview和o1-mini。这一更新揭开了已经预热接近一年的“Q*/草莓项目”的神秘面纱。
机械心
·
2025-02-12 10:39
人工智能
chatgpt
人工智能
昇腾,Ascend,NPU,mindie,镜像,部署vllm:第4篇,尝试多模态大模型部署(Qwen2-vl)
(当然是在昇腾环境下)提示:需要把这篇文章先看一遍昇腾,mindie,镜像,部署vllm:第2篇,启动mindieservice_daemon服务,支持对Qwen2.5的7B版本的
推理
提示:本文章的撰写思路是
几道之旅
·
2025-02-12 10:36
Dify:智能体(Agent)
工作流
知识库
全搞定
Agent)
人工智能
策略泛化的无动作
推理
25年2月来自斯坦福的论文“Action-FreeReasoningforPolicyGeneralization”。端到端模仿学习为训练机器人策略提供一种有前途的方法。然而,泛化到新环境(例如未见过的场景、任务和目标实例)仍然是一项重大挑战。尽管大规模机器人演示数据集已显示出诱导泛化的潜力,但它们的规模化需要大量资源。相比之下,人类视频数据丰富多样,提供一种有吸引力的替代方案。然而,这些人类视频
硅谷秋水
·
2025-02-12 07:44
智能体
大模型
计算机视觉
人工智能
深度学习
机器学习
计算机视觉
语言模型
【通往通用人工智能AGI之路】第8章: 认知架构
AGI系统架构需要综合考虑认知、学习、
推理
、规划等多个方面,设计灵活、可扩展、鲁棒的系统框架;AGI系统实现需要针对不同的任务和场景,开发高效、可靠、可解释的算法和模型。
AI天才研究院
·
2025-02-12 06:04
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
大厂Offer收割机
面试题
简历
程序员读书
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
Java
Python
架构设计
Agent
程序员实现财富自由
手把手教学,DeepSeek-R1微调全流程拆解
手把手教学,DeepSeek-R1微调全流程拆解原创极客见识GeekSavvy2025年02月09日09:02广东DeepSeek通过发布其开源
推理
模型DeepSeek-R1颠覆了AI格局,该模型使用创新的强化学习技术
AI生成曾小健
·
2025-02-12 05:01
windows
开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机多卡-RTX 4090双卡(十五)
是一种有效的自适应策略,它不会引入额外的
推理
延迟,并在保持模型质量的同时显着减少下游任务的可训练参数数量。2.2.参数高效微调(PEF
开源技术探险家
·
2025-02-12 04:50
开源模型-实际应用落地
#
开源模型-微调实战密码
自然语言处理
深度学习
语言模型
对DeepSeek-R1通过强化学习提升大型语言模型
推理
能力的技术原理解析
•关键要素:包括环境(模型所处的
推理
任务场景)、状态(模型在
推理
过程中的当前情况,如已有的
推理
步骤、已知信息等)、动作(模型在当前状态下做出的
推理
决策,如选择何种
推理
方法、如何组织语言等)、奖励(根据模型的动作和结果给予的反馈
一只贴代码君
·
2025-02-12 02:12
语言模型
人工智能
自然语言处理
学习
AI编程
开发语言
模型轻量化
影响神经网络
推理
速度主要有4个因素:FLOPs、MAC、计算并行度、硬件平台架构与特性(算力、GPU内存带宽)模型压缩工业界主流的模型压缩方法有:知识蒸馏(KnowledgeDistillation,KD
莱茶荼菜
·
2025-02-11 22:10
人工智能
学习
时间序列分析 | Python实现时间序列不
确定性
建模
时间序列分析|Python实现时间序列不
确定性
建模目录时间序列分析|Python实现时间序列不
确定性
建模基本介绍研究方法概率分布建模分位数回归学习总结基本介绍基础的时间序列预测任务的目标是给定历史序列,
前程算法屋
·
2025-02-11 22:37
时间序列分析(Python)
不确定性建模
python
深度学习
机器学习
时间序列
数据分析
深度学习中模型轻量化及具体方案应用
模型轻量化的核心目标是提高
推理
速度、降低功耗、减少内存占用,以便在边缘设备上实现实时性或低延迟的响应。
码上就位
·
2025-02-11 22:36
深度学习
人工智能
大模型
推理
服务全景图
作者:望宸随着DeepSeekR1和Qwen2.5-Max的发布,国内大模型
推理
需求激增,性能提升的主战场将从训练转移到
推理
。由于无论是训练还是
推理
,如何提升性能都是业内讨论最多的话题之一。
·
2025-02-11 21:12
云原生阿里云
PID控制详解
控制简介PID(ProportionalIntegralDerivative)控制是最早发展起来的控制策略之一,由于其算法简单、鲁棒性好和可靠性高,被广泛应用于工业过程控制,尤其适用于可建立精确数学模型的
确定性
控制系统
鹿屿二向箔
·
2025-02-11 20:50
算法
换平台对比
推理
能力:DeepSeekR1强于Gemini2.0Flash
和Gemini2.0Flash(不是Gemini2.0FlashThinkingExperimental),仍然是之前一道小学数学应用题的解答和
推理
能力。
stereohomology
·
2025-02-11 19:43
大语言模型对比
Gemini 2.0 FlashThinking Experimental答对这个问题只需要提示一次
目前来说,这两个模型的
推理
能力的确最好。其它的
推理
能力都还是垃圾。
stereohomology
·
2025-02-11 19:13
人工智能
DeepSeek-MoE-16b:高效稀疏架构引领大模型降本增效革命
DeepSeek-MoE-16b是深度求索(DeepSeek)研发的混合专家模型(MixtureofExperts,MoE),参数规模160亿,旨在通过稀疏化计算架构解决传统稠密模型(如Llama2、GPT-3)的高训练与
推理
成本问题
热爱分享的博士僧
·
2025-02-11 18:36
架构
年度人力费用你管对了吗?
在经济形势充满不
确定性
、各行各业纷纷寻求降本增效的大背景下,众多企业将控制人力总费用作为关键举措。然而由于缺乏科学的总控方法,不少公司虽然短期内看似降低了费用,却可能引发诸多负面连锁反应。
·
2025-02-11 16:59
负载均衡
2025年2月第一周国内外科技资讯精选(软件工程与Python领域)
一、AI与Python工具链的深度整合OpenAI与谷歌的模型竞赛OpenAI推出的免费
推理
模型o3-mini在数学代码生成和物理模拟领域表现突出,尤其擅长生成符合物理定律的代码(如动态Shader、游戏逻辑
虫洞没有虫
·
2025-02-11 15:48
科技资讯\好文分享
科技
python
开发语言
LLM
推理
优化——PagedAttention初识篇(vLLM初识(二))
LLM
推理
优化——PagedAttention初识篇(vLLM初识(二))前言在LLM
推理
优化——KVCache篇(百倍提速)中,我们已经介绍了KVCache技术的原理,从中我们可以知道,KVCache
荼荼灰
·
2025-02-11 15:44
神经网络
transformer
深度学习
C#中的非托管资源释放机制详解|Finalizer与Dispose模式
UnmanagedResources)1.3混合型资源1.4非托管资源释放的必要性2释放非托管资源2.1Finalizer(终结器、析构函数)2.1.1定义2.1.2工作原理与问题2.1.2.1工作原理不
确定性
对内存删除时间的延迟影响
Nita.
·
2025-02-11 12:57
C#
.NET
.NET资源释放
c#
非托管资源
.NET资源释放
.net
DeepSeek R1 简易指南:架构、本地部署和硬件要求
DeepSeek团队近期发布的DeepSeek-R1技术论文展示了其在增强大语言模型
推理
能力方面的创新实践。该研究突破性地采用强化学习(Reinfo
·
2025-02-11 12:49
deepseek
0 Token 间间隔 100% GPU 利用率,百度百舸 AIAK 大模型
推理
引擎极限优化 TPS
01什么是大模型
推理
引擎大模型
推理
引擎是生成式语言模型运转的发动机,是接受客户输入prompt和生成返回response的枢纽,也是拉起异构硬件,将物理电能转换为人类知识的变形金刚。
·
2025-02-11 11:44
百度云大模型gpu
云上一键部署 DeepSeek-V3 模型,阿里云PAI Model Gallery 最佳实践
为了实现高效的
推理
和成本效益的训练,DeepSeek-V3采用了MLA(Multi-headLatentAttention)和DeepSeekMoE架构。
·
2025-02-11 11:44
DeepSeek-V3/R1上线背后的超低
推理
成本技术揭秘
百度智能云针对此次模型上线提供了行业领先的超低
推理
价格,低至DeepSeek官方刊例价3-5折,当前还可享受限时免费服务。
·
2025-02-11 11:33
百度算法
『大模型笔记』国外大神对DeepSeek R1的科普!
时间线
推理
与Agent
推理
模型≠Agent
推理
为什么重要
推理
需要变得廉价R1的重要意义AI的发展走势预训练规模扩张的路走不通了
推理
阶段的规模定律缩小模型体量(新的规模定律?)强化学习(新的规模定律?)
AI大模型前沿研究
·
2025-02-11 09:02
大模型笔记
笔记
Deepseek
deepseek
R1
Deepseek
v3
GPT
O1
GPT
O3
2025年Python领域最新国际动态与技术趋势解析(截至2025年2月)
一、AI与Python的深度融合:从模型部署到开发工具OpenAI与谷歌的模型竞赛OpenAI近期推出的免费
推理
模型o3-mini在数学代码生成和物理模拟领域表现突出,尤其在Python生态中,开发者可通过
虫洞没有虫
·
2025-02-11 08:57
Python资讯
python
开发语言
人工智能(Artificial Intelligence,简称AI)
这些任务包括学习、
推理
、问题解决、感知、语言理解等。人
Kingdom_Garden
·
2025-02-11 07:50
人工智能
AI知识库和全文检索的区别
1、AI知识库的作用AI知识库是基于人工智能技术构建的智能系统,能够理解、
推理
和生成信息。
xixingzhe2
·
2025-02-11 07:44
AI
人工智能
2025清华:DeepSeek从入门到精通.pdf(附下载)
DeepSeek是一家中国科技公司,专注于通用人工智能(AGI)的研发,其开源
推理
模型DeepSeek-R1在处理复杂任务方面表现出色,并且可以免费商用。
AI方案2025
·
2025-02-11 04:55
DeepSeek
一文搞定多种Deepseek R1 部署方法,总有一款适合你
它不仅在数学、编程、自然语言
推理
等任务上全面对标甚至超越了OpenAI的o1,而且训练成本仅
sznormal
·
2025-02-11 04:21
人工智能
【AI学习】DeepSeek为什么强?
四个方面:模型的智能水平、训练成本、
推理
成本和用户体验。一、DeepSeek的智能水平DeepSeekV3的智能水平,技术报告展现的性能对比图:是什么导致了DeepSeek的模型性能,是模型架构吗?
bylander
·
2025-02-11 03:17
AI学习
人工智能
学习
gpt
开启AI视觉
推理
新篇章:阿里云通义千问QVQ-72B-Preview模型深度解析
近年来,人工智能领域取得了显著进展,其中多模态
推理
模型的兴起尤为引人注目。这些模型能够理解和处理多种类型的信息,例如文本、图像和视频,从而实现更高级别的智能。
·
2025-02-11 03:57
前端
【LangChain编程:从入门到实践】构建记忆系统
【LangChain编程:从入门到实践】构建记忆系统关键词:LangChain,编程范式,记忆系统,对话系统,AI,NLP,知识库,
推理
1.背景介绍在人工智能领域,对话系统的研究与应用已经取得了显著的进展
杭州大厂Java程序媛
·
2025-02-11 01:57
DeepSeek
R1
&
AI人工智能与大数据
java
python
javascript
kotlin
golang
架构
人工智能
AI 场景下,函数计算 GPU 实例模型存储最佳实践
作者:有松当前,函数计算FC已被广泛应用在各种AI场景下,函数计算支持通过使用容器镜像部署AI
推理
应用,并且提供多种选项来访问训练好的模型。
·
2025-02-10 23:53
云原生
【AI论文】LIMO:
推理
中少即是多
摘要:我们提出了一项重大发现,这一发现挑战了我们对大型语言模型中复杂
推理
能力涌现方式的理解。传统观点认为,复杂的
推理
任务需要大量的训练数据(超过10万例)。
东临碣石82
·
2025-02-10 16:55
人工智能
互联网企业线上业务拓展与开源AI智能名片2+1链动模式S2B2C商城小程序的创新应用
然而,这一过程充满了挑战与不
确定性
,互联网泡沫的破灭使企业深刻反思,开始关注用户价值的实现。在此背景下,“开源AI智能名片2+1链动模式S2B2C商城小程序”应运而生,成为互联网企业转型升
说私域
·
2025-02-10 16:51
人工智能
小程序
开源
荣耀已接入DeepSeek-R1,荣耀手机系统版本MagicOS8.0及以上用户可用
以下是关于这一事件的详细介绍:DeepSeek-R1的强大能力DeepSeek-R1是一款先进的语言模型,具备强大的自然语言处理能力、逻辑
推理
能力和上下文理解能
2501_90444774
·
2025-02-10 14:10
人工智能
virtualenv
tornado
scikit-learn
智能手机
DeepSpeed 在三台T4卡上部署deepseek-r1:32b
如果你只需要使用DeepSpeed在三台T4卡上部署deepseek-r1:32b模型进行
推理
,而不进行训练,可以按照以下步骤进行部署。
推理
部署的重点是利用多台机器和多块GPU来加速模型的
推理
过程。
MonkeyKing.sun
·
2025-02-10 14:33
deepspeed
模型
deepseek和chatgpt能力对比
它的能力在一些评测中表现良好,特别是在中文理解、数学
推理
和代码能力方面。
分享是一种传递,一种快乐
·
2025-02-10 12:51
chatgpt
华为云 + 硅基流动搭建满血版 Deepseek-R1 部署指南
而华为云与硅基流动联合推出的基于昇腾云服务的DeepSeekR1
推理
服务,更是为大家带来了更优的使用体验和部署方案。今天,我就来详细介绍一下如何基于华为云与硅基流动部署满血版Deepseek-R1。
Vincent_Han
·
2025-02-10 12:20
华为云
Deepseek
硅基流动与华为云联合推出基于昇腾云的DeepSeek R1&;V3
推理
服务
经过硅基流动和华为云团队连日攻坚,现在,双方联合首发并上线基于华为云昇腾云服务的DeepSeekR1/V3
推理
服务。
光锥智能
·
2025-02-10 12:14
华为云
谈大语言模型动态思维流编排
但是就目前而言,这种分析,
推理
能力还是不能能准确地做出
推理
另一方面,对于大多数特定的问题而言,人类本身具有了成熟,有效的分析问题
姚家湾
·
2025-02-10 10:31
语言模型
人工智能
自然语言处理
自动驾驶新风口:DeepSeek-R1 的“车端革命”
DeepSeek-R1模型是一个开源
推理
模型,可以随意蒸馏形成小模型,那么这种模型,对未来任何产业都能够产生很大的影响。那么我们汽车行业的智能驾驶/自动驾驶呢?
大模型入门学习
·
2025-02-10 07:30
自动驾驶
人工智能
机器学习
DeepSeek
大模型
大模型教程
大模型入门
IFPP-02
COVID-19之后,出现了明显的回流(onshoring)趋势,这是由多种因素驱动的,包括供应链中断、地缘政治紧张和贸易不
确定性
。2.
SofterICer
·
2025-02-10 06:49
eSIM
服务器
上一页
11
12
13
14
15
16
17
18
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他