E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
推理证明
昇腾,Ascend,NPU,mindie,镜像,部署vllm:第4篇,尝试多模态大模型部署(Qwen2-vl)
(当然是在昇腾环境下)提示:需要把这篇文章先看一遍昇腾,mindie,镜像,部署vllm:第2篇,启动mindieservice_daemon服务,支持对Qwen2.5的7B版本的
推理
提示:本文章的撰写思路是
几道之旅
·
2025-02-12 10:36
Dify:智能体(Agent)
工作流
知识库
全搞定
Agent)
人工智能
策略泛化的无动作
推理
25年2月来自斯坦福的论文“Action-FreeReasoningforPolicyGeneralization”。端到端模仿学习为训练机器人策略提供一种有前途的方法。然而,泛化到新环境(例如未见过的场景、任务和目标实例)仍然是一项重大挑战。尽管大规模机器人演示数据集已显示出诱导泛化的潜力,但它们的规模化需要大量资源。相比之下,人类视频数据丰富多样,提供一种有吸引力的替代方案。然而,这些人类视频
硅谷秋水
·
2025-02-12 07:44
智能体
大模型
计算机视觉
人工智能
深度学习
机器学习
计算机视觉
语言模型
【通往通用人工智能AGI之路】第8章: 认知架构
AGI系统架构需要综合考虑认知、学习、
推理
、规划等多个方面,设计灵活、可扩展、鲁棒的系统框架;AGI系统实现需要针对不同的任务和场景,开发高效、可靠、可解释的算法和模型。
AI天才研究院
·
2025-02-12 06:04
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
大厂Offer收割机
面试题
简历
程序员读书
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
Java
Python
架构设计
Agent
程序员实现财富自由
手把手教学,DeepSeek-R1微调全流程拆解
手把手教学,DeepSeek-R1微调全流程拆解原创极客见识GeekSavvy2025年02月09日09:02广东DeepSeek通过发布其开源
推理
模型DeepSeek-R1颠覆了AI格局,该模型使用创新的强化学习技术
AI生成曾小健
·
2025-02-12 05:01
windows
开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机多卡-RTX 4090双卡(十五)
是一种有效的自适应策略,它不会引入额外的
推理
延迟,并在保持模型质量的同时显着减少下游任务的可训练参数数量。2.2.参数高效微调(PEF
开源技术探险家
·
2025-02-12 04:50
开源模型-实际应用落地
#
开源模型-微调实战密码
自然语言处理
深度学习
语言模型
对DeepSeek-R1通过强化学习提升大型语言模型
推理
能力的技术原理解析
•关键要素:包括环境(模型所处的
推理
任务场景)、状态(模型在
推理
过程中的当前情况,如已有的
推理
步骤、已知信息等)、动作(模型在当前状态下做出的
推理
决策,如选择何种
推理
方法、如何组织语言等)、奖励(根据模型的动作和结果给予的反馈
一只贴代码君
·
2025-02-12 02:12
语言模型
人工智能
自然语言处理
学习
AI编程
开发语言
模型轻量化
影响神经网络
推理
速度主要有4个因素:FLOPs、MAC、计算并行度、硬件平台架构与特性(算力、GPU内存带宽)模型压缩工业界主流的模型压缩方法有:知识蒸馏(KnowledgeDistillation,KD
莱茶荼菜
·
2025-02-11 22:10
人工智能
学习
深度学习中模型轻量化及具体方案应用
模型轻量化的核心目标是提高
推理
速度、降低功耗、减少内存占用,以便在边缘设备上实现实时性或低延迟的响应。
码上就位
·
2025-02-11 22:36
深度学习
人工智能
大模型
推理
服务全景图
作者:望宸随着DeepSeekR1和Qwen2.5-Max的发布,国内大模型
推理
需求激增,性能提升的主战场将从训练转移到
推理
。由于无论是训练还是
推理
,如何提升性能都是业内讨论最多的话题之一。
·
2025-02-11 21:12
云原生阿里云
换平台对比
推理
能力:DeepSeekR1强于Gemini2.0Flash
和Gemini2.0Flash(不是Gemini2.0FlashThinkingExperimental),仍然是之前一道小学数学应用题的解答和
推理
能力。
stereohomology
·
2025-02-11 19:43
大语言模型对比
Gemini 2.0 FlashThinking Experimental答对这个问题只需要提示一次
目前来说,这两个模型的
推理
能力的确最好。其它的
推理
能力都还是垃圾。
stereohomology
·
2025-02-11 19:13
人工智能
DeepSeek-MoE-16b:高效稀疏架构引领大模型降本增效革命
DeepSeek-MoE-16b是深度求索(DeepSeek)研发的混合专家模型(MixtureofExperts,MoE),参数规模160亿,旨在通过稀疏化计算架构解决传统稠密模型(如Llama2、GPT-3)的高训练与
推理
成本问题
热爱分享的博士僧
·
2025-02-11 18:36
架构
2025年2月第一周国内外科技资讯精选(软件工程与Python领域)
一、AI与Python工具链的深度整合OpenAI与谷歌的模型竞赛OpenAI推出的免费
推理
模型o3-mini在数学代码生成和物理模拟领域表现突出,尤其擅长生成符合物理定律的代码(如动态Shader、游戏逻辑
虫洞没有虫
·
2025-02-11 15:48
科技资讯\好文分享
科技
python
开发语言
LLM
推理
优化——PagedAttention初识篇(vLLM初识(二))
LLM
推理
优化——PagedAttention初识篇(vLLM初识(二))前言在LLM
推理
优化——KVCache篇(百倍提速)中,我们已经介绍了KVCache技术的原理,从中我们可以知道,KVCache
荼荼灰
·
2025-02-11 15:44
神经网络
transformer
深度学习
DeepSeek R1 简易指南:架构、本地部署和硬件要求
DeepSeek-R1-Zero
证明
了纯粹的强化学习是可行的,而DeepSeek-R1则展示了如何将监督学习与强化学习相结合,从而创建出能力更强、更实用的模型。
·
2025-02-11 12:49
deepseek
0 Token 间间隔 100% GPU 利用率,百度百舸 AIAK 大模型
推理
引擎极限优化 TPS
01什么是大模型
推理
引擎大模型
推理
引擎是生成式语言模型运转的发动机,是接受客户输入prompt和生成返回response的枢纽,也是拉起异构硬件,将物理电能转换为人类知识的变形金刚。
·
2025-02-11 11:44
百度云大模型gpu
云上一键部署 DeepSeek-V3 模型,阿里云PAI Model Gallery 最佳实践
为了实现高效的
推理
和成本效益的训练,DeepSeek-V3采用了MLA(Multi-headLatentAttention)和DeepSeekMoE架构。
·
2025-02-11 11:44
DeepSeek-V3/R1上线背后的超低
推理
成本技术揭秘
百度智能云针对此次模型上线提供了行业领先的超低
推理
价格,低至DeepSeek官方刊例价3-5折,当前还可享受限时免费服务。
·
2025-02-11 11:33
百度算法
『大模型笔记』国外大神对DeepSeek R1的科普!
时间线
推理
与Agent
推理
模型≠Agent
推理
为什么重要
推理
需要变得廉价R1的重要意义AI的发展走势预训练规模扩张的路走不通了
推理
阶段的规模定律缩小模型体量(新的规模定律?)强化学习(新的规模定律?)
AI大模型前沿研究
·
2025-02-11 09:02
大模型笔记
笔记
Deepseek
deepseek
R1
Deepseek
v3
GPT
O1
GPT
O3
链表-环形链表II
代码随想录-刷题笔记142.环形链表II-力扣(LeetCode)内容:本题更多是考验数学,数学感觉到位了,本题可以说毫无难度如何
证明
是否有环:两个指针一个快,一个慢,如果能遇到,一定有环!
Hasno.
·
2025-02-11 08:59
链表
java
数据结构
2025年Python领域最新国际动态与技术趋势解析(截至2025年2月)
一、AI与Python的深度融合:从模型部署到开发工具OpenAI与谷歌的模型竞赛OpenAI近期推出的免费
推理
模型o3-mini在数学代码生成和物理模拟领域表现突出,尤其在Python生态中,开发者可通过
虫洞没有虫
·
2025-02-11 08:57
Python资讯
python
开发语言
人工智能(Artificial Intelligence,简称AI)
这些任务包括学习、
推理
、问题解决、感知、语言理解等。人
Kingdom_Garden
·
2025-02-11 07:50
人工智能
AI知识库和全文检索的区别
1、AI知识库的作用AI知识库是基于人工智能技术构建的智能系统,能够理解、
推理
和生成信息。
xixingzhe2
·
2025-02-11 07:44
AI
人工智能
2025清华:DeepSeek从入门到精通.pdf(附下载)
DeepSeek是一家中国科技公司,专注于通用人工智能(AGI)的研发,其开源
推理
模型DeepSeek-R1在处理复杂任务方面表现出色,并且可以免费商用。
AI方案2025
·
2025-02-11 04:55
DeepSeek
一文搞定多种Deepseek R1 部署方法,总有一款适合你
它不仅在数学、编程、自然语言
推理
等任务上全面对标甚至超越了OpenAI的o1,而且训练成本仅
sznormal
·
2025-02-11 04:21
人工智能
【AI学习】DeepSeek为什么强?
四个方面:模型的智能水平、训练成本、
推理
成本和用户体验。一、DeepSeek的智能水平DeepSeekV3的智能水平,技术报告展现的性能对比图:是什么导致了DeepSeek的模型性能,是模型架构吗?
bylander
·
2025-02-11 03:17
AI学习
人工智能
学习
gpt
开启AI视觉
推理
新篇章:阿里云通义千问QVQ-72B-Preview模型深度解析
近年来,人工智能领域取得了显著进展,其中多模态
推理
模型的兴起尤为引人注目。这些模型能够理解和处理多种类型的信息,例如文本、图像和视频,从而实现更高级别的智能。
·
2025-02-11 03:57
前端
【LangChain编程:从入门到实践】构建记忆系统
【LangChain编程:从入门到实践】构建记忆系统关键词:LangChain,编程范式,记忆系统,对话系统,AI,NLP,知识库,
推理
1.背景介绍在人工智能领域,对话系统的研究与应用已经取得了显著的进展
杭州大厂Java程序媛
·
2025-02-11 01:57
DeepSeek
R1
&
AI人工智能与大数据
java
python
javascript
kotlin
golang
架构
人工智能
如何对SpringBoot项目开展单元测试
执行单元测试,就是为了
证明
这段代码的行为和我们期望是否一致。添加依赖与配置配置文件,集成了web启动器、mybatis启动器的集成、及单元测试的启动器集成。
耕织
·
2025-02-10 23:15
单元测试
使用AI代码生成器和uni-app构建程序员社区APP:可行性分析与实践
开源中国APP的成功案例也
证明
了uni-app在构建大型应用方面的实力。那么,能否利用uni-app结合AI代码生成器,开发一个功能强大的程序员社区APP呢?本文将对此进行深入探讨。
·
2025-02-10 23:55
前端
AI 场景下,函数计算 GPU 实例模型存储最佳实践
作者:有松当前,函数计算FC已被广泛应用在各种AI场景下,函数计算支持通过使用容器镜像部署AI
推理
应用,并且提供多种选项来访问训练好的模型。
·
2025-02-10 23:53
云原生
【AI论文】LIMO:
推理
中少即是多
摘要:我们提出了一项重大发现,这一发现挑战了我们对大型语言模型中复杂
推理
能力涌现方式的理解。传统观点认为,复杂的
推理
任务需要大量的训练数据(超过10万例)。
东临碣石82
·
2025-02-10 16:55
人工智能
荣耀已接入DeepSeek-R1,荣耀手机系统版本MagicOS8.0及以上用户可用
以下是关于这一事件的详细介绍:DeepSeek-R1的强大能力DeepSeek-R1是一款先进的语言模型,具备强大的自然语言处理能力、逻辑
推理
能力和上下文理解能
2501_90444774
·
2025-02-10 14:10
人工智能
virtualenv
tornado
scikit-learn
智能手机
DeepSpeed 在三台T4卡上部署deepseek-r1:32b
如果你只需要使用DeepSpeed在三台T4卡上部署deepseek-r1:32b模型进行
推理
,而不进行训练,可以按照以下步骤进行部署。
推理
部署的重点是利用多台机器和多块GPU来加速模型的
推理
过程。
MonkeyKing.sun
·
2025-02-10 14:33
deepspeed
模型
deepseek和chatgpt能力对比
它的能力在一些评测中表现良好,特别是在中文理解、数学
推理
和代码能力方面。
分享是一种传递,一种快乐
·
2025-02-10 12:51
chatgpt
华为云 + 硅基流动搭建满血版 Deepseek-R1 部署指南
而华为云与硅基流动联合推出的基于昇腾云服务的DeepSeekR1
推理
服务,更是为大家带来了更优的使用体验和部署方案。今天,我就来详细介绍一下如何基于华为云与硅基流动部署满血版Deepseek-R1。
Vincent_Han
·
2025-02-10 12:20
华为云
Deepseek
硅基流动与华为云联合推出基于昇腾云的DeepSeek R1&;V3
推理
服务
经过硅基流动和华为云团队连日攻坚,现在,双方联合首发并上线基于华为云昇腾云服务的DeepSeekR1/V3
推理
服务。
光锥智能
·
2025-02-10 12:14
华为云
谈大语言模型动态思维流编排
但是就目前而言,这种分析,
推理
能力还是不能能准确地做出
推理
另一方面,对于大多数特定的问题而言,人类本身具有了成熟,有效的分析问题
姚家湾
·
2025-02-10 10:31
语言模型
人工智能
自然语言处理
自动驾驶新风口:DeepSeek-R1 的“车端革命”
DeepSeek-R1模型是一个开源
推理
模型,可以随意蒸馏形成小模型,那么这种模型,对未来任何产业都能够产生很大的影响。那么我们汽车行业的智能驾驶/自动驾驶呢?
大模型入门学习
·
2025-02-10 07:30
自动驾驶
人工智能
机器学习
DeepSeek
大模型
大模型教程
大模型入门
什么是AI人工智能
首先,AI指的是让计算机系统能够执行人类智慧任务,比如学习、
推理
和决策的能力。就像我们人类一样,它们可以通过数据进行分析,做出判断。但它们是如何工作的呢?
西洲啊
·
2025-02-10 03:57
AI
人工智能
桶排序算法及优化(java)
1.2桶排序的历史1.3桶排序的基本原理1.3.1工作流程1.3.2关键步骤1.4桶排序的Java实现1.4.1简单实现1.4.2优化实现1.4.3代码解释1.5桶排序的时间复杂度1.5.1分析1.5.2
证明
爱吃土豆的程序员
·
2025-02-10 03:56
数据结构与算法(JAVA)
桶排序
java
算法
DeepSeek:如何表达需求
表达公式:目标+选项+评估标准适配策略:
推理
模型:要求AI进行逻
小稻草打打打
·
2025-02-10 00:31
AI相关
人工智能
多头注意力机制的创新优化:MLA架构解析
摘要MLA(Multi-headLatentAttention)架构是对Transformer模型中多头注意力(MHA)结构的创新优化,旨在提高
推理
阶段的效率并降低资源消耗。
耶耶Norsea
·
2025-02-09 23:22
网络杂烩
Deepseek
片段阅读:行测高分的关键突破口
在公务员考试的行测科目中,片段阅读占据着举足轻重的地位,它不仅题量可观,更是对考生阅读理解、归纳概括、逻辑
推理
等综合能力的全方位考查。
张小小大智慧
·
2025-02-09 23:21
行测
行测
解锁DeepSeek大模Q型:超实用提示词技巧大放送
DeepSeek大模型简介DeepSeek是由深度求索(DeepSeekInc.)团队开发的大型预训练语言模型,以其高效
推理
、多模态融合及对垂直领域的深度优化而著称。
计算机学长
·
2025-02-09 20:04
通用大语言模型
人工智能
数学与光学:光的传播和干涉的数学描述
文章将结合数学公式和编程实例,提供清晰的逻辑
推理
和分析过程,以帮助读者更好地理解和掌握这些核心概念。目录大纲《数学与光学
AI天才研究院
·
2025-02-09 14:22
计算
ChatGPT
DeepSeek
R1
&
大数据AI人工智能大模型
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
【Windows/C++/yolo开发部署03】将实例分割模型ONNX导出为 TensorRT 引擎:完整记录
CSDN文库目录写在前面环境准备1.使用trtexec将ONNX模型转换为TensorRT引擎2.验证TensorRT引擎2.1TensorRT版本2.2GPU信息2.3TensorRT引擎信息2.4
推理
请求
认识祂
·
2025-02-09 13:42
CV计算机视觉
Ultralytics
yolo
实例分割
模型部署
DeepSeek-R1 原理解析及 Linux 本地部署详细教程
一、引言DeepSeek-R1作为幻方量化旗下大模型公司DeepSeek研发的系列
推理
模型,2025年横空出世,被誉为国运级产品。
power-辰南
·
2025-02-09 12:05
人工智能
linux
deepseek
大模型
语言模型
人工智能
蒸馏:让DeepSeek用“移魂大法”增强你的小模型
在DeepSeekR1的技术报告中,使用DeepSeek-R1生成的
推理
数据,微调了几个广泛使用的开源模型。评估结果表明,蒸馏后的较
AI生成曾小健
·
2025-02-09 11:58
Deepseek原理与使用
人工智能
混合专家模型 (MoE) 最全详细图解
在本篇博文中,我们将深入探讨MoEs的核心组件、训练方法,以及在
推理
过程中需要考量的各种因素简短总结混合专家模型(MoEs):与稠密模型相比,预训练速度更快与具有相同参数数量的模型相比
DFCED
·
2025-02-09 10:23
人工智能算法前沿
AIGC算法学术工业技术前沿
混合专家网络
MOE
DeepSeek
人工智能
深度学习
大模型
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他