端到端多模态推理第5页

DeepMind首席科学家最新万字访谈：模型「慢思考」，能力大幅提升！

JackRae指出，推理模型是AI发展的新范式，推理模型并非追求即时响应，而是通过增加推理时的思考时间来提升答案质量，这导致了一种新的ScalingLaw，“慢思考”模式是提升AI性能的有效途径。

·2025-03-02 09:43

边缘AI推理模型更新的秘密武器——Nginx的在线升级魔法

在当今快速发展的物联网和边缘计算时代，如何确保部署于边缘节点上的AI推理模型能够及时、高效地进行在线更新，成为了技术团队面临的一项重要挑战。

墨夶·2025-03-02 08:25

【模型部署】大模型部署工具对比：SGLang, Ollama, VLLM, LLaMA.cpp如何选择？

以下是对比分析：性能VLLM(VirtualTensorLanguage):VLLM是一个高性能的推理库，特别适用于长序列任务。

深度求索者·2025-03-02 08:19

穿越AI边界：深度集成DeepSeek API与云平台的实践之路

DeepSeek作为一款领先的大型语言生成模型，凭借其强大的推理和生成能力，已经被越来越多的开发者和行业专家所青睐。

云边有个稻草人·2025-03-02 07:45

【llm对话系统】 LLM 大模型推理python实现：vLLM 框架

在LLM的应用中，推理(Inference)阶段至关重要。它指的是利用训练好的LLM模型，根据输入(Prompt)生成文本的过程。

kakaZhui·2025-03-02 06:06

Python vLLM 实战应用指南

参数说明4.实战应用场景4.1构建聊天机器人示例对话：4.2文本补全输出示例：4.3自定义模型服务启动服务调用服务5.性能优化5.1GPU加速5.2动态批处理6.总结vLLM是一种高性能的开源深度学习推理引擎

ghostwritten·2025-03-02 06:34

DeepSeek R1 详解：思维链、强化学习和蒸馏

Deepseek的基准在推理任务（数学、编码和科学）

前网易架构师-高司机·2025-03-02 05:58

硅基流动：免费领取2000万Token，畅享AI大模型盛宴！

其核心团队来自清华大学、MIT等顶尖高校，致力于为企业和开发者提供高性能的AI模型推理和训练解决方案。

·2025-03-02 01:05

iOS 18.4代码泄密：Find My定位将获Gemini多模态能力加持

FindMy技术升级路径多模态定位算法增强代码显示，当用户通过Siri调用FindMy查找AirTag或第三方设备时，系统将优先调用Gemini2.0的视觉-语义联合模型。例如查找丢失

北京自在科技·2025-03-01 23:19

特征提取：如何从不同模态中获取有效信息？

在多模态学习中，特征提取是一个至关重要的过程。它是将原始数据（如文本、图像、视频和语音等）转化为机器能够理解和处理的特征的核心步骤。

Ash Butterfield·2025-03-01 23:17

如何更加优雅提问：浅谈提示词

ISO/IEC23894人工智能系统工程标准第一步：理论基础构建目标：通过结构化分析与实践验证，提升提示词设计的精准度、可控性与生成效率一、提示词设计的核心方法论分阶目标拆解基础层：明确任务类型（生成、推理

愚戏师·2025-03-01 23:42

基于问答对的实体识别和意图识别的知识图谱问答推理

问答对数据questionanswer省直医保的参保范围是什么?中央直属、省直属在哈尔滨的机关、事业单位、社会团体及其职工和退休人员。参加省直医保的单位缴费基数如何确定和缴纳?在职职工(以下简称职工)个人月缴费基数按本人上年度月平均工资确定，由单位代扣代缴，用人单位月缴费基数按本单位参保职工个人月缴费基数之和确定。缴费费率：用人单位8%(含生育0.5%)、职工个人2%。缴费方式：用人单位、职工按月

风清扬【coder】·2025-03-01 21:04

英特尔开发板试用：结合OAK深度相机进行评测

最近英特尔官方发布了一篇文章：主要介绍了如何将英特尔开发板（小挪吒）与OAK深度相机结合使用，并通过OpenVINO™工具套件进行开发和性能评测OAK相机：作为深度数据采集的核心设备，其深度测距功能与OpenVINO™推理相结合

OAK中国_官方·2025-03-01 20:56

第十五个问题-什么是CoT？

Chain-of-Thought(CoT)思维链技术详解一、核心概念Chain-of-Thought（思维链）是一种通过引导大语言模型展示逐步推理过程来提升复杂问题解决能力的技术。

释迦呼呼·2025-03-01 20:53

MeanShift聚类分割算法

下面详细介绍该算法的数学原理和每一步的推理公式。1.密度估计MeanShift算法通过核密度估计（

点云学习·2025-03-01 19:18

DeepSeek突袭公布成本利润率：545%

就在刚刚，DeepSeek官方亲自揭秘了DeepSeek-V3/R1推理系统。

·2025-03-01 18:29

2.4K star的GOT-OCR2.0：端到端OCR 模型

GOT-OCR2.0是一款新一代的光学字符识别（OCR）技术，标志着人工智能在文本识别领域的重大进步。作为一款开源模型，GOT-OCR2.0不仅支持传统的文本和文档识别，还能够处理乐谱、图表以及复杂的数学公式，为用户提供了更加全面和高效的解决方案。产品功能及特点多语言支持：GOT-OCR2.0主要支持中文和英文字符识别，并能够通过进一步的微调扩展到更多语言。这种灵活性使其适用于国际化应用，满足不同

AI 研习所·2025-03-01 17:34

“下一代推理王者”能否再掀AI浪潮？

“下一代推理王者”能否再掀AI浪潮？最近，AI圈内最火的话题，莫过于DeepSeek即将推出的R2模型了。

that's boy·2025-03-01 16:02

【vLLM 学习】使用 Neuron 安装

vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。

HyperAI超神经·2025-03-01 14:47

（脑肿瘤分割笔记：五十二）RFNet: Region-aware Fusion Network for Incomplete Multi-modalBrain Tumor Segmentation

目录摘要：Introduction方法3.1任务定义3.2模型结构3.3RFM模块概率图学习区域感知多模态融合3.4分割正则化器3.5整体损失函数总结摘要：在现有的脑肿瘤分割方法中，常常会出现缺少某些模态图像的问题

不想敲代码的小杨·2025-03-01 12:06

AI大模型-提示工程学习笔记21-图提示 (Graph Prompting)

1.图提示的核心思想(1)传统提示的局限性(2)GraphPrompting的解决方案2.GraphPrompting的工作流程(1)图构建(2)图选择/子图提取(3)图编码(4)提示构建(5)LLM推理与生成

9命怪猫·2025-03-01 12:30

端到端自动驾驶的分布式传感器融合架构

自动驾驶,分布式传感器融合,深度学习,计算机视觉,雷达,lidar,惯性导航,Kalman滤波,决策控制1.背景介绍自动驾驶技术作为未来交通运输的重要发展方向，近年来取得了显著进展。然而，实现真正安全的自动驾驶仍然面临着诸多挑战，其中之一就是如何有效地融合来自不同传感器的数据，构建一个可靠的感知、决策和控制系统。传统的自动驾驶系统通常依赖于单一传感器，例如摄像头或雷达，这会导致感知信息的缺失和鲁棒

AI智能涌现深度研究·2025-03-01 05:08

计算机视觉与机器学习之文档解析与向量化技术加速多模态大模型训练与应用——文件向量化大模型！

目录前言1、TextIn文档解析技术1.1、文档解析技术1.2、目前存在的问题1.2.1、不规则的文档信息示例1.3、合合信息的文档解析1.3.1、合合信息的TextIn文档解析技术架构1.3.2、版面分析关键技术Layout-engine1.3.3、文档树提取关键技术Catalog-engine1.3.4、双栏1.3.5、非对称双栏1.3.6、双栏+表格1.3.7、无线表格1.3.8、合并单元格

知世不是芝士·2025-03-01 04:57

Amazon SageMaker 批量转换中的 JSON 处理技巧

背景介绍AmazonSageMaker提供了强大的批量转换功能，允许我们对大量数据进行推理。这在处理大规模数据集时非常有用。然而，当我们尝试将批量策略从SingleRecord切换到MultiRec

t0_54coder·2025-03-01 03:50

人类驾驶的人脑两种判断模式（反射和预判）--＞自动驾驶两种AI模式

另一种模式是物理时空图式推理模式，判断是基于预判预测，人脑把物理世界的物理动态时空规则（规律）图像已经编码为脑内符号（语言或图式）系统，通过预判预测的思维链推理过程（语言符号或物理时空图式的推理运算，映射推理出了物理世界的后续时空图像

liron71·2025-03-01 02:14

手机秒变AI办公神器！腾讯元宝+DeepSeek满血版，5分钟搞定PPT和项目汇报——你的效率翻倍指南

腾讯元宝作为官方合作平台，提供稳定版DeepSeek-R1模型，支持联网搜索、文件解析、多模态交互，手机端操作更丝滑一、快速上手指南1.下载安装（3秒完成）应用商店搜索“腾讯元宝”→下载安装→选择微信/

a小胡哦·2025-03-01 02:43

利用OllamaLLM模型实现多模态文本生成

利用OllamaLLM模型实现多模态文本生成在这篇文章中，我们将介绍如何使用OllamaLLM模型实现多模态文本生成，包括文本和图像输入的处理。我们将详细解析核心原理，提供代码示例，并分析应用场景。

bavDHAUO·2025-03-01 02:42

DeepSeek技术全景解析：架构创新与行业差异化竞争力

深度优化的MoE架构：结合256个路由专家与1个共享专家，实现稀疏激活机制（每个Token仅激活8个专家），在代码生成任务中推理速度提升40%。混合模态支持：支持文本、代码、数学符号

二进制coder·2025-03-01 01:40

DeepSeek入门：安装与配置

，以下是不同版本的硬件要求：DeepSeek-R1-1.5B：CPU：最低4核（推荐Intel/AMD多核处理器）内存：8GB+硬盘：3GB+存储空间（模型文件约1.5-2GB）显卡：非必需（纯CPU推理

梦落青云·2025-03-01 01:08

大模型研究：DeepSeek三个版本（初级中级高级）资源要求说明

DeepSeek-LLM6.7B三个版本模型所需硬件资源的介绍：DeepSeek-LLM6.7B最小最基础版本1.内存（RAM）非量化运行时，由于模型参数数量相对较少，大约需要13GB-14GB的系统内存来加载模型和进行基本推理

程序猿学长·2025-03-01 01:08

DeepSeek 最新发布 DeepEP：一款用于 MoE 模型训练和推理的开源 EP 通信库

采用Mixture-of-Experts（MoE）架构的大型语言模型在没有相应计算量增加的情况下显著提升了模型容量。然而，这种方法也引入了一些挑战，尤其是在GPU之间的通信方面。在MoE模型中，对于任何给定的token，只有一部分专家是活跃的，因此在设备之间高效地交换数据至关重要。传统的全对全（all-to-all）通信方法可能会造成瓶颈，增加延迟，并导致GPU资源利用不足。在对延迟敏感的场景中，

强哥之神·2025-03-01 01:37

一文了解：部署 Deepseek 各版本的硬件要求

我们先看一下DeepSeek的部分通用版本（如下图），然后再介绍一下最近火热的R1推理版本的各规格的硬件要求。最后，会给出R1的各主流版本的资源参考列表（文末）。模型名参数大小文件格式标签公司

强哥之神·2025-03-01 00:04

继清华大学DeepSeek资料后，北京大学也出了内容主攻提示词和应用场景

以下是文件的主要内容摘要：1.DeepSeek-R1模型详解技术特性：DeepSeek-R1是一款专注于复杂推理任务的推理模型，擅长数学、编程和自然语言推理任务。

心灵宝贝·2025-03-01 00:04

谁说消费级硬件不能玩 DeepSeek - R1 微调？手把手教你进阶AI玩家

一、大规模人工智能模型的微调DeepSeek最新的R1模型在推理性能方面树立了新的标杆，在保持开源的同时，可与专有模型相媲美。DeepSeek-R1的蒸

硅基创想家·2025-02-28 22:51

DeepSeek五天开源5大杀器实测：训练成本砍半+推理速度起飞，算法圈已疯（附删库跑路教程）

FlashMLA让推理速度飙升40%，DeepEP根治MoE通信癌，FP8核弹库DeepGEMM暴力提效，DualPipe+EPLB把GPU榨到一滴不剩，3FS化身数据闪电侠！

AI仙人掌·2025-02-28 22:18

一文看懂 Claude 3.7 Sonnet，为什么是第一个融合推理模式的 AI 模型

Claude3.7Sonnet是Anthropic最新发布的AI模型，发布过程中，最突出最吸引眼球的特点是首个“融合推理”模型。什么是融合推理模型？

董董灿是个攻城狮·2025-02-28 22:45

（5-3）DeepSeek多模态大模型架构：Janus-Pro模型

5.3Janus-Pro模型Janus-Pro的架构采用了解耦视觉编码的设计理念，将多模态理解与视觉生成任务分离开来，以充分发挥各自优势。

码农三叔·2025-02-28 18:21

DeepSeek开源周Day1：FlashMLA引爆AI推理性能革命！

项目地址：GitHub-deepseek-ai/FlashMLA开源日历：2025-02-24起每日9AM(北京时间)更新，持续五天！一、开源周震撼启幕继上周预告后，DeepSeek于北京时间今晨9点准时开源「FlashMLA」，打响开源周五连发第一枪！作为专为Hopper架构GPU（H800/H100）优化的高效解码内核，该项目一经发布便引爆社区：上线45分钟斩获400+Star，3小时突破2.

歌刎·2025-02-28 18:48

2.8 通过微调提升模型的准确度与效率-大模型ACP模拟题-真题

A.显著提升模型精度B.减少显存占用和响应时间✅C.完全保留原始模型能力D.支持多模态任务扩展解析：量化通过降低参数精度减少资源消耗，但对精度影响较小（<2%）以下关于LoRA技术的描述错误的是？

admin皮卡·2025-02-28 17:12

【AI论文】SongGen：用于文本到歌曲生成的单阶段自回归Transformer模型

现有方法通常采用多阶段生成流程，导致训练和推理过程繁琐。在本文中，我们提出了SongGen，一个完全开源的单阶段自回归Transformer模型，专为可控歌曲生成而设计。

东临碣石82·2025-02-28 15:58

饿了么算法工程师-AIGC岗内推

飞300·2025-02-28 15:26

微软发布 Phi-4 迷你模型,适合本地部署ChatBot

Phi-4-mini-instruct是一个轻量级的开放模型，它建立在合成数据和经过筛选的公开网站基础上，重点关注高质量、推理密集的数据。该模型属于Phi-4模型系列，支持128K标记上下文长度。

吴脑的键客·2025-02-28 13:43

Elasticsearch：使用阿里云 AI 服务进行向量化和重新排名

阿里云人工智能搜索是一种将高级人工智能功能与Elasticsearch工具相结合的解决方案，利用QwenLLM/DeepSeek-R1系列提供高级推理和分类模型。

·2025-02-28 11:17

实现一个 RDMA 用户态驱动程序

实际上，高性能、易维护、易定制的网络基础设施对于提升AI训练、推理的效率是至关重要的一环。