归结演绎推理第3页

0 Token 间间隔 100% GPU 利用率，百度百舸 AIAK 大模型推理引擎极限优化 TPS

01什么是大模型推理引擎大模型推理引擎是生成式语言模型运转的发动机，是接受客户输入prompt和生成返回response的枢纽，也是拉起异构硬件，将物理电能转换为人类知识的变形金刚。

·2025-02-11 11:44

云上一键部署 DeepSeek-V3 模型，阿里云PAI Model Gallery 最佳实践

为了实现高效的推理和成本效益的训练，DeepSeek-V3采用了MLA（Multi-headLatentAttention）和DeepSeekMoE架构。

·2025-02-11 11:44

DeepSeek-V3/R1上线背后的超低推理成本技术揭秘

百度智能云针对此次模型上线提供了行业领先的超低推理价格，低至DeepSeek官方刊例价3-5折，当前还可享受限时免费服务。

·2025-02-11 11:33

『大模型笔记』国外大神对DeepSeek R1的科普！

时间线推理与Agent推理模型≠Agent推理为什么重要推理需要变得廉价R1的重要意义AI的发展走势预训练规模扩张的路走不通了推理阶段的规模定律缩小模型体量（新的规模定律？）强化学习（新的规模定律？）

AI大模型前沿研究·2025-02-11 09:02

2025年Python领域最新国际动态与技术趋势解析（截至2025年2月）

一、AI与Python的深度融合：从模型部署到开发工具OpenAI与谷歌的模型竞赛OpenAI近期推出的免费推理模型o3-mini在数学代码生成和物理模拟领域表现突出，尤其在Python生态中，开发者可通过

虫洞没有虫·2025-02-11 08:57

人工智能（Artificial Intelligence，简称AI）

这些任务包括学习、推理、问题解决、感知、语言理解等。人

Kingdom_Garden·2025-02-11 07:50

AI知识库和全文检索的区别

1、AI知识库的作用AI知识库是基于人工智能技术构建的智能系统，能够理解、推理和生成信息。

xixingzhe2·2025-02-11 07:44

2025清华：DeepSeek从入门到精通.pdf（附下载）

DeepSeek是一家中国科技公司，专注于通用人工智能（AGI）的研发，其开源推理模型DeepSeek-R1在处理复杂任务方面表现出色，并且可以免费商用。

AI方案2025·2025-02-11 04:55

一文搞定多种Deepseek R1 部署方法，总有一款适合你

它不仅在数学、编程、自然语言推理等任务上全面对标甚至超越了OpenAI的o1，而且训练成本仅

sznormal·2025-02-11 04:21

【AI学习】DeepSeek为什么强？

四个方面：模型的智能水平、训练成本、推理成本和用户体验。一、DeepSeek的智能水平DeepSeekV3的智能水平，技术报告展现的性能对比图：是什么导致了DeepSeek的模型性能，是模型架构吗？

bylander·2025-02-11 03:17

开启AI视觉推理新篇章：阿里云通义千问QVQ-72B-Preview模型深度解析

近年来，人工智能领域取得了显著进展，其中多模态推理模型的兴起尤为引人注目。这些模型能够理解和处理多种类型的信息，例如文本、图像和视频，从而实现更高级别的智能。

·2025-02-11 03:57

【LangChain编程：从入门到实践】构建记忆系统

【LangChain编程：从入门到实践】构建记忆系统关键词：LangChain,编程范式,记忆系统,对话系统,AI,NLP,知识库,推理1.背景介绍在人工智能领域，对话系统的研究与应用已经取得了显著的进展

杭州大厂Java程序媛·2025-02-11 01:57

AI 场景下，函数计算 GPU 实例模型存储最佳实践

作者：有松当前，函数计算FC已被广泛应用在各种AI场景下，函数计算支持通过使用容器镜像部署AI推理应用，并且提供多种选项来访问训练好的模型。

·2025-02-10 23:53

【Black杂谈】是否有一种方法可以在二进制世界中准确描述现实世界？

毕达哥拉斯认为，数是世界的本源，数先于一切事物而存在，他把宇宙的性质都归结于数的规律，数是永恒的。他说数的原则就是一切事物的原则，整个天体体现着

Bl_a_ck·2025-02-10 22:08

【AI论文】LIMO：推理中少即是多

摘要：我们提出了一项重大发现，这一发现挑战了我们对大型语言模型中复杂推理能力涌现方式的理解。传统观点认为，复杂的推理任务需要大量的训练数据（超过10万例）。

东临碣石82·2025-02-10 16:55

荣耀已接入DeepSeek-R1，荣耀手机系统版本MagicOS8.0及以上用户可用

以下是关于这一事件的详细介绍：DeepSeek-R1的强大能力DeepSeek-R1是一款先进的语言模型，具备强大的自然语言处理能力、逻辑推理能力和上下文理解能

2501_90444774·2025-02-10 14:10

DeepSpeed 在三台T4卡上部署deepseek-r1:32b

如果你只需要使用DeepSpeed在三台T4卡上部署deepseek-r1:32b模型进行推理，而不进行训练，可以按照以下步骤进行部署。推理部署的重点是利用多台机器和多块GPU来加速模型的推理过程。

MonkeyKing.sun·2025-02-10 14:33

deepseek和chatgpt能力对比

它的能力在一些评测中表现良好，特别是在中文理解、数学推理和代码能力方面。

分享是一种传递，一种快乐·2025-02-10 12:51

华为云 + 硅基流动搭建满血版 Deepseek-R1 部署指南

而华为云与硅基流动联合推出的基于昇腾云服务的DeepSeekR1推理服务，更是为大家带来了更优的使用体验和部署方案。今天，我就来详细介绍一下如何基于华为云与硅基流动部署满血版Deepseek-R1。

Vincent_Han·2025-02-10 12:20

硅基流动与华为云联合推出基于昇腾云的DeepSeek R1&；V3推理服务

经过硅基流动和华为云团队连日攻坚，现在，双方联合首发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。

光锥智能·2025-02-10 12:14

谈大语言模型动态思维流编排

但是就目前而言，这种分析，推理能力还是不能能准确地做出推理另一方面，对于大多数特定的问题而言，人类本身具有了成熟，有效的分析问题

姚家湾·2025-02-10 10:31

自动驾驶新风口：DeepSeek-R1 的“车端革命”

DeepSeek-R1模型是一个开源推理模型，可以随意蒸馏形成小模型，那么这种模型，对未来任何产业都能够产生很大的影响。那么我们汽车行业的智能驾驶/自动驾驶呢？

大模型入门学习·2025-02-10 07:30

什么是AI人工智能

首先，AI指的是让计算机系统能够执行人类智慧任务，比如学习、推理和决策的能力。就像我们人类一样，它们可以通过数据进行分析，做出判断。但它们是如何工作的呢？

西洲啊·2025-02-10 03:57

DeepSeek：如何表达需求

表达公式：目标+选项+评估标准适配策略：推理模型：要求AI进行逻

小稻草打打打·2025-02-10 00:31

多头注意力机制的创新优化：MLA架构解析

摘要MLA（Multi-headLatentAttention）架构是对Transformer模型中多头注意力（MHA）结构的创新优化，旨在提高推理阶段的效率并降低资源消耗。

耶耶Norsea·2025-02-09 23:22

片段阅读：行测高分的关键突破口

在公务员考试的行测科目中，片段阅读占据着举足轻重的地位，它不仅题量可观，更是对考生阅读理解、归纳概括、逻辑推理等综合能力的全方位考查。

张小小大智慧·2025-02-09 23:21

解锁DeepSeek大模Q型：超实用提示词技巧大放送

DeepSeek大模型简介DeepSeek是由深度求索(DeepSeekInc.)团队开发的大型预训练语言模型，以其高效推理、多模态融合及对垂直领域的深度优化而著称。

计算机学长·2025-02-09 20:04

数学与光学：光的传播和干涉的数学描述

文章将结合数学公式和编程实例，提供清晰的逻辑推理和分析过程，以帮助读者更好地理解和掌握这些核心概念。目录大纲《数学与光学

AI天才研究院·2025-02-09 14:22

【Windows/C++/yolo开发部署03】将实例分割模型ONNX导出为 TensorRT 引擎：完整记录

CSDN文库目录写在前面环境准备1.使用trtexec将ONNX模型转换为TensorRT引擎2.验证TensorRT引擎2.1TensorRT版本2.2GPU信息2.3TensorRT引擎信息2.4推理请求

认识祂·2025-02-09 13:42

DeepSeek-R1 原理解析及 Linux 本地部署详细教程

一、引言DeepSeek-R1作为幻方量化旗下大模型公司DeepSeek研发的系列推理模型，2025年横空出世，被誉为国运级产品。

power-辰南·2025-02-09 12:05

蒸馏：让DeepSeek用“移魂大法”增强你的小模型

在DeepSeekR1的技术报告中，使用DeepSeek-R1生成的推理数据，微调了几个广泛使用的开源模型。评估结果表明，蒸馏后的较

AI生成曾小健·2025-02-09 11:58

混合专家模型 (MoE) 最全详细图解

在本篇博文中，我们将深入探讨MoEs的核心组件、训练方法，以及在推理过程中需要考量的各种因素简短总结混合专家模型(MoEs):与稠密模型相比，预训练速度更快与具有相同参数数量的模型相比

DFCED·2025-02-09 10:23

DeepSeek-V3 技术报告（核心技术，接近5万字）

为了实现高效的推理和成本效益的训练，DeepSeek-V3采用了Multi-headLatentAttention(MLA)和DeepSeekMoE架构，这些架构在DeepSeek-V2中得到了彻底验证

zhangjiaofa·2025-02-09 10:21

DeepSeek-V3 Technical Report

2架构2.1基本架构2.2多token预测3基础设施3.1计算集群3.2训练框架3.2.1双管和计算通信重叠3.2.2跨节点全对全通信的高效实现3.2.3以最小的开销节省大量内存3.3FP8训练3.4推理和部署

UnknownBody·2025-02-09 08:35

一文搞懂DeepSeek - 开源模型R1

DeepSeek-R1作为一款开源的大型语言模型，在数学、编程和推理等多个任务上表现出了强大的性能。

程序员辣条·2025-02-09 01:12

DeepSeek使用技巧，强烈建议收藏

前言在AI技术飞速发展的当下，DeepSeek作为国产大模型的佼佼者，凭借免费使用、开源生态以及行业领先的推理能力，成为了众多用户的智能得力助手。

suyukangchen·2025-02-09 00:37

多厂商宣布接入DeepSeek，迅易科技能帮助客户按需实现数智化革新

2025年伊始，国产高性能AI推理模型DeepSeek在全球AI领域掀起了一股热潮，凭借其卓越的多场景理解与生成能力迅速“出圈”，不仅彻底改写了全球AI应用市场的格局，也为AI技术的未来发展路径树立了新的标杆

·2025-02-08 19:59

多厂商宣布接入DeepSeek，迅易科技能帮助客户按需实现数智化革新

2025年伊始，国产高性能AI推理模型DeepSeek在全球AI领域掀起了一股热潮，凭借其卓越的多场景理解与生成能力迅速“出圈”，不仅彻底改写了全球AI应用市场的格局，也为AI技术的未来发展路径树立了新的标杆

·2025-02-08 19:58

DeepSeek-V3 横空出世：推理速度飙升，开源模型新王者诞生！

这款模型不仅在推理速度上实现了质的飞跃，更是在主流榜单中与世界上最先进的闭源模型平分秋色，甚至位列开源模型榜首！

霍格沃兹测试开发学社·2025-02-08 13:47

大语言模型多token预测技术

传统的基于下一个token预测的训练方法虽简单有效，但在获取语言、世界知识和推理能力方面效率不高。

deepdata_cn·2025-02-08 09:21

【AIGC魔童】DeepSeek v3推理部署：DeepSeek-Infer/ModelScope/ollama

【AIGC魔童】DeepSeekv3推理部署：DeepSeek-Infer/ModelScope/ollama（1）快速使用（2）推理部署2.1使用DeepSeek-Infer部署DeepSeek2.2

LeeZhao@·2025-02-08 09:47

组合问题--力扣第77题

1,4],]思路：使用回溯算法，LinkedListpath：来存储路径Listres：存储结果backtrack(intn,intk,intstart)：递归函数(path.size()==k:单层递归结束条件

天忍哥哥·2025-02-08 09:45

ChatGPT入门- GPT 4.0 新手使用手册（结合案例讲解）

2.上下文保持与逻辑推理：相比于前几代模型，GPT4.0在对话过程中能够更好地保持上下文的连续性，并进行逻辑推理。这意味着用户可以与它进行更深入的对话，而不必担心模型丢失之前的上下文信息。

玩AI的小胡子·2025-02-08 09:42

【Ollama+Deepseek】本地化部署运行Deepseek模型

一、前言最近国内的深度求索公司发布的DeepSeek-r1推理模型，其凭借强大的推理能力、擅长复杂任务、低成本以及开源等优势，短时间内迅速成为了全球AI领域的焦点。

·2025-02-08 06:32

DeepSeek-R1深度报告：基于Python强化学习的前沿长链推理模型揭秘与实战——兼谈SEO优化与实用经验分享

【DeepSeek-R1深度报告：基于Python强化学习的前沿长链推理模型揭秘与实战——兼谈SEO优化与实用经验分享】配合此文章使用，效果更佳：DeepSeek-R1深度报告——50道相关面试题——深刻理解相关概念

快撑死的鱼·2025-02-08 05:19

DeepSeek模型与OpenAI模型原理和技术架构的异同分析

OpenAI模型原理和技术架构的异同分析一、模型原理（一）DeepSeekR1DeepSeekR1的核心原理是基于强化学习（RL）的训练方式，其创新之处在于不依赖任何监督微调（SFT）数据，仅通过强化学习实现推理能力的自主进化

程序猿000001号·2025-02-08 04:10

vLLM显存优化

在使用vLLM框架进行大模型推理时，为了最大程度地减少GPU显存的占用，可以从以下几个方面调整参数和配置：1.调整max_batch_size参数max_batch_size：这是批处理的最大大小。

xnuscd·2025-02-08 04:07

qwen vllm function_call

教程：使用vLLM部署Qwen模型并实现工具调用前言vLLM是一个高效、易于使用的大型语言模型推理和部署库。

xnuscd·2025-02-08 04:07

【Ollama+Deepseek】本地化部署运行Deepseek模型

一、前言最近国内的深度求索公司发布的DeepSeek-r1推理模型，其凭借强大的推理能力、擅长复杂任务、低成本以及开源等优势，短时间内迅速成为了全球AI领域的焦点。

·2025-02-08 02:59

【论文阅读】DeepSeek-R1：通过强化学习激励LLMs的推理能力 | DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via RL

DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearningDeepSeek-R1：通过强化学习激励LLMs的推理能力

AI天才研究院·2025-02-07 22:05

推荐频道

归结演绎推理

0 Token 间间隔 100% GPU 利用率，百度百舸 AIAK 大模型推理引擎极限优化 TPS

云上一键部署 DeepSeek-V3 模型，阿里云PAI Model Gallery 最佳实践

DeepSeek-V3/R1上线背后的超低推理成本技术揭秘

『大模型笔记』国外大神对DeepSeek R1的科普！

2025年Python领域最新国际动态与技术趋势解析（截至2025年2月）

人工智能（Artificial Intelligence，简称AI）

AI知识库和全文检索的区别

2025清华：DeepSeek从入门到精通.pdf（附下载）

一文搞定多种Deepseek R1 部署方法，总有一款适合你

【AI学习】DeepSeek为什么强？

开启AI视觉推理新篇章：阿里云通义千问QVQ-72B-Preview模型深度解析

【LangChain编程：从入门到实践】构建记忆系统

AI 场景下，函数计算 GPU 实例模型存储最佳实践

【Black杂谈】是否有一种方法可以在二进制世界中准确描述现实世界？

【AI论文】LIMO：推理中少即是多

荣耀已接入DeepSeek-R1，荣耀手机系统版本MagicOS8.0及以上用户可用

DeepSpeed 在三台T4卡上部署deepseek-r1:32b

deepseek和chatgpt能力对比

华为云 + 硅基流动搭建满血版 Deepseek-R1 部署指南

硅基流动与华为云联合推出基于昇腾云的DeepSeek R1&；V3推理服务

谈大语言模型动态思维流编排

自动驾驶新风口：DeepSeek-R1 的“车端革命”

什么是AI人工智能

DeepSeek：如何表达需求

多头注意力机制的创新优化：MLA架构解析

片段阅读：行测高分的关键突破口

解锁DeepSeek大模Q型：超实用提示词技巧大放送

数学与光学：光的传播和干涉的数学描述

【Windows/C++/yolo开发部署03】将实例分割模型ONNX导出为 TensorRT 引擎：完整记录

DeepSeek-R1 原理解析及 Linux 本地部署详细教程

蒸馏：让DeepSeek用“移魂大法”增强你的小模型

混合专家模型 (MoE) 最全详细图解

DeepSeek-V3 技术报告 （核心技术，接近5万字）

DeepSeek-V3 Technical Report

一文搞懂DeepSeek - 开源模型R1

DeepSeek使用技巧，强烈建议收藏

多厂商宣布接入DeepSeek，迅易科技能帮助客户按需实现数智化革新

多厂商宣布接入DeepSeek，迅易科技能帮助客户按需实现数智化革新

DeepSeek-V3 横空出世：推理速度飙升，开源模型新王者诞生！

大语言模型多token预测技术

【AIGC魔童】DeepSeek v3推理部署：DeepSeek-Infer/ModelScope/ollama

组合问题--力扣第77题

ChatGPT入门- GPT 4.0 新手使用手册（结合案例讲解）

【Ollama+Deepseek】本地化部署运行Deepseek模型

DeepSeek-R1深度报告：基于Python强化学习的前沿长链推理模型揭秘与实战——兼谈SEO优化与实用经验分享

DeepSeek模型与OpenAI模型原理和技术架构的异同分析

vLLM显存优化

qwen vllm function_call

【Ollama+Deepseek】本地化部署运行Deepseek模型

【论文阅读】DeepSeek-R1：通过强化学习激励LLMs的推理能力 | DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via RL

DeepSeek-V3 技术报告（核心技术，接近5万字）