确定性推理第15页

如何在VSCode中免费使用DeepSeek R1：本地大模型编程助手全攻略

1.1开源的推理王者1.2性能实测对比二、三步搭建本地AI编程环境2.1硬件准备指南2.2三大部署方案详解方案一：LMStudio（新手友好）方案二：Ollama（Docker玩家首选）方案三：Jan（

tamak·2025-02-12 19:38

最通俗易懂的方式，由浅入深地讲讲DeepSeek（深度求索）

简单说，DeepSeek是一家专注做通用人工智能（AGI）的中国公司，目标就是让AI能像人类一样理解、推理、解决复杂问题。

Jing_saveSlave·2025-02-12 19:07

上海站 | 2025 Seeed x LeRobot 具身智能黑客松报名开启！

SeeedxLeRobot具身智能黑客松现邀请所有对在机器人领域训练模仿学习策略，并实时进行推理部署感兴趣的人，共同创造具有影响力的创新解决方案。

·2025-02-12 18:01

人工智能能否超过人类智能

论人工智能能否超过人类智能首先是智能的量纲问题：是逻辑、推理、抽象、想象、语言、情感、自我意识还是其它。

CaiGbro·2025-02-12 17:53

普惠AI 如何在 Anolis OS 8 上部署生产可用的 DeepSeek 推理服务

背景介绍DeepSeek-R1DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。

·2025-02-12 17:52

DeepSeek-R1蒸馏技术：让小模型“继承”大模型的推理超能力

最近有不少朋友来询问Deepseek的核心技术，陆续针对DeepSeek-R1论文中的核心内容进行解读，并且用大家都能听懂的方式来解读。当大模型成为“老师”，小模型也能变“学霸”想象一下，一位经验丰富的数学老师（大模型）将自己解题的思维过程一步步拆解，手把手教给学生（小模型）。学生通过模仿老师的思路和技巧，最终也能独立解决复杂的题目——这就是“”模型蒸馏（Distillation）“”的核心思想。

马拉AI·2025-02-12 15:34

pytorch深度学习模型推理和部署、pytorch&ONNX&tensorRT模型转换以及python和C++版本部署

目录1.采用pytorch进行推理2.采用onnx进行推理2.1pytorch转换为onnx2.2onnx推理3.采用tensorrt进行推理（python环境）3.1onnx转engine文件3.2tensorrt

机械心·2025-02-12 10:40

OpenAI重磅更新：发布目前最强推理模型ChatGPT-o1，新鲜测试出炉，草莓快要成熟了

这次更新标志着OpenAI在人工智能推理能力上的重大突破，推出了其最新的大语言模型——o1-preview和o1-mini。这一更新揭开了已经预热接近一年的“Q*/草莓项目”的神秘面纱。

机械心·2025-02-12 10:39

昇腾，Ascend，NPU，mindie，镜像，部署vllm：第4篇，尝试多模态大模型部署（Qwen2-vl）

（当然是在昇腾环境下）提示：需要把这篇文章先看一遍昇腾，mindie，镜像，部署vllm：第2篇，启动mindieservice_daemon服务，支持对Qwen2.5的7B版本的推理提示：本文章的撰写思路是

几道之旅·2025-02-12 10:36

策略泛化的无动作推理

25年2月来自斯坦福的论文“Action-FreeReasoningforPolicyGeneralization”。端到端模仿学习为训练机器人策略提供一种有前途的方法。然而，泛化到新环境（例如未见过的场景、任务和目标实例）仍然是一项重大挑战。尽管大规模机器人演示数据集已显示出诱导泛化的潜力，但它们的规模化需要大量资源。相比之下，人类视频数据丰富多样，提供一种有吸引力的替代方案。然而，这些人类视频

硅谷秋水·2025-02-12 07:44

【通往通用人工智能AGI之路】第8章: 认知架构

AGI系统架构需要综合考虑认知、学习、推理、规划等多个方面,设计灵活、可扩展、鲁棒的系统框架;AGI系统实现需要针对不同的任务和场景,开发高效、可靠、可解释的算法和模型。

AI天才研究院·2025-02-12 06:04

手把手教学，DeepSeek-R1微调全流程拆解

手把手教学，DeepSeek-R1微调全流程拆解原创极客见识GeekSavvy2025年02月09日09:02广东DeepSeek通过发布其开源推理模型DeepSeek-R1颠覆了AI格局，该模型使用创新的强化学习技术

AI生成曾小健·2025-02-12 05:01

开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机多卡-RTX 4090双卡（十五）

是一种有效的自适应策略，它不会引入额外的推理延迟，并在保持模型质量的同时显着减少下游任务的可训练参数数量。2.2.参数高效微调(PEF

开源技术探险家·2025-02-12 04:50

对DeepSeek-R1通过强化学习提升大型语言模型推理能力的技术原理解析

•关键要素：包括环境（模型所处的推理任务场景）、状态（模型在推理过程中的当前情况，如已有的推理步骤、已知信息等）、动作（模型在当前状态下做出的推理决策，如选择何种推理方法、如何组织语言等）、奖励（根据模型的动作和结果给予的反馈

一只贴代码君·2025-02-12 02:12

模型轻量化

影响神经网络推理速度主要有4个因素：FLOPs、MAC、计算并行度、硬件平台架构与特性（算力、GPU内存带宽）模型压缩工业界主流的模型压缩方法有：知识蒸馏（KnowledgeDistillation，KD

莱茶荼菜·2025-02-11 22:10

时间序列分析 | Python实现时间序列不确定性建模

时间序列分析|Python实现时间序列不确定性建模目录时间序列分析|Python实现时间序列不确定性建模基本介绍研究方法概率分布建模分位数回归学习总结基本介绍基础的时间序列预测任务的目标是给定历史序列，

前程算法屋·2025-02-11 22:37

深度学习中模型轻量化及具体方案应用

模型轻量化的核心目标是提高推理速度、降低功耗、减少内存占用，以便在边缘设备上实现实时性或低延迟的响应。

码上就位·2025-02-11 22:36

大模型推理服务全景图

作者：望宸随着DeepSeekR1和Qwen2.5-Max的发布，国内大模型推理需求激增，性能提升的主战场将从训练转移到推理。由于无论是训练还是推理，如何提升性能都是业内讨论最多的话题之一。

·2025-02-11 21:12

PID控制详解

控制简介PID(ProportionalIntegralDerivative)控制是最早发展起来的控制策略之一，由于其算法简单、鲁棒性好和可靠性高，被广泛应用于工业过程控制，尤其适用于可建立精确数学模型的确定性控制系统

鹿屿二向箔·2025-02-11 20:50

换平台对比推理能力:DeepSeekR1强于Gemini2.0Flash

和Gemini2.0Flash(不是Gemini2.0FlashThinkingExperimental)，仍然是之前一道小学数学应用题的解答和推理能力。

stereohomology·2025-02-11 19:43

Gemini 2.0 FlashThinking Experimental答对这个问题只需要提示一次

目前来说，这两个模型的推理能力的确最好。其它的推理能力都还是垃圾。

stereohomology·2025-02-11 19:13

DeepSeek-MoE-16b：高效稀疏架构引领大模型降本增效革命

DeepSeek-MoE-16b是深度求索（DeepSeek）研发的混合专家模型（MixtureofExperts,MoE），参数规模160亿，旨在通过稀疏化计算架构解决传统稠密模型（如Llama2、GPT-3）的高训练与推理成本问题

热爱分享的博士僧·2025-02-11 18:36

年度人力费用你管对了吗？

在经济形势充满不确定性、各行各业纷纷寻求降本增效的大背景下，众多企业将控制人力总费用作为关键举措。然而由于缺乏科学的总控方法，不少公司虽然短期内看似降低了费用，却可能引发诸多负面连锁反应。

·2025-02-11 16:59

2025年2月第一周国内外科技资讯精选（软件工程与Python领域）

一、AI与Python工具链的深度整合OpenAI与谷歌的模型竞赛OpenAI推出的免费推理模型o3-mini在数学代码生成和物理模拟领域表现突出，尤其擅长生成符合物理定律的代码（如动态Shader、游戏逻辑

虫洞没有虫·2025-02-11 15:48

LLM推理优化——PagedAttention初识篇（vLLM初识（二））

LLM推理优化——PagedAttention初识篇（vLLM初识（二））前言在LLM推理优化——KVCache篇（百倍提速）中，我们已经介绍了KVCache技术的原理，从中我们可以知道，KVCache

荼荼灰·2025-02-11 15:44

C#中的非托管资源释放机制详解|Finalizer与Dispose模式

UnmanagedResources）1.3混合型资源1.4非托管资源释放的必要性2释放非托管资源2.1Finalizer（终结器、析构函数）2.1.1定义2.1.2工作原理与问题2.1.2.1工作原理不确定性对内存删除时间的延迟影响

Nita.·2025-02-11 12:57

DeepSeek R1 简易指南：架构、本地部署和硬件要求

DeepSeek团队近期发布的DeepSeek-R1技术论文展示了其在增强大语言模型推理能力方面的创新实践。该研究突破性地采用强化学习（Reinfo

·2025-02-11 12:49

0 Token 间间隔 100% GPU 利用率，百度百舸 AIAK 大模型推理引擎极限优化 TPS

01什么是大模型推理引擎大模型推理引擎是生成式语言模型运转的发动机，是接受客户输入prompt和生成返回response的枢纽，也是拉起异构硬件，将物理电能转换为人类知识的变形金刚。

·2025-02-11 11:44

云上一键部署 DeepSeek-V3 模型，阿里云PAI Model Gallery 最佳实践

为了实现高效的推理和成本效益的训练，DeepSeek-V3采用了MLA（Multi-headLatentAttention）和DeepSeekMoE架构。

·2025-02-11 11:44

DeepSeek-V3/R1上线背后的超低推理成本技术揭秘

百度智能云针对此次模型上线提供了行业领先的超低推理价格，低至DeepSeek官方刊例价3-5折，当前还可享受限时免费服务。

·2025-02-11 11:33

『大模型笔记』国外大神对DeepSeek R1的科普！

时间线推理与Agent推理模型≠Agent推理为什么重要推理需要变得廉价R1的重要意义AI的发展走势预训练规模扩张的路走不通了推理阶段的规模定律缩小模型体量（新的规模定律？）强化学习（新的规模定律？）

AI大模型前沿研究·2025-02-11 09:02

2025年Python领域最新国际动态与技术趋势解析（截至2025年2月）

一、AI与Python的深度融合：从模型部署到开发工具OpenAI与谷歌的模型竞赛OpenAI近期推出的免费推理模型o3-mini在数学代码生成和物理模拟领域表现突出，尤其在Python生态中，开发者可通过

虫洞没有虫·2025-02-11 08:57

人工智能（Artificial Intelligence，简称AI）

这些任务包括学习、推理、问题解决、感知、语言理解等。人

Kingdom_Garden·2025-02-11 07:50

AI知识库和全文检索的区别

1、AI知识库的作用AI知识库是基于人工智能技术构建的智能系统，能够理解、推理和生成信息。

xixingzhe2·2025-02-11 07:44

2025清华：DeepSeek从入门到精通.pdf（附下载）

DeepSeek是一家中国科技公司，专注于通用人工智能（AGI）的研发，其开源推理模型DeepSeek-R1在处理复杂任务方面表现出色，并且可以免费商用。

AI方案2025·2025-02-11 04:55

一文搞定多种Deepseek R1 部署方法，总有一款适合你

它不仅在数学、编程、自然语言推理等任务上全面对标甚至超越了OpenAI的o1，而且训练成本仅

sznormal·2025-02-11 04:21

【AI学习】DeepSeek为什么强？

四个方面：模型的智能水平、训练成本、推理成本和用户体验。一、DeepSeek的智能水平DeepSeekV3的智能水平，技术报告展现的性能对比图：是什么导致了DeepSeek的模型性能，是模型架构吗？

bylander·2025-02-11 03:17

开启AI视觉推理新篇章：阿里云通义千问QVQ-72B-Preview模型深度解析

近年来，人工智能领域取得了显著进展，其中多模态推理模型的兴起尤为引人注目。这些模型能够理解和处理多种类型的信息，例如文本、图像和视频，从而实现更高级别的智能。

·2025-02-11 03:57

【LangChain编程：从入门到实践】构建记忆系统

【LangChain编程：从入门到实践】构建记忆系统关键词：LangChain,编程范式,记忆系统,对话系统,AI,NLP,知识库,推理1.背景介绍在人工智能领域，对话系统的研究与应用已经取得了显著的进展

杭州大厂Java程序媛·2025-02-11 01:57

AI 场景下，函数计算 GPU 实例模型存储最佳实践

作者：有松当前，函数计算FC已被广泛应用在各种AI场景下，函数计算支持通过使用容器镜像部署AI推理应用，并且提供多种选项来访问训练好的模型。

·2025-02-10 23:53

【AI论文】LIMO：推理中少即是多

摘要：我们提出了一项重大发现，这一发现挑战了我们对大型语言模型中复杂推理能力涌现方式的理解。传统观点认为，复杂的推理任务需要大量的训练数据（超过10万例）。

东临碣石82·2025-02-10 16:55

互联网企业线上业务拓展与开源AI智能名片2+1链动模式S2B2C商城小程序的创新应用

然而，这一过程充满了挑战与不确定性，互联网泡沫的破灭使企业深刻反思，开始关注用户价值的实现。在此背景下，“开源AI智能名片2+1链动模式S2B2C商城小程序”应运而生，成为互联网企业转型升

说私域·2025-02-10 16:51

荣耀已接入DeepSeek-R1，荣耀手机系统版本MagicOS8.0及以上用户可用

以下是关于这一事件的详细介绍：DeepSeek-R1的强大能力DeepSeek-R1是一款先进的语言模型，具备强大的自然语言处理能力、逻辑推理能力和上下文理解能

2501_90444774·2025-02-10 14:10

DeepSpeed 在三台T4卡上部署deepseek-r1:32b

如果你只需要使用DeepSpeed在三台T4卡上部署deepseek-r1:32b模型进行推理，而不进行训练，可以按照以下步骤进行部署。推理部署的重点是利用多台机器和多块GPU来加速模型的推理过程。

MonkeyKing.sun·2025-02-10 14:33

deepseek和chatgpt能力对比

它的能力在一些评测中表现良好，特别是在中文理解、数学推理和代码能力方面。

分享是一种传递，一种快乐·2025-02-10 12:51

华为云 + 硅基流动搭建满血版 Deepseek-R1 部署指南

而华为云与硅基流动联合推出的基于昇腾云服务的DeepSeekR1推理服务，更是为大家带来了更优的使用体验和部署方案。今天，我就来详细介绍一下如何基于华为云与硅基流动部署满血版Deepseek-R1。

Vincent_Han·2025-02-10 12:20

硅基流动与华为云联合推出基于昇腾云的DeepSeek R1&；V3推理服务

经过硅基流动和华为云团队连日攻坚，现在，双方联合首发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。

光锥智能·2025-02-10 12:14

谈大语言模型动态思维流编排

但是就目前而言，这种分析，推理能力还是不能能准确地做出推理另一方面，对于大多数特定的问题而言，人类本身具有了成熟，有效的分析问题

姚家湾·2025-02-10 10:31

自动驾驶新风口：DeepSeek-R1 的“车端革命”

DeepSeek-R1模型是一个开源推理模型，可以随意蒸馏形成小模型，那么这种模型，对未来任何产业都能够产生很大的影响。那么我们汽车行业的智能驾驶/自动驾驶呢？

大模型入门学习·2025-02-10 07:30

IFPP-02

COVID-19之后，出现了明显的回流（onshoring）趋势，这是由多种因素驱动的，包括供应链中断、地缘政治紧张和贸易不确定性。2.

SofterICer·2025-02-10 06:49

推荐频道

确定性推理