推理第5页

深夜炸弹阿里推理模型QwQ-32B开源及登顶

3月6日，全球最大的AI开源社区HuggingFace更新了大模型榜单，深夜突发，开源的阿里通义千问推理模型QwQ-32B成功登顶。

wx@aiotgman·2025-03-07 13:36

（24-1）DeepSeek中的强化学习：DeepSeek简介

DeepSeek以卓越的创新精神和前沿的技术架构，突破常规极限，将海量知识与智能推理完美融合，展现出惊人的计算力与思维深度。

码农三叔·2025-03-07 12:33

阿里深夜推出全新推理模型，仅1/20参数媲美DeepSeek R1满血版

一、参数效率革命：小体积承载大智慧阿里深夜推出全新推理模型，仅1/20参数媲美DeepSeekR1，就在刚才，阿里Qwen团队正式公布了最新研究成果——QwQ-32B大语言模型。

万事可爱^·2025-03-07 11:37

【AGI】DeepSeek开源周：The whale is making waves！

思维火花引言一、DeepSeek模型体系的技术演进1.通用语言模型：DeepSeek-V3系列2.推理优化模型：DeepSeek-R1系列3.多模态模型：Janus系列二、开源周三大工具库的技术解析1.

LeeZhao@·2025-03-07 09:10

Windows零门槛部署DeepSeek大模型：Ollama+7B参数模型本地推理全攻略

一、为什么选择Ollama+DeepSeek组合？1.1DeepSeek模型的三大核心优势中文语境霸主：在C-Eval榜单中，7B参数版本以82.3%准确率超越Llama2-13B6硬件友好：Int4量化后仅需5.2GB存储空间，GTX1060即可运行多模态扩展：支持与StableDiffusion联动生成图文报告1.2Ollama的颠覆性价值相较于传统部署方式，Ollama带来三大突破：开箱即用

zxg45·2025-03-07 09:33

深入探究LLamaFactory推理DeepSeek蒸馏模型时无法展示＜think＞思考过程的问题

文章目录问题背景初始测试与问题发现LLaMAFactory测试结果对照实验：Ollama测试系统性排查与解决方案探索1.尝试更换模板2.深入研究官方文档3.自定义模板实现优化界面展示：实现思考过程的可视化实现方法参数调整影响分析实验一实验二进入大模型应用与实战专栏|查看更多专栏内容问题背景最近在本地环境中部署了DeepSeek-R1-Distill-Qwen-1.5B，即由Qwen2.5-Math

羊城迷鹿·2025-03-07 08:00

DeepSeek：AI赋能的无限可能——从日常生活到职业进阶的全场景探索

引言在人工智能技术飞速发展的今天，DeepSeek作为一款国产AI工具，凭借其强大的推理能力、自然语言处理效率和场景化应用潜力，正在重塑人类解决问题的方式。

Hello kele·2025-03-07 08:21

【五.LangChain技术与应用】【31.LangChain ReAct Agent：反应式智能代理的实现】

但换成ReActAgent，它会先推理（Reasoning）需要调用哪个接口，再行动（Action）查询真实数据——这就是ReAct的核心：让AI学会「动脑子」再动手。

再见孙悟空_·2025-03-07 07:45

只需几步！在本地电脑轻松部署DeepSeek大模型

Ollama还允许用户通过编写Modelfile配置文件来自定义模型的推理参数，支持多GPU并行推理加速。二、安装Ollama（一）

魔法小匠·2025-03-07 01:42

飞书多维表格+DeepSeek R1：打工人必备的AI神器，效率暴涨1000%！[特殊字符]

导语当飞书多维表格遇上国产最强推理大模型DeepSeekR1，会擦出怎样的火花？本文手把手教你用「零代码」实现批量文案改写、论文精读、视频脚本生成。

sherlock__cc·2025-03-07 00:36

【大模型技术】LlamaFactory 的原理解析与应用

LlamaFactory是一个基于LLaMA系列模型（如LLaMA、LLaMA2、Vicuna等）的开源框架，旨在帮助开发者和研究人员快速实现大语言模型（LLM,LargeLanguageModel）的微调、推理和部署

大数据追光猿·2025-03-07 00:32

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机多卡-RTX 4090双卡（五）

是一种有效的自适应策略，它不会引入额外的推理延迟，并在保持模型质量的同时显着减少下游任务的可训练参数数量。2.2.参数

开源技术探险家·2025-03-06 23:26

揭秘AWS GPU实例：以极致AI算力与成本优化，重塑企业智能竞争力

面对动辄千亿参数的LLM大模型训练、实时高并发的AI推理场景，如何兼顾超强算力与极致成本？本文将深度解析AWSGPU实例的颠覆性技术方案，带您解锁AI时代的核心生产力。

AWS官方合作商·2025-03-06 23:55

LLaMA-2 7B 简介

LLaMA-2作为LLaMA的升级版本，专为更高效的推理和更广泛的应用场景设计，支持开源使用，并可用于研究和商业用途。

Ash Butterfield·2025-03-06 23:51

驭码CodeRider 闪电适配阿里QwQ-32B：8小时全栈集成，AI编程效率飞跃！

今日凌晨，国产大模型领域迎来重大突破：阿里正式发布32B推理模型QwQ-32B，根据Qwen公布的基准测试数据，QwQ-32B整体性能可媲美DeepSeek-R1，在数学推理、编程能力和通用能力等关键测试中展现出卓越性能

·2025-03-06 22:12

YOLOv8目标检测推理流程及C++代码

这部分主要是使用c++对Onnx模型进行推理，边先贴代码，过段时间再详细补充下代码说明。

吃鱼不卡次·2025-03-06 22:49

11页PDF | DeepSeek平民化：AI助力数据治理整体方案（附下载）

一、前言这份报告介绍了一种基于人工智能（AI）的智能数据治理整体方案，旨在通过AI的自然语言处理、学习能力、理解与推理能力等技术手段，解决传统数据治理中存在的问题，提升企业数据管理能力和效率。

Leo.yuan·2025-03-06 21:41

YoLo运用学习7

目录前言一、C#环境使用YoLo模型进行AI推理检测1.加载图片2.图片预处理3.加载onnx模型并推理4.数据后处理5.图片属性值缩放还原和反归一化6.将解析到的信息的集合绘制成处理后图片总结前言根据

老农民编程·2025-03-06 19:51

大模型入门

24k小善·2025-03-06 17:05

媲美满血R1+，刚刚，阿里推理模型QwQ-32B开源

X.Cristiano·2025-03-06 17:03

英伟达常见产品使用场景对比说明

未公开（企业级）超大规模AI训练（千亿参数）、HPC比A100性能提升3-6倍（BERT训练），FP8精度加速显著H800(PCIe)80GBHBM2e600GB/s未公开（受管制）中等规模AI训练/推理

放羊郎·2025-03-06 14:37

Claude 3.7 Sonnet：AI 界的变革先锋，重塑智能体验

一、创新混合推理模式，灵活应对多元需求Claude3.7Sonnet最大的亮点，便是其开创性的“一个模型，两种思考方式”。它融合了标准思考与扩展思维模式，为用户带来前所未有的灵活体验。

a小胡哦·2025-03-06 14:03

覆盖数学/代码/科学/谜题，高质量推理数据集汇总，助力复现 DeepSeek 超强推理能力

近期，DeepSeek-R1引发的推理模型热潮仍在持续走高——1月31日，OpenAI推出全新推理模型o3-mini；2月18日，xAI推出Grok3，包含具备推理能力的Grok-3ReasoningBeta

·2025-03-06 14:22

深度学习模型未来可能会在这些领域取得突破性进展

潜在突破：更强的推理和抽象能力，解决复杂问题。结合多模态数据（文本、图像、声音等）实现更全面的理解。自我学习和适应能力，减少对大量标注数据的依赖。

xinxiyinhe·2025-03-06 13:55

大模型的实践应用30-大模型训练和推理中分布式核心技术的应用

大家好，我是微学AI，今天给大家介绍一下大模型的实践应用30-大模型训练和推理中分布式核心技术的应用。本文深入探讨了大模型训练和推理中分布式核心技术的应用。

微学AI·2025-03-06 11:11

【AI大模型应用开发】【LangChain系列】5. 实战LangChain的智能体Agents模块

在我前面的MetaGPT系列文章中，已经对智能体有了一个认知，重温一下：智能体=LLM+观察+思考+行动+记忆将大语言模型作为一个推理引擎。

同学小张·2025-03-06 10:03

【无标题】大模型智能涌现的数学本质与底层机制

语言建模的数学基础大模型的核心任务是基于概率链式法则建模语言序列：P(w1,...,wn)=∏t=1nP(wt∣w10^{11})时出现能力相变相变示例：参数量级涌现能力数学机制10^9基础语法低维流形建模10^11多步推理高维空间路径积分

调皮的芋头·2025-03-06 07:09

自然语言模型（NLP）介绍

例如，DeepSeek通过强化学习提升推理能力，其混合专家架构（MoE）显著优化了计算效率‌。二、核心技术解析1.DeepSeek模型架构混合专家模型（MoE）：DeepSeek-V3采用Mo

Liudef06·2025-03-06 04:11

阿里巴巴宣布：全面开源旗下视频生成模型万相2.1

据介绍，此次开源基于Apache2.0协议，14B和1.3B两个参数规格的全部推理代码和权重全部开源，同时支持文生视频和图生视频任务，全球开发者可在Github、HuggingFace和魔搭社区下载体验

大公产经晚间消息·2025-03-06 04:10

INA(In-Network Aggregation)技术

In-NetworkAggregation（网络内聚合）是大模型分布式训练或推理中优化通信效率的一种技术，核心思想是在网络传输路径中直接完成数据聚合，而非依赖终端节点处理，从而降低通信开销、提升整体效率

一只积极向上的小咸鱼·2025-03-06 01:22

AI 自动剪视频神器，小白也能轻松上手！

✨软件介绍易剪媒是一款纯净无广告的AI自动剪视频工具，基于DeepSeek对话式AI技术（DS-V3模型）进行分析推理。只需根据描述的要求以处理命令的形式交给AI，即可自动输出视频。

6v6-博客·2025-03-06 01:50

Search-o1：智体搜索增强的大型推理模型

大型推理模型(LRM)（例如OpenAI-o1）已通过大规模强化学习展示长步推理能力。然而，它们的扩展推理过程通常会受到知识不足的影响，从而导致频繁出现不确定性和潜在错误。

三谷秋水·2025-03-05 22:53

一次性了解OpenAI的“草莓”（Strawberry）超强实力

OpenAI预计在秋季推出的代号为“草莓”（Strawberry）的新AI模型，是其在AI推理领域的一项重要突破。该项目的成功也将为人类实现通用人工智能（AGI）目标迈出重要一步。

金融街小单纯·2025-03-05 22:51

C++使用Onnxruntime/TensorRT模型推理

onnxruntime和tensorrt是我们常用的两种推理方式，下面整理了两个推理示例，仅供参考。

奇华智能·2025-03-05 16:30

基于K8S设计实现机器学习管理调度平台

设计和实现一套基于Kubernetes(K8s)的机器学习管理调度平台，目标是利用K8s的容器化和调度能力，提供高效的资源管理、任务调度、可扩展性及灵活性，适应机器学习（ML）训练、推理等不同场景的需求

richenlin·2025-03-05 15:56

一文看懂 DeepSeek 版本全解析

一）DeepSeek-V1：初露锋芒（二）DeepSeek-V2系列：性能进阶（三）DeepSeek-V2.5系列：能力提升（四）DeepSeek-V3系列：卓越性能（五）DeepSeek-R1系列：推理强者三

奔跑吧邓邓子·2025-03-05 13:03

DeepSeek 各版本的区别

训练数据：14.8万亿Token预训练，推理速度较快（每秒

dushky·2025-03-05 12:25

Efficient Large Language Models: A Survey

高效的大型语言模型综述摘要1引言2模型为中心的方法3数据为中心的方法4LLM框架5结论摘要大型语言模型（LLM）在自然语言理解、语言生成和复杂推理等重要任务中表现出了非凡的能力，并有可能对我们的社会产生重大影响

UnknownBody·2025-03-05 09:00

pytorch 模型测试

在使用PyTorch进行模型测试时，一般包含加载测试数据、加载训练好的模型、进行推理以及评估模型性能等步骤。以下为你详细介绍每个步骤及对应的代码示例。

小赖同学啊·2025-03-05 07:24

2025年初-值得关注的几款推理模型

1Claude3.7SonnetClaude3.7Sonnet是由AI研究公司Anthropic开发的最新混合推理模型，于2025年2月24日发布。

数据分析能量站·2025-03-05 01:24

大语言模型原理与工程实践：大语言模型推理工程推理加速：算子优化

其中，推理（Inference）过程是大语言模型的核心环节之一。然而，随着模型规模的不断扩大，推理过程中的计算复杂度和延时也逐渐成为制约模型应用的重要因素。

AI天才研究院·2025-03-04 22:32

大模型推理速度测评的实战代码

今天给大家带来的文章是大模型推理速度测评的实战代码，希望能对学习大模型的同学们有所帮助

herosunly·2025-03-04 21:59

AI边缘处理设备怎么合理分配宽带和运行资源

边缘设备通常面临有限的资源，但需要处理大量的数据流和计算任务，尤其是在AI推理和实时数据处理的场景下。

码农的日常搅屎棍·2025-03-04 19:42

Deepseek的底层架构思维构成

通过低秩联合压缩技术，将键（Key）和值（Value）矩阵压缩到潜在空间，显著减少推理时的显存占用。例如，MLA可将显存需求降至传统多头注意力（MHA）的个位数百分比。

堕落年代·2025-03-04 19:09

蚂蚁技术研究院发布推理大模型强化学习框架，邀请开发者共同助力 AGI 生态

AReaL源自开源项目ReaLHF，旨在训练每个人都可以复现和贡献的大型推理模型(LRM)。AReaL是蚂蚁技术研究院为开发一个完全开放和包容的AGI世界迈出的一步。

·2025-03-04 10:52

北大版，86页DeepSeek黑科技手册！比清华版更炸裂（免费下载）

这份文档刚在学术圈炸锅，作为国内首个系统性拆解推理大模型（DeepSeek-R1）落地方案的公开资料，其价值不仅在于揭示了一款国产模型的工程实践，更折射出大模型技术从实验室走向产业化的关键路径。

2501_90850230·2025-03-04 09:55

小白也能十分钟打造自己的推理大模型！unsloth+Colab+DeepSeek-R1-Distill-Llama-8B轻松上手

小白也能十分钟打造自己的推理大模型！

AI超元域·2025-03-04 07:08

私有部署 ChatGLM3-6B

1.在AutoDL平台上租赁GPUGPU型号：RTX4090PyTorch版本：2.5.1**（推荐使用2.0及以上的版本，以获得最佳的推理性能）**2.开启学术资源加速source/etc/network_turbo3

张申傲·2025-03-04 03:16

DeepSeek-OpenSourceWeek-第六天-Inference System Overview

开源周的第6天，DeepSeek对DeepSeek-V3/R1推理系统进行了深入概述。本文将深入探讨该系统的设计原则、优化策略以及性能统计数据，重点突出在吞吐量和延迟优化方面取得的显著进展。

数据分析能量站·2025-03-04 01:57

DeepSeek-R1：通过强化学习激励大型语言模型的推理能力

摘要我们介绍了第一代推理模型DeepSeek-R1-Zero和DeepSeek-R1。

AI专题精讲·2025-03-03 22:05

推荐频道

推理

深夜炸弹 阿里推理模型QwQ-32B开源及登顶