YOLOX模型转换推理第4页

模型蒸馏、量化、裁剪的概念和区别

然而，这些模型通常具有大量的参数和复杂的结构，导致模型体积庞大、计算资源消耗高和推理时间长。这些问题限制了深度学习模型在资源受限设备（如移动设备、嵌入式系统）上的应用。

我就是全世界·2025-02-06 22:24

[论文笔记] Deepseek技术报告

1.总体概述背景与目标报告聚焦于利用强化学习（RL）提升大型语言模型（LLMs）的推理能力，旨在探索在不依赖大规模监督微调（SFT）的情况下，模型如何自我进化并形成强大的推理能力。

心心喵·2025-02-06 22:53

Deepseek-r1、o3-Mini 和 Qwen 2.5 MAX，谁才是你的菜？

这下它终于坐不住了，发布了新推理模型系列o3-mini。这个模型不仅首次向免费用户开放，成本还比之前的o1系列降低了15倍。和GPT-4O、GPT模型家族不同，AI模型的“O”系列专注于推理任务。

·2025-02-06 17:21

大型推理模型（LRM）的比较 OpenAI DeepSeek R1 Gemini 2.0

大型推理模型（LRM）的比较OpenAIDeepSeekR1Gemini2.0阅读时长：25分钟发布时间：2025-02-06近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容

·2025-02-06 17:20

Deepseek-r1、o3-Mini 和 Qwen 2.5 MAX，谁才是你的菜？

这下它终于坐不住了，发布了新推理模型系列o3-mini。这个模型不仅首次向免费用户开放，成本还比之前的o1系列降低了15倍。和GPT-4O、GPT模型家族不同，AI模型的“O”系列专注于推理任务。

·2025-02-06 17:11

DeepSeek 最新推理模型 R1-Lite：一场数学题的死胡同之旅

在人工智能技术的飞速发展中，推理模型成为了AI展现深度理解能力的重要工具。它们不仅能够处理复杂的自然语言任务，还能在某些领域表现出近似人类思维的推理能力。然而，即便是最先进的推理模型也并非无懈可击。

霍格沃兹测试开发学社测试人社区·2025-02-06 15:40

DeepSeek-R1真算得上开源吗？

OpenAIo1模型证明，当LLM在推理时，通过增加计算量进行类似训练后，它们在数学、编程和逻辑等推理任务上的表现显著提升。然而，OpenAI推理模型的训练方法一直是秘密。

·2025-02-06 13:37

yolov5 实例分割：从原理、构建数据集到训练部署

yolov5实例分割：从原理、构建数据集到训练部署1.模型介绍1.1YOLOv5结构1.2YOLOv5推理时间2.构建数据集2.1使用labelme标注数据集2.2生成coco格式label2.3coco

外卖猿·2025-02-06 12:15

在 Python 中生成一个简单的类 GPT 软件?

本文将详细介绍实现这一目标的具体步骤，涵盖环境搭建、数据准备、模型选择、训练与推理等多个方面。二、环境搭建2.1安装Python首先要确保系统中安装了Python。建议使用Python3.7及以上版本

一只小灿灿·2025-02-06 10:37

国家超算平台上线DeepSeek - R1系列模型：开启AI新征程

它用了强化学习训练，推理的时候会反复思考验证，思维链能有好几万字长。在数学、代码编写和复杂逻辑推理这些方面，表现相当厉害

CodeJourney.·2025-02-06 08:25

SGlang 专为大模型设计的高效服务框架

SGlang是一种专为大型语言模型（LLM）和视觉语言模型（VLM）设计的高效服务框架，旨在提升模型的推理速度和灵活性。

kcarly·2025-02-06 08:52

DeepSeek等强大推理大模型出现后，提示工程还有必要么？

提示的主要目的是人和模型沟通，是为了更好的激发模型做各种任务，只能说语言模型越强大，沟通的难度会较低，沟通形式更简单，提示工程”之所以被称为“工程”，主要基于以下多方面原因：1.系统性与复杂性多要素协同：如同传统工程涉及多个环节与要素协同作业，提示工程也需综合考量众多因素。比如，在设计提示时，不仅要明确任务目标，像让语言模型生成新闻稿、故事，还是进行代码纠错等，还要考虑模型自身特点，不同的大语言模

alphaAIstack·2025-02-06 04:46

使用vLLM部署Qwen2.5-VL-7B-Instruct模型的详细指南

部署Qwen2.5-VL-7B-Instruct模型的详细指南引言环境搭建安装vLLM安装依赖库下载模型启动vLLM服务器总结参考引言近年来，随着大规模语言模型（LLM）的快速发展，如何高效地进行模型推理成为了一个热门话题

engchina·2025-02-06 03:40

DeepSeek-R1：通过强化学习提升大型语言模型推理能力的探索

DeepSeek-R1：通过强化学习提升大型语言模型推理能力的探索在人工智能领域，大型语言模型（LLMs）的发展日新月异，其在自然语言处理和生成任务中的表现逐渐接近人类水平。

kaichu2·2025-02-06 03:07

大语言模型轻量化：知识蒸馏的范式迁移与工程实践

摘要在大型语言模型（LLM）主导人工智能发展的当下，模型参数量与推理成本的指数级增长已成为制约技术落地的核心瓶颈。

LucianaiB·2025-02-06 02:04

【Mamba之模型训练系列（四）】将 mamba 扩展到多模态大型语言模型，实现高效推理

将mamba扩展到多模态大型语言模型，实现高效推理背景知识与研究动机Cobra模型设计视觉编码器DINOv2SigLIP投影器Mamba语言模型主干训练策略训练数据训练阶段预训练阶段多模态指令调整阶段微调策略训练细节训练策略的关键结论实验验证实验设置性能比较推理速度消融研究关键结论参考文献这篇文章介绍了一个名为

愷创作者·2025-02-06 00:45

什么是大模型框架？常用的大模型框架盘点对比

什么是大模型框架大模型框架是指用于训练、推理和部署大型语言模型（LLMs）的软件工具和库。

AI产品经理·2025-02-05 21:25

昇腾设备torch_npu推理配置

1.Ascend310B1的npu推理思路在昇腾Ascend310B1NPU上基于PyTorch进行推理时，通过torch_npu替换原有GPU/CUDA操作。

时间逝世298·2025-02-05 20:21

DeepSeek R1技术报告关键解析(5/10)：知识蒸馏：如何让小模型也能具备强推理能力？

大模型通常计算量大、推理速度慢，而小模型虽然计算资源消耗更少，但推理能力往往不如大模型。通过知识蒸馏，小模型可以继承大模型的推理能力，同时保持较低的计算成本。

董董灿是个攻城狮·2025-02-05 19:43

TensorRT-LLM保姆级教程（一）-快速入门

随着大模型的爆火，投入到生产环境的模型参数量规模也变得越来越大（从数十亿参数到千亿参数规模），从而导致大模型的推理成本急剧增加。

大模型部署·2025-02-05 18:38

知识蒸馏教程 Knowledge Distillation Tutorial

来自于：KnowledgeDistillationTutorial将大模型蒸馏为小模型，可以节省计算资源，加快推理过程，更高效的运行。

Qiming_v·2025-02-05 17:03

昆仑天工SkyWork：更懂中文的AIGC开源模型

昆仑天工SkyWork系列AIGC开源模型，由奇点智源公司研发，在2022年12月发布，覆盖图像、文本、编程等多模态内容生成能力，包括绘画、文章续写、对话、中英翻译、内容风格生成、推理、诗词对联、代码补全等

AIGC探索家·2025-02-05 16:52

昆仑万维官宣开源2000亿稀疏大模型Skywork-MoE

6月3日，昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE，性能强劲，同时推理成本更低。

TMT星球·2025-02-05 16:50

国产AI大爆发！讯飞星火X1横空出世，直接“杀疯”成中文数学王者？

而今天要给大家介绍的这个主角——讯飞星火深度推理模型X1，那可是最近科技圈的一大热点。为啥它值得我们重视呢？要知道，中文数学能力在AI

盼达思文体科创·2025-02-05 15:15

【LangChain编程：从入门到实践】代码实践

在早期,AI主要集中于基于规则的系统和专家系统,试图模拟人类的推理过程。然而,随着大数据时代的到来和计算能力的飞速提升,机器学习和深度学习技术开始占据主

AI天才研究院·2025-02-05 14:09

基于深度学习的车牌检测识别系统 —— 使用YOLOv5实现车牌检测与识别

系统功能概述2.2系统架构数据准备与处理3.1数据集选择与收集3.2数据标注3.3数据集划分YOLOv5模型训练与优化4.1YOLOv5配置文件4.2安装YOLOv5并开始训练4.3模型评估与优化车牌识别与推理

2025年数学建模美赛·2025-02-05 12:20

如何利用DeepSeek打造医疗领域专属AI助手？从微调到部署全流程解析

一、基座模型选型：医疗推理的黄金搭档1.1为什么选择DeepSeek-R1-Distill-Llama-8

明哲AI·2025-02-05 10:05

怎么在家用笔记本上轻松部署和使用DeepSeek R1?

而且在数学、编程等领域表现出众，可处理复杂逻辑推理任务，如果你不了解蒸馏技术文末也会提供相关的拓展知识运行

程序员辣条·2025-02-05 10:32

国内首个！百度成功点亮昆仑芯三代万卡集群，将于近日点亮3万卡集群

而24年9月升级的百度百舸AI异构计算平台4.0，围绕落地大模型全旅程的算力需求，在集群创建、开发实验、模型训练、模型推理四大方面，能为企业提供“多、快、稳、省”的AI基础设施，在万卡集群的建设中发挥了至关

·2025-02-05 09:50

metagpt中ActionNode的用法

THINK_NODES类：4.ThinkAction类：5.SimplePrint类：6.Printer类：7.main函数：总结：主要执行流程：代码参考链接：整体流程实现一个基于节点(Node)结构和思维推理的系统

ZHOU_WUYI·2025-02-05 08:20

Ollama能本地部署Llama 3等大模型的原因解析（ollama核心架构、技术特性、实际应用）

文章目录前言1、Ollama的核心架构和技术能力1.1、高效模型加载和存储1.2、推理优化1.3、微调支持1.4、部署工具链2.、Llama3模型的技术特性2.1、模型架构2.2、模型性能3.

周杰伦_Jay·2025-02-05 03:19

ChatGPT怎么回事？

纯属发现，调侃一下~这段时间deepseek不是特别火吗，尤其是它的推理功能，突发奇想，想用deepseek回答一些问题，回答一个问题之后就回复服务器繁忙（估计还在被攻击吧~_~）然后就转向了GPT，真的被笑到了

cimeo·2025-02-05 00:23

揭秘DeepSeek R1大模型：它如何像人类一样“思考”？

而近期备受关注的DeepSeekR1，凭借更高效的推理能力和更低能耗，成为行业焦点。今天，我们将深入它的“大脑”，看看它是如何工作的！

大模型扬叔·2025-02-04 20:00

PyTorch中的In-place操作是什么？为什么要避免使用这种操作？

点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达导读In-place操作用在推理的时候可以显著节省内存，但是训练的时候一定要小心使用。

小白学视觉·2025-02-04 19:49

基于 FPGA 的 CNN 卷积神经网络整体实现

FPGA以其并行处理能力、低延迟和灵活性，是加速CNN推理的理想硬件平台。通过在FPGA上实现CNN，可以显著提高实时应用中的推理效率。应用使用场景实时图像识别：如智能手机摄像头中的面部识别。

鱼弦·2025-02-04 18:37

超级好用、超准文字识别框架----飞浆PaddlePaddleOCR（文件检测+识别）实战篇

目录简介项目介绍安装难点问题解决办法参数介绍模型推理调用简介飞桨（PaddlePaddle）OCR（OpticalCharacterRecognition）是一个开源的深度学习框架，用于文字识别任务。

数虫·2025-02-04 14:46

QwQ-32B-Preview：阿里开源的顶尖AI推理模型详解

点击访问chatTools免费体验GPT最新模型，包括o1推理模型、GPT4o和Claude等模型！

that's boy·2025-02-04 14:45

DeepSeek R1 AI 论文翻译

摘要原文地址：DeepSeekR1AI论文翻译我们介绍了我们的第一代推理模型，DeepSeek-R1-Zero和DeepSeek-R1。

·2025-02-04 14:27

机器学习基本概念

人工智能（ArtificialIntelligence,AI）定义：模拟人类智能的技术和方法，包括学习、推理、感知等。

时不晴·2025-02-04 13:38

全场景深度学习开源框架（MindSpore）

无论是在数据中心的大规模计算，还是在手机、物联网设备等资源受限的终端上，MindSpore都能灵活适配，充分发挥各硬件平台的性能优势，实现模型的高效训练和推理。

deepdata_cn·2025-02-04 11:41

科技快讯 | OpenAI首次向免费用户开放推理模型；特朗普与黄仁勋会面；雷军回应“10后小学生深情表白小米SU7”

不用开口：谷歌AI帮你致电商家，价格、预约一键搞定谷歌在1月30日推出SearchLabs中的“AskforMe”实验性功能，用户可利用AI代替自己致电商家咨询价格和服务。该功能已与美汽车修理厂和美甲沙龙店合作，用户需加入SearchLabs并搜索相关短语进行测试。功能使用部分预订餐厅技术，目前处于测试阶段。我国光子毫米波雷达技术取得突破性进展，为6G技术应用奠定基础1月27日，据新华社报道，南开

最新科技快讯·2025-02-04 09:59

LlamaIndex架构设计：大模型长期记忆模块竟暗藏图数据库玄机

这使得它们在需要长期记忆或复杂知识推理的任务中表现不佳。为了解决这一问题，越来越多的研究开始探索如何为大模型

威哥说编程·2025-02-04 08:52

DeepSeek- R1 原理介绍

DeepSeek-R1是由DeepSeek公司推出的一款基于强化学习（RL）的开源推理模型，其核心原理和特点如下：1.核心技术与架构强化学习驱动：DeepSeek-R1是首个完全通过强化学习训练的大型语言模型

kcarly·2025-02-04 08:50

DeepSeek R1 AI 模型到底牛在哪里？

卓越的推理能力数学推理：在AIME2024数学竞赛中，DeepSeekR1取得了79.8%的pass@1得分，略微超过OpenAI-o1-1217。

老马啸西风·2025-02-04 06:04

DeepSeek R1 AI 论文翻译

摘要原文地址：DeepSeekR1AI论文翻译我们介绍了我们的第一代推理模型，DeepSeek-R1-Zero和DeepSeek-R1。

老马啸西风·2025-02-04 06:04

Yuan 2.0-M32 是一个基于 Yuan 2.0 架构的双语混合专家 (MoE) 语言模型，旨在以更少的参数和计算量实现更高的准确率

高效计算：使用MoE架构，40B总参数中仅有3.7B激活参数，训练计算消耗仅为同规模密集模型的9.25%，推理成本与3.7B参数的密集模型相当。

东方佑·2025-02-04 06:01

开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B与vllm实现推理加速的正确姿势（一）

一、前言在当今人工智能技术迅猛发展的时代，各类人工智能模型如雨后春笋般不断涌现，其性能的优劣直接影响着应用的广度与深度。从自然语言处理到计算机视觉，从智能安防到医疗诊断，AI模型广泛应用于各个领域，人们对其准确性、稳定性和高效性的期望也与日俱增。在此背景下，DeepSeek模型的出现为行业带来了新的曙光。DeepSeek团队开发的DeepSeek-R1-Distill-Qwen-7B模型，利用蒸馏

开源技术探险家·2025-02-04 05:54

人机交互、人机界面设计与测评

随着科技发展和信息化程度的不断推进，人机交互已成为产品中重要的组成部分，是操作者信息获取、推理、判断和决策的重要操作平台，其设计的好坏直接影响到系统性能的发挥。

·技术匠心··2025-02-04 03:41

OpenAI开源战略反思：中国力量推动AI产业变革

这场历时三小时的对话揭示了诸多行业动向：OpenAI承认其闭源策略正面临市场考验，深度求索等中国企业的开源生态已形成差异化竞争优势新一代o3推理模型将突破性展示思维链，这被视为对R

·2025-02-04 00:43

【memgpt】letta 课程1/2：从头实现一个自我编辑、记忆和多步骤推理的代理

llms-as-operating-systems-agent-memoryllms-as-operating-systems-agent-memory内存操作系统的内存管理

等风来不如迎风去·2025-02-03 23:06

推荐频道

YOLOX模型转换推理

模型蒸馏、量化、裁剪的概念和区别

[论文笔记] Deepseek技术报告

Deepseek-r1、o3-Mini 和 Qwen 2.5 MAX，谁才是你的菜？

大型推理模型 （LRM） 的比较 OpenAI DeepSeek R1 Gemini 2.0

Deepseek-r1、o3-Mini 和 Qwen 2.5 MAX，谁才是你的菜？

DeepSeek 最新推理模型 R1-Lite：一场数学题的死胡同之旅

DeepSeek-R1真算得上开源吗？

yolov5 实例分割：从原理、构建数据集到训练部署

在 Python 中生成一个简单的类 GPT 软件?

国家超算平台上线DeepSeek - R1系列模型：开启AI新征程

SGlang 专为大模型设计的高效服务框架

DeepSeek等强大推理大模型出现后，提示工程还有必要么？

使用vLLM部署Qwen2.5-VL-7B-Instruct模型的详细指南

DeepSeek-R1：通过强化学习提升大型语言模型推理能力的探索

大语言模型轻量化：知识蒸馏的范式迁移与工程实践

【Mamba之模型训练系列（四）】将 mamba 扩展到多模态大型语言模型，实现高效推理

什么是大模型框架？常用的大模型框架盘点对比

昇腾设备torch_npu推理配置

DeepSeek R1技术报告关键解析(5/10)：知识蒸馏：如何让小模型也能具备强推理能力？

TensorRT-LLM保姆级教程（一）-快速入门

知识蒸馏教程 Knowledge Distillation Tutorial

昆仑天工SkyWork：更懂中文的AIGC开源模型

昆仑万维官宣开源2000亿稀疏大模型Skywork-MoE

国产AI大爆发！讯飞星火X1横空出世，直接“杀疯”成中文数学王者？

【LangChain编程：从入门到实践】代码实践

基于深度学习的车牌检测识别系统 —— 使用YOLOv5实现车牌检测与识别

如何利用DeepSeek打造医疗领域专属AI助手？从微调到部署全流程解析

怎么在家用笔记本上轻松部署和使用DeepSeek R1?

国内首个！百度成功点亮昆仑芯三代万卡集群，将于近日点亮3万卡集群

metagpt中ActionNode的用法

Ollama能本地部署Llama 3等大模型的原因解析（ollama核心架构、技术特性、实际应用）

ChatGPT怎么回事？

揭秘DeepSeek R1大模型：它如何像人类一样“思考”？

PyTorch中的In-place操作是什么？为什么要避免使用这种操作？

基于 FPGA 的 CNN 卷积神经网络整体实现

超级好用、超准文字识别框架----飞浆PaddlePaddleOCR（文件检测+识别）实战篇

QwQ-32B-Preview：阿里开源的顶尖AI推理模型详解

DeepSeek R1 AI 论文翻译

机器学习基本概念

全场景深度学习开源框架（MindSpore）

科技快讯 | OpenAI首次向免费用户开放推理模型；特朗普与黄仁勋会面；雷军回应“10后小学生深情表白小米SU7”

LlamaIndex架构设计：大模型长期记忆模块竟暗藏图数据库玄机

DeepSeek- R1 原理介绍

DeepSeek R1 AI 模型到底牛在哪里？

DeepSeek R1 AI 论文翻译

Yuan 2.0-M32 是一个基于 Yuan 2.0 架构的双语混合专家 (MoE) 语言模型，旨在以更少的参数和计算量实现更高的准确率

开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B与vllm实现推理加速的正确姿势（一）

人机交互、人机界面设计与测评

OpenAI开源战略反思：中国力量推动AI产业变革

【memgpt】letta 课程1/2：从头实现一个自我编辑、记忆和多步骤推理的代理

大型推理模型（LRM）的比较 OpenAI DeepSeek R1 Gemini 2.0