QWEN

OpenManus 架构的详细技术实现

一、OpenManus架构的详细技术实现1.核心分层架构的深度解析底层：LLM层模型选择与适配：OpenManus允许用户替换底层LLM（如mPLUG-Owl3、Qwen、Llama等），通过统一接口调用模型

大势下的牛马·2025-03-22 22:12

01年实习生被曝负责字节RL核心算法！系字节LLM攻坚小组成员

用上该算法后，Qwen2.5-32B模型只经过RL训练，不引入蒸馏等其他技术，在AIME2024基准上拿下50分，优于相同setting下使用GRPO算法的DeepSeek-R1-Zero-Qwen，且

·2025-03-22 22:24

DeepSeek 部署指南 (使用 vLLM 本地部署)

我们以deepseek-ai/DeepSeek-R1-Distill-Qwen-7B模型为例进行演示。1、安装Python环境首先，您需要安装Python环境。

AGI大模型资料分享员·2025-03-22 19:51

llama-factory 微调 Qwen2.5-3B-Instruct

0、资源链接官方readme:https://github.com/hiyouga/LLaMA-Factory/blob/v0.9.1/README_zh.md官方文档:https://llamafactory.readthedocs.io/zh-cn/latest/官方推荐的知乎教程：https://zhuanlan.zhihu.com/p/6952876071、安装LLaMAFactorygi

coco_1998_2·2025-03-22 14:16

Qwen2-Audio：通义千问音频大模型技术解读

阿里巴巴通义千问团队，推出了Qwen-Audio系列模型，这里我们一起看下最新版本Qwen2-Audio。Qwen2-Audio不仅能够理解各种音频信号，还能根据语音指令做出文本回应，甚至可以进

kakaZhui·2025-03-21 01:41

开源模型应用落地-qwen模型小试-调用Qwen2-7B-Instruct-进阶篇（十二）

一、前言经过前五篇“qwen模型小试”文章的学习，我们已经熟练掌握qwen大模型的使用。然而，就在前几天阿里云又发布了Qwen2版本。

开源技术探险家·2025-03-20 19:23

LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人

前言LangChain是一个用于开发由大型语言模型（LargeLanguageModels，简称LLMs）驱动的应用程序的框架。它提供了一个灵活的框架，使得开发者可以构建具有上下文感知能力和推理能力的应用程序，这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库：Python和JavaScript库。包含了各种组件的接口和集成，一个基本的运行时，用于将这些组件组合

南七小僧·2025-03-20 18:44

有了大模型为何还需要Agent智能体

Agent（智能体）是一种能感知环境、自主决策、执行动作的智能实体，当它与大语言模型（如通义千问QWen、GPT）结合时，形成一种**“增强型AI系统”**。

全栈你个大西瓜·2025-03-20 09:59

agent实现：通过prompt方式实现agent自定义使用

参看：https://github.com/TommyZihao/openvino_tonypihttps://github.com/QwenLM/Qwen/blob/main/examples/react_prompt.md

loong_XL·2025-03-20 05:27

vllm部署说明和注意事项

DeepSeek-R1-Distill-Qwen-32B可去modelscope下载：整体大小约为60GB部署DeepSeek-R1-Distill-Qwen-32B模型，

ai一小生·2025-03-17 14:59

通过docker-compose部署qwen2-vl-7b模型

docker-compose部署qwen2-vl-7b模型准备工作docker-compose.yml遇到的报错在ONE-API设置测试脚本准备工作1、安装较新版本的docker-compose2、安装

scutshijie·2025-03-17 14:28

开源模型应用落地-Qwen2-VL-7B-Instruct-vLLM-OpenAI API Client调用

一、前言学习Qwen2-VL，为我们打开了一扇通往先进人工智能技术的大门。让我们能够深入了解当今最前沿的视觉语言模型的工作原理和强大能力。

开源技术探险家·2025-03-17 13:52

本地部署大模型QPS推理测试

2.2、50字左右问题2.3、100字左右问题3、测试代码3.1、通用测试代码3.2、通用测试代码（仅供参考）4、测试结果4.1、通用测试结果4.2、RAG测试结果1、测试环境1.1、显卡1.2、模型Qwen2.5

内卷焦虑人士·2025-03-17 03:30

主流开源大模型能力对比矩阵

模型名称核心优势主要局限Llama2/3✅多语言生态完善✅Rotary位置编码✅GQA推理加速⚠️数据时效性差⚠️隐私保护不足Qwen✅千亿参数规模✅中文语境优化✅复杂文本生成⚠️需高性能硬件⚠️领域知识需二次训练

时光旅人01号·2025-03-16 12:09

大模型火爆 2025：LLaMA、Qwen、DeepSeek 核心原理+就业秘籍，快速入门 AI 工程师

1.大模型核心原理：从零开始理解AI模型这些是大型语言模型（LLMs）的核心技术，适合初学者逐步深入学习。以下是详细拆解，让小白也能掌握：LLaMA系列模型核心原理详解：什么是LLaMA？：LLaMA是一个基于人工智能的语言模型，像一个超级聪明的聊天机器人，能理解和生成人类语言。它由Meta公司开发，类似ChatGPT，但更开源、灵活。核心原理：Transformer架构：想象一个工厂流水线，LL

weixin_40941102·2025-03-16 03:38

【奇点时刻】通义千问开源QwQ-32B技术洞察报告（扫盲帖）

以下报告将基于今天各大社区对Qwen/QwQ-32B（下文简称「QwQ-32B」）模型的讨论、测评与实测体验进行综合性分析与洞察。

碣石潇湘无限路·2025-03-16 03:37

llamaindex实现企业级RAG应用（一）

在上一篇文章中使用Qwen2进行RAG代码实践，手动实现了一版简易的RAG应用，在实际工作中通常都用会使用langchain或llamaindex架构来搭建rag应用，并且会非常复杂。

弈秋001·2025-03-15 15:15

qwen2.5的技术。

RMSNorm（RootMeanSquareNormalization，均方根归一化）是一种用于深度学习的归一化技术，是LayerNorm（层归一化）的一种改进。它通过计算输入数据的均方根（RootMeanSquare,RMS）来进行归一化，避免了传统归一化方法中均值和方差的计算1.LayerNorm（层归一化）LayerNorm（层归一化）是一种用于深度学习的归一化技术，主要用于稳定训练过程、加

KangkangLoveNLP·2025-03-14 13:29

【大模型技术】基于通义千问（Qwen）实现对话系统

使用Qwen提供的API生成自然语言回复。核心功能：多轮对话：用户可以连续提问，系统根据上下文生成连贯的回答。上下文管理：通过维护对话历史，确保模型理解用户的意图。

大数据追光猿·2025-03-14 08:48

QwQ-32B企业级本地部署：结合XInference与Open-WebUI使用

QwQ-32B是阿里巴巴Qwen团队推出的一款推理模型，拥有320亿参数，基于Transformer架构，采用大规模强化学习方法训练而成。

大势下的牛马·2025-03-14 00:56

离线服务器ollama新增qwen2:0.5b模型

离线服务器ollama新增qwen2:0.5b模型Dify集成ollama前面已经介绍过离线服务器CentOS使用的docker安装的ollama，其中在ollama中已经安装了deepseek-r1:

slient_love·2025-03-13 20:30

基于SWIFT和Qwen1.5-0.5B-Chat进行大模型全参微调（魔搭社区）

1，swift框架安装pipinstallms-swift2，模型下载gitclonehttps://www.modelscope.cn/qwen/Qwen1.5-0.5B-Chat.git二、数据集准备使用

m0_65156252·2025-03-13 18:47

从Swish到SwiGLU：激活函数的进化与革命，qwen2.5应用的激活函数

swiGLU和RMSNorm1.什么是swiGLUSwiGLU（Swish-GatedLinearUnit）是一种结合了Swish激活函数和GLU（GatedLinearUnit）门控机制的激活函数，广泛应用于现代大型语言模型中1.什么是Swish激活函数1.1Swish激活函数Swish激活函数是一种平滑的、非单调的激活函数，由GoogleBrain团队在2017年提出。它结合了ReLU的非线性

KangkangLoveNLP·2025-03-13 09:02

开源模型应用落地-qwen模型小试-Qwen-Agent（十一）

一、前言Qwen-Agent是一个利用开源语言模型Qwen的工具使用、规划和记忆功能的框架。其模块化设计允许开发人员创建具有特定功能的定制代理，为各种应用程序提供了坚实的基础。

开源技术探险家·2025-03-12 22:47

如果，你想找 AI大模型相关的工作，这三个建议你一定要看！

由难到简单，依次是：大模型算法（⭐⭐⭐⭐⭐）模型部署加速（⭐⭐⭐⭐）RAG等相关技术（⭐⭐⭐）纯应用（⭐⭐）Prompt工程师等其他自媒体（⭐）会简单应用就行02这结果方向，B站找几个视频看看，这里推荐用Qwen7B

我爱学大模型·2025-03-11 14:45

多模态模型在做选择题时，如何设置Prompt，如何精准定位我们需要的选项

我们这里以Qwen2-VL-7B-instruct为例：假设我们需要分析一张图片的情绪（从现有的情绪中进行选择），并且我们需要它以思维链的形式展现出来，我们可以这样设置prompt：emotion6_CoT

暗巷提灯·2025-03-11 03:10

vllm多卡部署Qwen2.5-72B-Instruct-GPTQ-Int4

双卡v10032G部署结果如下，推理时长16s3卡，tensor_parallel_size=3，tensor并行的数量一定要能被attentionheads整除4卡，tensor_parallel_size=4，推理速度4s

Yanc_L·2025-03-10 20:54

用双色球数据集微调后的大模型

最近用Qwen/Qwen1.5-1.8B-Chat大模型来微调训练双色球2003001-2025011的数据集，实验测一下大模型出球的预测情况。

qq_29790801·2025-03-10 17:33

【大模型】DeepSeek-R1-Distill-Qwen部署及API调用

DeepSeek-R1-Distill-Qwen是由中国人工智能公司深度求索（DeepSeek）开发的轻量化大语言模型，基于阿里巴巴的Qwen系列模型通过知识蒸馏技术优化而来。

油泼辣子多加·2025-03-10 17:29

Spark-TTS：基于大模型的文本语音合成工具

一、介绍SparkTTS完全基于Qwen2.5构建，无需额外的生成模型，它不依赖于单独的模型来生成声学特征，而是直接从LLM预测的代码中重建音频。这种方

CITY_OF_MO_GY·2025-03-10 13:35

开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现推理加速的正确姿势-Docker-OpenResty（三）

一、前言目前，大语言模型已升级至Qwen2.5版本。无论是语言模型还是多模态模型，均在大规模多语言和多模态数据上进行预训练，并通过高质量数据进行后期微调以贴近人类偏好。

开源技术探险家·2025-03-10 06:43

大模型与图数据库RAG通俗流程拆解

图构建（略）neo4j、tugraph等均可，不影响GraphRAG核心框架模型向量化模型bce-embedding-base_v1重排序模型bce-reranker-base_v1大语言模型Qwen/

gallonyin·2025-03-10 02:15

DeepSeek-R1的Qwen和Llama区别

好的，我现在需要回答用户关于DeepSeek-R1-Distill-Qwen-32B、DeepSeek-R1-Distill-Llama-70BPro和DeepSeek-R1-Distill-Qwen-

百态老人·2025-03-10 01:08

[论文笔记] LLaMA3.1与Qwen2与Apple 技术报告中预训练方案对比

https://arxiv.org/pdf/2407.21075https://arxiv.org/pdf/2407.10671https://arxiv.org/pdf/2407.21783LLaMA3.1LLaMA3.1技术报告：https://ai.meta.com/blog/meta-llama-3-1/

心心喵·2025-03-10 01:02

Qwen微调-环境配置-week9

在这里插入图片描述](https://img-blog.csdnimg.cn/direct/213a0fb70a2e430684155bbd06a7ff36.png#pic_center)Qwen1.5

breeze281·2025-03-08 23:01

Qwen1.5-7B-实现RAG应用详细步骤

1.准备工作1.1安装依赖确保你的环境中安装了以下工具和库：Python：建议使用Python3.8或更高版本。PyTorch：用于运行深度学习模型。Transformers：HuggingFace提供的库，支持加载和运行预训练模型。FAISS：用于向量检索的高效库。GPTQ支持库：如auto-gptq或gptqmodel。安装命令运行以下命令安装所需的Python包：pipinstalltorc

大数据追光猿·2025-03-08 23:01

阿里Qwen-1.8B的介绍和下载部署详细步骤

一、Qwen-1.8B的介绍Qwen-1.8B是阿里云推出的通义千问系列中的一个轻量化版本，参数量为18亿（1.8B）。

大数据追光猿·2025-03-08 23:31

深入浅出的理解deepseek类大模型（附运行代码）

我们把Qwen2模型想象成一个非常聪明的“阅读理解专家”。这个专家，就像我们人类一样，需要先“看”到文字，然后才能理解文字的意思，最后才能回答问题或者生成新的文字。

AI人工智能时代·2025-03-08 08:47

驭码CodeRider 闪电适配阿里QwQ-32B：8小时全栈集成，AI编程效率飞跃！

今日凌晨，国产大模型领域迎来重大突破：阿里正式发布32B推理模型QwQ-32B，根据Qwen公布的基准测试数据，QwQ-32B整体性能可媲美DeepSeek-R1，在数学推理、编程能力和通用能力等关键测试中展现出卓越性能

极小狐·2025-03-07 20:10

阿里云CTO：通义稳居全球最强开源大模型，性能接近GPT-4o

基础模型升级，性能媲美GPT-4o，发布最强开源模型Qwen2.5系列，

首席数智官·2025-03-07 20:39

vLLM部署Qwen2.5-VL-7B-Instruct实战：从hf-mirror下载权重全流程

本文将重点演示如何从国内镜像站https://hf-mirror.com高效下载Qwen2.5-VL-7B-Instruct模型权重，并通过vLLM完成部署。

几道之旅·2025-03-07 12:58

阿里深夜推出全新推理模型，仅1/20参数媲美DeepSeek R1满血版

一、参数效率革命：小体积承载大智慧阿里深夜推出全新推理模型，仅1/20参数媲美DeepSeekR1，就在刚才，阿里Qwen团队正式公布了最新研究成果——QwQ-32B大语言模型。

万事可爱^·2025-03-07 11:37

【AGI】中国大模型扛把子：通义家族

阿里云推出的**通义千问（Qwen）**系列大模型，凭借其多层次的技术架构、多样化的模型生态及开源战略，已成为全球AI领域的重要标

LeeZhao@·2025-03-07 09:40

深入探究LLamaFactory推理DeepSeek蒸馏模型时无法展示＜think＞思考过程的问题

3.自定义模板实现优化界面展示：实现思考过程的可视化实现方法参数调整影响分析实验一实验二进入大模型应用与实战专栏|查看更多专栏内容问题背景最近在本地环境中部署了DeepSeek-R1-Distill-Qwen

羊城迷鹿·2025-03-07 08:00

Hugging Face Agents Course （Dummy Agent）

参考链接：https://qwen.readthedocs.io/en/latest/getting_started/concepts.htmlhttps://huggingface.co/agents-course

ZHOU_CAMP·2025-03-07 02:53

只需几步！在本地电脑轻松部署DeepSeek大模型

它提供了丰富的模型库，包括Qwen、Llama等1700+大语言模型，并支持用户上传自己的模型。

魔法小匠·2025-03-07 01:42

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机多卡-RTX 4090双卡（五）

一、前言本篇文章将使用LLaMA-Factory去高效微调QWen2系列模型，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。

开源技术探险家·2025-03-06 23:26

驭码CodeRider 闪电适配阿里QwQ-32B：8小时全栈集成，AI编程效率飞跃！

今日凌晨，国产大模型领域迎来重大突破：阿里正式发布32B推理模型QwQ-32B，根据Qwen公布的基准测试数据，QwQ-32B整体性能可媲美DeepSeek-R1，在数学推理、编程能力和通用能力等关键测试中展现出卓越性能

·2025-03-06 22:12

如何从零开始训练大模型？（附AGI大模型路线图）

跟规模相对接近的2b、7b模型比，得分比qwen2b高，和qwen7b比有的高有的低。这个是minicpm的详细技术文档。https://shengdi

脱泥不tony·2025-03-06 21:13

媲美满血R1+，刚刚，阿里推理模型QwQ-32B开源

小尺寸，不要671B，只要32B，推理门槛低QwQ-32B与其他领先模型的性能对比，包括DeepSeek-R1-Distilled-Qwen

X.Cristiano·2025-03-06 17:03

推荐频道

QWEN

OpenManus 架构的详细技术实现

01年实习生被曝负责字节RL核心算法！系字节LLM攻坚小组成员

DeepSeek 部署指南 (使用 vLLM 本地部署)

llama-factory 微调 Qwen2.5-3B-Instruct

Qwen2-Audio：通义千问音频大模型技术解读

开源模型应用落地-qwen模型小试-调用Qwen2-7B-Instruct-进阶篇（十二）

LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人

有了大模型为何还需要Agent智能体

agent实现：通过prompt方式实现agent自定义使用

vllm部署说明和注意事项

通过docker-compose部署qwen2-vl-7b模型

开源模型应用落地-Qwen2-VL-7B-Instruct-vLLM-OpenAI API Client调用

本地部署大模型QPS推理测试

主流开源大模型能力对比矩阵

大模型火爆 2025：LLaMA、Qwen、DeepSeek 核心原理+就业秘籍，快速入门 AI 工程师

【奇点时刻】通义千问开源QwQ-32B技术洞察报告（扫盲帖）

llamaindex实现企业级RAG应用（一）

qwen2.5的技术。

【大模型技术】基于 通义千问（Qwen）实现对话系统

QwQ-32B企业级本地部署：结合XInference与Open-WebUI使用

离线服务器ollama新增qwen2:0.5b模型

基于SWIFT和Qwen1.5-0.5B-Chat进行大模型全参微调（魔搭社区）

从Swish到SwiGLU：激活函数的进化与革命，qwen2.5应用的激活函数

开源模型应用落地-qwen模型小试-Qwen-Agent（十一）

如果，你想找 AI大模型相关的工作，这三个建议你一定要看！

多模态模型在做选择题时，如何设置Prompt，如何精准定位我们需要的选项

vllm多卡部署Qwen2.5-72B-Instruct-GPTQ-Int4

用双色球数据集微调后的大模型

【大模型】DeepSeek-R1-Distill-Qwen部署及API调用

Spark-TTS：基于大模型的文本语音合成工具

开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现推理加速的正确姿势-Docker-OpenResty（三）

大模型与图数据库RAG通俗流程拆解

DeepSeek-R1的Qwen和Llama区别

[论文笔记] LLaMA3.1与Qwen2与Apple 技术报告中预训练方案对比

Qwen微调-环境配置-week9

Qwen1.5-7B-实现RAG应用详细步骤

阿里Qwen-1.8B的介绍和下载部署详细步骤

深入浅出的理解deepseek类大模型（附运行代码）

驭码CodeRider 闪电适配阿里QwQ-32B：8小时全栈集成，AI编程效率飞跃！

阿里云CTO：通义稳居全球最强开源大模型，性能接近GPT-4o

vLLM部署Qwen2.5-VL-7B-Instruct实战：从hf-mirror下载权重全流程

阿里深夜推出全新推理模型，仅1/20参数媲美DeepSeek R1满血版

【AGI】中国大模型扛把子：通义家族

深入探究LLamaFactory推理DeepSeek蒸馏模型时无法展示＜think＞思考过程的问题

Hugging Face Agents Course （Dummy Agent）

只需几步！在本地电脑轻松部署DeepSeek大模型

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机多卡-RTX 4090双卡（五）

驭码CodeRider 闪电适配阿里QwQ-32B：8小时全栈集成，AI编程效率飞跃！

如何从零开始训练大模型？（附AGI大模型路线图）

媲美满血R1+，刚刚，阿里推理模型QwQ-32B开源

【大模型技术】基于通义千问（Qwen）实现对话系统