Qwen 第2页

(LLaMa Factory)大模型训练方法--准备模型（Qwen2-0.5B）

1、准备训练框架LLaMAFactory是一款开源低代码大模型微调框架，集成了业界最广泛使用的微调技术，支持通过WebUI界面零代码微调大模型，目前已经成为开源社区内最受欢迎的微调框架。2、运行环境要求硬件：GPU：推荐使用24GB显存的显卡或者更高配置软件：python：3.10pytorch：2.1.2+cuda12.1操作系统：Ubuntu22.043、准备训练模型在开展大模型训练之前，由于

风起晨曦·2025-06-04 23:21

AI编程实战：Python + Qwen-agent 实现chat2SQL智能助手系统（二）

项目目标满足自己筛选基金经理；写一个跟AI相关的项目；学习与锻炼Python编程；学习与使用开源框架Qwen-agent。

AIGC包拥它·2025-06-04 03:47

AI编程实战：Python + Qwen-agent 实现chat2SQL智能助手系统

项目目标满足自己筛选基金经理；写一个跟AI相关的项目；学习与锻炼Python编程；学习与使用开源框架Qwen-agent。

AIGC包拥它·2025-06-04 03:16

Spring AI 中 ChatClient常用方法

ChatClient是SpringAI中一个简洁高效的组件，它能让你仅用几行代码就轻松对接Deepseek、Qwen等主流AI大模型。

Java架构何哥·2025-06-04 01:39

如何使用Ollama在本地运行Qwen3并支持MCP和工具使用

Qwen3是阿里巴巴Qwen团队最新发布的开源大语言模型，提供具有竞争力的性能，高度模块化和工具使用能力。

大语言模型·2025-06-03 20:02

【LlamaIndex】基于 Qwen + LlamaIndex 构建多轮记忆式情感对话系统1.0版

目录一、项目简介二、核心技术栈三、环境准备四、自定义洛溪：提示词是灵魂五、一步步搭建AI洛溪1️⃣初始化模型&Prompt2️⃣构建有记忆的聊天引擎3️⃣加入“初始剧情”，增加沉浸感六、实时对话体验七、后续优化八、完整运行代码九、总结：不仅仅是“女朋友”在大语言模型飞速发展的今天，聊天机器人不仅能答题解惑、写代码、写文案，还能成为“情感陪伴”的载体。今天，我们将带你用不到100行代码，打造一个**

一叶千舟·2025-06-03 10:17

【仿生系统】qwen的仿生机器人解决方案

收到完整需求后，我将从系统架构设计、算法实现路径、训练方法三个维度为您构建完整的仿生机器人解决方案。以下是分阶段实施方案：一、核心系统架构设计（模块化可进化架构）1.多模态感知引擎-视觉子系统：YOLOv8+SAM组合实现实时物体检测+场景语义分割-听觉子系统：Whisper+SpeakerEmbedding+情感识别三重处理-语言理解：基于LLaMA3的增量式语义解析（IncrementalPa

DFminer·2025-06-03 04:39

【深度学习新浪潮】以Dify为例的大模型平台的对比分析

可扩展性和安全性五个维度展开对比分析：一、核心功能对比平台核心功能多模型支持插件与工具链Dify低代码开发、RAG增强、Agent自律执行、企业级安全支持GPT-4/5、Claude、Llama3、Gemini及开源模型（如Qwen-VL

小米玄戒Andrew·2025-06-02 21:40

qwen 2.5 并行计算机制：依靠 PyTorch 和 Transformers 库的分布式能力

qwen2.5并行计算机制：依靠PyTorch和Transformers库的分布式能力完整可运行代码：importtorchimporttorch.nn.functionalasFfromtransformers

ZhangJiQun&MXP·2025-06-02 16:03

ImportError: /usr/local/app/.local/lib/python3.10/site-packages/flash_attn_2_cuda.cpython-310-x86_64

linuxtransformers4.39.0tokenizers0.15.2torch2.1.2+cu121flash-attn2.3.3在使用vllm运行xverse/XVERSE-13B-256K时(代码如下)：qwen_model

Cyril_KI·2025-06-02 11:03

Qwen2.5-Omni 多模态部署保姆级教程：图文问答×接口调用×Gradio UI 全都有

个人简介作者简介：全栈研发，具备端到端系统落地能力，专注大模型的压缩部署、多模态理解与Agent架构设计。热爱“结构”与“秩序”，相信复杂系统背后总有简洁可控的可能。我叫观熵。不是在控熵，就是在观测熵的流动个人主页：观熵个人邮箱：[email protected]座右铭：愿科技之光，不止照亮智能，也照亮人心！专栏导航观熵系列专栏导航：AI前沿探索：从大模型进化、多模态交互、AIGC内容生成，到

观熵·2025-06-02 05:53

Qwen3 本地部署指南：打造完全离线的AI助手

Qwen3是阿里巴巴Qwen团队推出的最新开源大语言模型(LargeLanguageModel,LLM)，它提供了令人印象深刻的性能，同时具备高度模块化和强大的工具调用能力。

我爱学大模型·2025-06-01 15:08

Qwen2学习笔记1：Qwen2模型原理

代码位置：在Qwen2Tokenizer类中定义（此类继承自PreTrainedTokenizer），负责处理token的转化。

guoyukun1·2025-06-01 02:11

【大模型】情绪对话模型项目研发

一、使用框架：Qwen大模型后端+Open-webui前端实现使用LLamaFactory的STF微调数据集，vllm后端部署，二、框架安装下载千问大模型安装魔塔社区库文件pipinstall modelscopeDownload.py

SSH_5523·2025-05-31 14:16

17、Swift框架微调实战（2）-QWQ-32B LORA微调cot数据集

1、QWQ-32B介绍1.1基本介绍QwQ是Qwen系列的大模型之一，专注于推理能力（reasoning）。

Andy_shenzl·2025-05-31 02:14

23、Swift框架微调实战（3）-Qwen2.5-VL-7B LORA微调OCR数据集

一、模型介绍Qwen2.5-VL是阿里通义千问团队开源的视觉语言模型，具有3B、7B和72B三种不同规模，能够识别常见物体、分析图像中的文本、图表等元素，并具备作为视觉Agent的能力。

Andy_shenzl·2025-05-31 02:43

【保姆级教程】模型蒸馏新突破：利用大模型提升小模型能力的Reasoning模型实践指南！

今天我们就用Qwen2.5-1.5B小模型（相当于AI界的初中生）来进行实践！什么是模型蒸馏？

大模型入门教程·2025-05-30 16:59

大模型现象级发现-2025年上半年资料收集

思考模型-不思考的小技巧2025-05-27最新实验：不听人类指令OpenAI模型拒绝自我关闭https://x.com/PalisadeAI/status/1926084635903025621公众号qwen3

CSPhD-winston-杨帆·2025-05-30 15:51

ai大模型7B级别对比

针对DeepSeek和Qwen两大开源7B级大模型的对比分析，从性能、架构、应用场景等维度展开：性能对比DeepSeek-7B擅长数学与代码生成，在HumanEval基准测试中Python代码生成准确率约

慎思笃行丨·2025-05-30 10:45

《手把手大模型应用教程》- 常用Agent开发框架

最近需要做Agent智能体开发，在经过一番比较后，得出两个较好的框架：Langchain和Qwen-Agent，两个框架都比较优秀，但是在实现上有略微差别，本文会将大体框架的优势以及劣势进行比较分析，下篇会着重进入智能体开发

Alex_81D·2025-05-28 01:28

字节豆包团队开源 BAGEL - 多模态理解和生成统一模型

吴脑的键客·2025-05-27 00:18

深入解读Qwen3技术报告（五）：后训练对齐

小爷毛毛（卓寿杰）·2025-05-26 14:22

[特殊字符] Function Calling 技术详解与 Qwen 模型实践指南

随着多模态大模型（如GPT-4、Qwen2.5等）逐渐支持插件、API调用等能力，FunctionCalling（函数调用）技术正成为连接模型与外部世界的桥梁。

_深海凉_·2025-05-26 13:46

深度学习实战108-基于通义千问Qwen2.5-Omni的智能数字人实时对话系统实现

大家好，我是微学AI，今天给大家介绍一下深度学习实战108-基于通义千问Qwen2.5-Omni的智能数字人实时对话系统实现。

微学AI·2025-05-26 04:23

Qwen3全面解析：阿里巴巴新一代开源大模型入门指南

Qwen3全面解析：阿里巴巴新一代开源大模型入门指南引言：Qwen3的横空出世Qwen3是什么？

Ven%·2025-05-25 07:31

【全网首发】使用 LoRA 微调 Qwen2.5-VL-7B-Instruct：完整流程解析

引言今天凌晨（2025年1月28日），Qwen团队正式发布Qwen2.5-VL，这是Qwen模型家族的旗舰视觉语言模型（VLM）。

HovChen_·2025-05-25 06:53

【读代码】BAGEL：统一多模态理解与生成的模型

该模型在统一架构下实现了三大核心能力：多模态理解：在MME、MMBench等9大评测基准中超越Qwen2.5-VL等主流模型文本生成图像：生成质量媲美SD3等专业生成模型智能图像编辑：支持自由格式编辑、

kakaZhui·2025-05-25 04:13

【国产大模型 × 制造调度】智能生产线调度系统实战构建与多工位优化落地解析

【国产大模型×制造调度】智能生产线调度系统实战构建与多工位优化落地解析关键词智能制造、生产调度优化、DeepSeek、千问Qwen、工位路径规划、任务推理、产线重排、边云协同、设备状态建模、批次任务压缩

观熵·2025-05-25 04:10

通过vllm部署qwen3大模型以及基于 vLLM 的 OpenAI 兼容 API 接口调用方法总结

一，通过vllm部署qwen3模型。

Gq.xxu·2025-05-25 01:54

基于 SGLang 部署 Qwen2.5 7B 模型

本文将详细介绍如何使用SGLang快速部署Qwen2.57B模型，并深入探讨SGLang的关键性能优化技术，以及预期可以达到的延迟和吞吐量。

kakaZhui·2025-05-24 14:09

NVIDIA 实现通义千问 Qwen3 的生产级应用集成和部署【2025年 5月 2日】

阿里巴巴近期发布了其开源的混合推理大语言模型（LLM）通义千问Qwen3，此次Qwen3开源模型系列包含两款混合专家模型(MoE)235B-A22B（总参数2,350亿，激活参数220亿）和30B-A3B

u013250861·2025-05-24 05:39

大模型 agent 执行sql查询

转载，来源：Howtocallfunctionswithchatmodels1.定义client使用了阿里云的qwen-max模型。

Qiming_v·2025-05-24 02:17

基于Llamaindex的本地向量与大模型RAG搭建流程

Qwen指导文档给出了基于HF或者其他使用APIKey大模型的示例，场景不符。Llamaindex自身相关文档，尤其是关键插件的用户手册难寻，接口说明也很少。

1024点线面·2025-05-23 03:10

2025.5.25 关于AI的第一次分享

在国内市场，Qwen3凭借其出色的本地化能力和技术创新，成为国产AI的佼佼者。Deepseek系列及其他AI模型也在各自细分领域持续发力，推动着A

爱意随风起风止意难平·2025-05-22 18:14

Qwen3开源震撼来袭，引领大模型新时代

目录引言Qwen3开源发布性能卓越超越同行（一）基准评测实力碾压（二）以小博大参数优势五大特性创新升级（一）丰富模型参数体系（二）混合思考灵活切换（三）推理能力显著提升（四）MCP集成Agent增强（五

gadiaola·2025-05-22 17:09

qwen2:7b本地化部署：Ollama更新、设置、api调用qwen2服务

本篇介绍了如何使用Ollama本地化部署qwen2:7b，以及进行Ollama的参数设置以及使用api调用qwen2的api服务的方法。

金桃不烦恼·2025-05-22 14:51

JAVA请求vllm的api服务报错Unsupported upgrade request、 Invalid HTTP request received.

环境：vllm0.8.5java17Qwen3-32B-FP8问题描述：JAVA请求vllm的api服务报错Unsupportedupgraderequest、InvalidHTTPrequestreceived.WARNING

玩人工智能的辣条哥·2025-05-22 05:20

大模型的实践应用43-基于Qwen3(32B)+LangChain框架+MCP+RAG+传统算法的旅游行程规划系统

大家好，我是微学AI，今天给大家介绍一下大模型的实践应用43-基于Qwen3(32B)+LangChain框架+MCP+RAG+传统算法的旅游行程规划系统。

微学AI·2025-05-21 04:05

【多模态大模型实战】搭建通义千问Qwen 2.5-VL-7B-Instruct多模态模型，以及推理微调

模型信息Qwen2.5是Qwen大型语言模型的最新系列。对于Qwen2.5，我们发布了从0.5亿到72亿参数不等的一系列基础语言模型和指令调优语言模型。

AI智韵·2025-05-20 18:03

用JAVA实现人工智能：采用框架Spring AI Java

QWen目前有100万免费Token额度，可以快速实现需求。同时，因为qwen也是个开源的模型，我们可以自己搭建模型来实现免费使用。目录?编辑SpringAI集成人工智能

m0_74823863·2025-05-20 15:16

LLaMA-Factory微调大模型Qwen2.5

1、开始ModelScope社区GPU环境训练或微调模型都是非常耗费算力的。如果电脑的配置不高，可使用一些云服务器来做这项工作。如ModelScope(魔搭)社区的GPU环境，目前提供36小时免费运算，足够微调一个大模型了。注册ModelScope(魔搭)社区账号（可能还要注册或认证阿里云账号），进入“我的NoteBook”：我的Notebook·魔搭社区启动大概需要2分钟，等GPU环境启动好以后

will.hu·2025-05-20 12:57

开源模型应用落地-qwen2-7b-instruct-LoRA微调-ms-swift-单机多卡-RTX 4090双卡（十四）

一、前言本篇文章将使用ms-swift去高效微调QWen2系列模型，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。

开源技术探险家·2025-05-20 00:30

wsl迁移到D盘失败后的处理（qwen-max2.5）

question1:之前我执行了wsl迁移到d盘的指令，具体什么指令忘了，现在powershell中键入wsl回车提示：适用于Linux的Windows子系统没有已安装的分发。希望在不重装wsl的情况下搞定这个问题question2:PSE:\111>wsl--importUbuntuD:\vDisk\wsl\ubuntuD:\vDisk\wsl\ubuntu.tar--version2由于未安装

BeyondTimeSpace·2025-05-19 20:34

【实战指南】Rocky Linux 本地部署 Qwen2.5-VL-Instruct（含 GPU 加速 + 多模态推理脚本）

【实战指南】RockyLinux本地部署Qwen2.5-VL-Instruct（含GPU加速+多模态推理脚本）适用系统：RockyLinux/CentOS/RHEL适用于本地GPU+Docker部署Qwen2.5

神志不清.·2025-05-18 21:34

基于Qwen-14b的基础RAG实现及反思

1、概览本文主要介绍RAG的基础实现过程，给初学者提供一些帮助，RAG即检索增强生成，主要是两个步骤：检索、生成，下面将基于这两部分进行介绍。2、检索检索的主要目的是在自定义的知识库kb中查询到与问题query相关的候选答案。过程中主要涉及的几个关键内容是：文本向量化模型、向量数据库，文本向量化模型如GTE、BGE等、向量数据库如faiss、weaviate、milvus等，对于选型本文不作介绍，

带鱼工作室·2025-05-16 16:18

阿里巴巴Qwen3大模型深度解析

阿里巴巴Qwen3大模型深度解析：技术突破、应用场景与行业竞争一、核心技术创新：推理效率与硬件适配的双重突破动态混合专家系统（MoE）Qwen3采用分层稀疏调度与动态专家激活机制，15B参数模型中仅需激活

不会啊~·2025-05-16 12:22

LLaMA Factory 深度调参

zysNLP/quickllm初始指令：llamafactory-clitrain\--stagesft\--do_trainTrue\--model_name_or_path/data/quickllm/qwen3

NLP小讲堂·2025-05-15 23:47

免费大模型API调用汇总

国家超算互联网平台QwQ-32B（阿里Qwen团队开发）：新用户免费100万Tokens，支持数学推理与代码生成，性能对标Deep

大大小小聪明·2025-05-15 18:08

开源模型应用落地-qwen模型小试-调用Qwen2-VL-7B-Instruct-更清晰地看世界（一）

一、前言学习Qwen2-VL，为我们打开了一扇通往先进人工智能技术的大门。让我们能够深入了解当今最前沿的视觉语言模型的工作原理和强大能力。

开源技术探险家·2025-05-15 08:34

Qwen3 调用 FastMCP —— 查询天气案例，了解 MCP 和大模型的结合方法

问题frommodelscopeimportAutoModelForCausalLM,AutoTokenizermodel_name="Qwen/Qwen3-1.7B"#loadthetokenizerandthemodeltokenizer

·2025-05-14 12:53

推荐频道

Qwen