Qwen 第5页

如何配置在vscode的Cline插件中调用Ollama本地部署的DeepSeek R1/V3、千问2.5等大模型

Qwen系列：如Qwen2、Qwen2.5，由阿里巴巴开发，在中文环境下表现优异。Llama系列：如Llama3、Llama2，具备强大的语言理解和

代码简单说·2025-04-06 18:20

04-参数量差20倍！QwQ 32B性能竟超越DeepSeek 671B？性能对比实测

1.QwQ介绍QwQ是Qwen系列的推理模型。与传统的指令调优模型相比，具备思考和推理能力的QwQ在下游任务中，尤其是在处理难题时，能够显著提高性能。QwQ-32B是一个中等规模的推

anda0109·2025-04-06 07:09

文章目录（会持续更新）建议收藏

一、AI1.本地部署AIOllama：教程：暂无（看情况出）LMStudio：教程：LMStudio本地部署Deepseek-R1+Qwen2教程-CSDN博客评测（对比）：文章直链：Ollama还是LMStudio

Johnny-一个爱研究AI的学生·2025-04-05 18:43

RAG 系统构建闭环实战：数据清洗 × 嵌入策略 × 更新机制 × 多语言 × 权限控制

你可能已经成功部署了一个RAG系统：✅文档上传→向量化→大模型问答✅页面漂亮，支持ChatUI/API接入✅使用国产模型（Qwen/DeepSeek等）+私有部署但现实往往是：上传一次文档之后，内容就很久没人更新每次新增资料都要手动处理

AI筑梦师·2025-04-05 12:36

本地部署Qwen2大模型之五：vLLM与大语言模型的关系

本地部署Qwen2大模型之一：Ollama方式部署第一篇记录了通过Ollama方式在本地部署Qwen2大模型的过程，操作很顺利，看到大模型反应的那一刻很是激动，大大增强了我继续探索的信心。

康顺哥·2025-04-05 02:57

基于Transformer框架实现微调后Qwen/DeepSeek模型的非流式批量推理

在基于LLamaFactory微调完具备思维链的DeepSeek模型之后（详见《深入探究LLamaFactory推理DeepSeek蒸馏模型时无法展示＜think＞思考过程的问题》），接下来就需要针对微调好的模型或者是原始模型（注意需要有一个本地的模型文件，全量微调就是saves下面的文件夹，如果是LoRA，还需要进行一步导出模型的操作），实现快速高效的模型推理。本文将详细分享如何基于Transf

羊城迷鹿·2025-04-05 02:27

如何在本地部署魔搭上千问Qwen2.5-VL-32B-Instruct-AWQ模型在显卡1上面运行推理，并开启api服务

环境：云服务器UbuntuNVIDIAH2096GBQwen2.5-VL-32BQwen2.5-VL-72B问题描述：如何在本地部署魔搭上千问Qwen2.5-VL-32B-Instruct-AWQ模型在显卡

玩人工智能的辣条哥·2025-04-04 19:15

用LLama factory时报类似Process 2504721 got signal: 1的解决方法

之前用nohup来远程跑LLamafactory微调脚本，是没有问题的，但今天发现运行类似下面这个命令时，nohupllamafactory-clitrainexamples/train_qlora/qwen_lora.yaml

蛐蛐蛐·2025-04-04 04:28

在 Jetson 上部署 Qwen2.5：国产轻量大模型的边缘推理全流程实战

在Jetson上部署Qwen2.5：国产轻量大模型的边缘推理全流程第1章：为什么要在Jetson上部署国产大模型？

AI筑梦师·2025-04-03 21:44

RWKV-7 2.9B 模型正式发布，SOTA 架构，带来 SOTA 使用体验

英文和多语言测评RWKV-7-2.9B模型的英文和多语言能力，均显著超越所有同尺寸模型，包括Llama3.23B、Qwen2

RWKV元始智能·2025-04-03 07:15

【Python】基于 qwen_agent 构建 AI 绘画智能助手

基于qwen_agent构建AI绘画智能助手前言近年来，大模型技术迅猛发展，AI绘画也成为了热门应用之一。

林九生·2025-04-03 02:44

Qwen-2.5、DeepSeek-R1、DeepSeek-V3 核心区别

1.定位与核心能力Qwen-2.5（阿里云）：通用型大语言模型，擅长多模态处理（文本、图像、音频等）和超长上下文支持（最高支持100万token）。

瞬间动力·2025-04-02 18:45

学习计划暂停更新，一些有意思的分享

微调参考：从简单的自我认知修改开始学习，在微调库中基本都有identity.json，直接修改{（name）}数据用于微调即可Qwen模型还不错，1.5B很适合入门学习。

笙枫·2025-04-02 11:36

BERT与Transformer到底选哪个-上部

就像「包子」和「面食」的关系——BERT是「Transformer家族」的「明星成员」，而GPT、Qwen、DeepSeek这些大模型则是「Transformer家族」的「超级后辈」。

TGITCIC·2025-04-02 11:33

2025-04-01 AGI大模型学习路线，非常详细收藏我这一篇就够了

大模型学习路线建议先从主流的Llama开始，然后选用中文的Qwen/Baichuan/ChatGLM，先快速上手体验prompt工程，然后再学习其架构，跑微调脚本如果要深入学习，建议再按以下步骤，从更基础的

大模型入门学习·2025-04-01 18:25

大模型：国内主要大模型的对比及其特点总结

千亿参数，多任务统一学习框架特点：多模态能力突出（文本、图像、视频生成）中文理解强，支持古文、成语等复杂语义企业级工具链完善（ERNIESDK）应用场景：营销文案、设计辅助、企业知识库2.阿里云·通义千问（Qwen

meisongqing·2025-04-01 13:18

阿里这次放大招了：Qwen2.5-Omni-7B 是开源多模态的天花板？

解构通义全模态引擎：Qwen2.5-Omni-7B架构、机制与实测阿里巴巴在2025年3月正式发布并开源了通义千问系列的又一力作——Qwen2.5-Omni-7B，这是全球首个实现真实多模态统一建模、流式对话响应的

AI筑梦师·2025-04-01 12:43

阿里最新开源全模态大模型——Qwen2.5-Omni-7B，7B就能搞定“看听说写”，AI越来越像人了

3月27日凌晨，阿里通义千问团队发布Qwen模型家族中新一代端到端全模态大模型Qwen2.5-Omni，标志着AI“类人化”再进一步。

算家计算·2025-04-01 12:11

ollama运行qwen2.5-coder:7b

1.linux安装curl-fsSLhttps://ollama.com/install.sh|shollamaserve#启动ollamaollamacreate#从模型文件创建模型ollamashow#显示模型信息ollamarun#运行模型，会先自动下载模型ollamapull#从注册仓库中拉取模型ollamapush#将模型推送到注册仓库ollamalist#列出已下载模型ollamaps

苍墨穹天·2025-04-01 12:41

conda 清除 tarballs 减少磁盘占用、 conda rename 重命名环境、conda create -n qwen --clone 当前环境

版权:本文由【墨理学AI】原创首发、各位读者大大、敬请查阅、感谢三连声明:作为全网AI领域干货最多的博主之一，❤️不负光阴不负卿❤️文章目录condaclean--tarballscondarename重命名环境condacreate-nqwen--clone某个环境condaremove删除环境建立huggingface模型下载路径的软链接❤️欢迎和墨理一起学AIcondaclean--tarb

墨理学AI·2025-03-31 07:50

LiblibAI 接入阿里通义大模型，推出 10 秒 AI 视频生成功能

此外，LiblibAI基于qwen-turbo打造了提示词

自不量力的A同学·2025-03-31 07:49

手动调参 vs 自动化：大语言模型微调的终极对决！

然而，在实际操作中，许多团队如Qwen选择采用手动调参而非自动化调参工具，这一决策背后蕴含着多方面的考量。一、模型复杂性与计算资源限制大语言模型的复杂性不容小觑，其参数量往往达到数十亿甚至上百亿。

从零开始学习人工智能·2025-03-31 06:44

Qwen2.5-Omni 多模态旗舰模型深度解析：性能、部署与个人玩家上手指南

目录1.Qwen2.5-Omni核心技术创新（1）统一的多模态架构（2）超长上下文支持（1MTokens）（3）高效推理优化2.与主流竞品全方位对比性能Benchmark对比（MMLU、VQA等任务）3

张3蜂·2025-03-30 23:54

【大模型开发】将vocab解码

举个例子：词汇你好；在Qwen的词汇表中使用一个token表示的，按理来说，我们可以直接在vocab.json文件中直接表示为"你好":108

SUNX-T·2025-03-30 21:14

高性能部署实战：vLLM 安装配置 × tokens/s 提升 × 并发测试（适配国产模型）

高性能部署实战：vLLM安装配置×tokens/s提升×并发测试（适配国产模型）本文目标：带你完整掌握如何使用vLLM高性能推理引擎部署国产大模型（如Qwen/DeepSeek），包括环境准备、部署流程

AI筑梦师·2025-03-30 21:44

【大模型篇】阿里云 Qwen2.5-Max：超大规模 MoE 模型架构和性能评估

一、引言Qwen2.5-Max是阿里云通义千问团队研发的超大规模Mixture-of-Expert（MoE）模型，旨在通过超大规模的数据和模型规模扩展来提升模型的智能水平。

大F的智能小课·2025-03-30 03:05

Ollama入门指南：部署与实战最新模型（DeepSeek-V3、Qwen2.5、Llama3）

一、Ollama核心优势与适用场景Ollama通过简化模型部署流程，支持开发者快速调用DeepSeek-V3（开源MoE模型）、Qwen2.5-Max（阿里编程旗舰模型）、Llama3（Meta基础模型

AndrewHZ·2025-03-30 02:32

【大模型】视觉语言模型：Qwen2.5-VL的使用

官方github地址：https://github.com/QwenLM/Qwen2.5-VL目录Qwen家族的最新成员：Qwen2.5-VL主要增强功能模型架构更新快速开始使用Transformers

Jackilina_Stone·2025-03-29 12:59

阿里全模态模型Qwen2.5-Omni现已开源，其7B尺寸的版本实现了全球顶尖的性能表现

今日，通义千问Qwen2.5-Omni-7B正式开源，作为通义系列首个端到端全模态大模型，它能够同时处理文本、图像、音频、视频等多类型输入，并实时生成文本与自然语音合成输出。

万才博客·2025-03-29 10:17

【拥抱AI】对比embedding模型gte-Qwen2-7B-instruct和bge-m3:latest(三)

为了更全面地评估gte-Qwen2-7B-instruct和bge-m3:latest的性能，我们可以从以下几个方面进行详细比较：1.模型架构和规模gte-Qwen2-7B-instruct架构：基于Transformer

奔跑草-·2025-03-28 14:22

Qwen2-Audio Qwen2.5-VL Qwen2.5_Omni傻傻分不清

引言：Qwen系列多模态大模型阿里巴巴Qwen团队在这一领域持续深耕，推出了一系列备受瞩目的多模态大模型。

kakaZhui·2025-03-27 18:56

qwen_vl_utils代码分析

函数列表：序号函数名简要说明1round_by_factor(number:int,factor:int)->int返回最接近number，且能被factor整除的整数。2ceil_by_factor(number:int,factor:int)->int返回大于等于number，且能被factor整除的最小整数。3floor_by_factor(number:int,factor:int)->i

fydw_715·2025-03-27 13:43

Docker vLLM 快速部署 Qwen2.5

Dockerfile：FROMkevinchina/deeplearning:llamafactory20241027#设置工作目录WORKDIR/app#暴露端口EXPOSE8000EXPOSE7860#使用JSON格式的ENTRYPOINT，指定要执行的命令#ENTRYPOINT["llamafactory-cli","api","--model_name_or_path","/data/xi

XD742971636·2025-03-25 18:23

Langchain+Ollama实现Qwen模型+客服问答私有数据FAQ-实现RAG

本文使用Ollama直接运行本地Qwen模型，需要先安装好ollama。

showker·2025-03-25 18:21

OpenManus 架构的详细技术实现

一、OpenManus架构的详细技术实现1.核心分层架构的深度解析底层：LLM层模型选择与适配：OpenManus允许用户替换底层LLM（如mPLUG-Owl3、Qwen、Llama等），通过统一接口调用模型

大势下的牛马·2025-03-22 22:12

01年实习生被曝负责字节RL核心算法！系字节LLM攻坚小组成员

用上该算法后，Qwen2.5-32B模型只经过RL训练，不引入蒸馏等其他技术，在AIME2024基准上拿下50分，优于相同setting下使用GRPO算法的DeepSeek-R1-Zero-Qwen，且

·2025-03-22 22:24

DeepSeek 部署指南 (使用 vLLM 本地部署)

我们以deepseek-ai/DeepSeek-R1-Distill-Qwen-7B模型为例进行演示。1、安装Python环境首先，您需要安装Python环境。

AGI大模型资料分享员·2025-03-22 19:51

llama-factory 微调 Qwen2.5-3B-Instruct

0、资源链接官方readme:https://github.com/hiyouga/LLaMA-Factory/blob/v0.9.1/README_zh.md官方文档:https://llamafactory.readthedocs.io/zh-cn/latest/官方推荐的知乎教程：https://zhuanlan.zhihu.com/p/6952876071、安装LLaMAFactorygi

coco_1998_2·2025-03-22 14:16

Qwen2-Audio：通义千问音频大模型技术解读

阿里巴巴通义千问团队，推出了Qwen-Audio系列模型，这里我们一起看下最新版本Qwen2-Audio。Qwen2-Audio不仅能够理解各种音频信号，还能根据语音指令做出文本回应，甚至可以进

kakaZhui·2025-03-21 01:41

开源模型应用落地-qwen模型小试-调用Qwen2-7B-Instruct-进阶篇（十二）

一、前言经过前五篇“qwen模型小试”文章的学习，我们已经熟练掌握qwen大模型的使用。然而，就在前几天阿里云又发布了Qwen2版本。

开源技术探险家·2025-03-20 19:23

LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人

前言LangChain是一个用于开发由大型语言模型（LargeLanguageModels，简称LLMs）驱动的应用程序的框架。它提供了一个灵活的框架，使得开发者可以构建具有上下文感知能力和推理能力的应用程序，这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库：Python和JavaScript库。包含了各种组件的接口和集成，一个基本的运行时，用于将这些组件组合

南七小僧·2025-03-20 18:44

有了大模型为何还需要Agent智能体

Agent（智能体）是一种能感知环境、自主决策、执行动作的智能实体，当它与大语言模型（如通义千问QWen、GPT）结合时，形成一种**“增强型AI系统”**。

全栈你个大西瓜·2025-03-20 09:59

agent实现：通过prompt方式实现agent自定义使用

参看：https://github.com/TommyZihao/openvino_tonypihttps://github.com/QwenLM/Qwen/blob/main/examples/react_prompt.md

loong_XL·2025-03-20 05:27

vllm部署说明和注意事项

DeepSeek-R1-Distill-Qwen-32B可去modelscope下载：整体大小约为60GB部署DeepSeek-R1-Distill-Qwen-32B模型，

ai一小生·2025-03-17 14:59

通过docker-compose部署qwen2-vl-7b模型

docker-compose部署qwen2-vl-7b模型准备工作docker-compose.yml遇到的报错在ONE-API设置测试脚本准备工作1、安装较新版本的docker-compose2、安装

scutshijie·2025-03-17 14:28

开源模型应用落地-Qwen2-VL-7B-Instruct-vLLM-OpenAI API Client调用

一、前言学习Qwen2-VL，为我们打开了一扇通往先进人工智能技术的大门。让我们能够深入了解当今最前沿的视觉语言模型的工作原理和强大能力。

开源技术探险家·2025-03-17 13:52

本地部署大模型QPS推理测试

2.2、50字左右问题2.3、100字左右问题3、测试代码3.1、通用测试代码3.2、通用测试代码（仅供参考）4、测试结果4.1、通用测试结果4.2、RAG测试结果1、测试环境1.1、显卡1.2、模型Qwen2.5

内卷焦虑人士·2025-03-17 03:30

主流开源大模型能力对比矩阵

模型名称核心优势主要局限Llama2/3✅多语言生态完善✅Rotary位置编码✅GQA推理加速⚠️数据时效性差⚠️隐私保护不足Qwen✅千亿参数规模✅中文语境优化✅复杂文本生成⚠️需高性能硬件⚠️领域知识需二次训练

时光旅人01号·2025-03-16 12:09

大模型火爆 2025：LLaMA、Qwen、DeepSeek 核心原理+就业秘籍，快速入门 AI 工程师

1.大模型核心原理：从零开始理解AI模型这些是大型语言模型（LLMs）的核心技术，适合初学者逐步深入学习。以下是详细拆解，让小白也能掌握：LLaMA系列模型核心原理详解：什么是LLaMA？：LLaMA是一个基于人工智能的语言模型，像一个超级聪明的聊天机器人，能理解和生成人类语言。它由Meta公司开发，类似ChatGPT，但更开源、灵活。核心原理：Transformer架构：想象一个工厂流水线，LL

weixin_40941102·2025-03-16 03:38

【奇点时刻】通义千问开源QwQ-32B技术洞察报告（扫盲帖）

以下报告将基于今天各大社区对Qwen/QwQ-32B（下文简称「QwQ-32B」）模型的讨论、测评与实测体验进行综合性分析与洞察。

碣石潇湘无限路·2025-03-16 03:37

推荐频道

Qwen