Qwen 第3页

联想 X 赞奇 | 共建 AI 生态，携手发布软硬协同的AIKnow智能体工作站

赞奇AIknow是由赞奇科技开发的一站式无代码智能体开发平台，通过整合主流的大语言模型（如Qwen、DeepSeek、ChatGLM等）、企业

·2025-05-13 14:07

使用阿里开源大模型通义千问Qwen进行推理

使用阿里开源大模型通义千问Qwen进行推理1.前置条件（1）已经安装ubutun22.04如何学习大模型技术赋能业务和垂直领域(1):安装双操作系统_大模型操作系统用windows还是linux-CSDN

云博士的AI课堂·2025-05-13 11:03

阿里通义千问Qwen3重磅发布！国产大模型如何颠覆AI行业？

2025年4月29日，阿里巴巴正式推出新一代大语言模型通义千问Qwen3，并宣布全面开源！这一消息瞬间引爆AI圈，被誉为“开源大模型王座再易主”的里程碑事件。

大模型研究院·2025-05-13 11:32

Qwen3+MCP+Ollama 本地工具调用实战教程

通义千问3（Qwen3）是阿里巴巴通义千问团队发布的最新开源大语言模型，它具备强大的性能、高度的模块化特性以及出色的工具使用能力。

大模型研究院·2025-05-13 10:52

【AI提升】AI利器Tool Call/Function Call(一):langchain+ollama+llama3/qwen2

1、使用AI的一个常用场景就是，接收人类的语言，识别人类的意图，最终进行相关的业务处理，这就是设计ToolCall/FunctionCall的初衷。2、现在一般都说ToolCall，以前常叫FunctionCall，不要纠结。一、安装环境1.1安装ollama参考：【AI基础】大模型部署工具之ollama的安装部署-第一步:下载安装ollama1.2部署大模型参考：【AI基础】大模型部署工具之ol

旭日跑马踏云飞·2025-05-13 07:05

本地聊天机器人部署方案

以下是一个全面的本地聊天机器人部署方案（适用于中文环境，兼顾现代大模型趋势）：一、模型选择与架构设计1.模型类型模型优点缺点推荐场景MiniChat(如ChatGLM2-6B,Qwen-1.8B,Baichuan2

大霸王龙·2025-05-13 06:26

llama.cpp无法使用gpu的问题

/model/hf_models/qwen/qwen3-4b-q8_0.gguf-ngl40报错如下ggml_cuda_init:failedtoinitializeCUDA:forwardcompatibilitywasattemptedonnonsupportedHWwarni

米有哥·2025-05-13 05:22

探索大语言模型（LLM）：查漏补缺，你真的完全了解大语言模型的术语吗？

例如：Qwen1.5-

艾醒(AiXing-w)·2025-05-12 14:13

【Qwen3 + MCP】快速打造一个免费的Qwen AI图像生成助手

大模型.·2025-05-12 11:50

语音合成之十三中文文本归一化在现代语音合成系统中的应用与实践

中文文本归一化在现代语音合成系统中的应用与实践引言理解中文文本归一化（TN）3主流LLM驱动的TTS系统及其对中文文本归一化的需求分析A.SparkTTS（基于Qwen2.5）与文本归一化B.CosyVoice

shichaog·2025-05-11 22:25

指令型模型与推理型模型在目标导向与可重复性方向的优缺点分析

同时，在实际业务中，使用提示词技巧让deepseek-r1-qwen-1.5b模型输出结构化数据的效果并不理想，会出现过度思考的情况。本文会回答三个问题：指令型模型与推理型模型的优缺点。提示词工程是

董厂长·2025-05-11 11:21

开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-Docker（二）

Qwen3-8B作为阿里云推出的混合推理模型，凭借80亿参数规模与128K超长上下文支持，展现了“快思考”与“慢思考”的协同能力，而vLLM框架则通过优化内存管理与并行计算，显著提升推理吞吐量。

开源技术探险家·2025-05-10 09:29

LLaMA-Omni 2:基于 LLM 的自回归流语音合成实时口语聊天机器人

LLaMA-Omni2是基于Qwen2.5-0.5B/1.5B/3B/7B/14B/32B-Instruct模型的一系列语音语言模型。

吴脑的键客·2025-05-10 04:55

llama factory lora 微调 qwen2.5 7B Instruct模型

项目背景甲方提供一台三卡4080显卡需要进行qwen2.57bInstruct模型进行微调。以下为整体设计。

路人与大师·2025-05-10 04:25

React -＞ AI组件 -＞调用Ollama模型, qwen3:1.7B非常聪明

使用React搭建一个现代化的聊天界面，支持与Ollama本地部署的大语言模型进行多轮对话。界面清爽、功能完整，支持Markdown渲染、代码高亮、隐藏思考标签、流式渐进反馈、暗黑模式适配等特性。核心功能亮点✅模型选择支持启动时自动请求http://localhost:11434/api/tags获取所有本地模型。允许用户通过下拉框动态切换聊天使用的模型。✅多轮对话支持聊天上下文由历史消息mess

HelloRevit·2025-05-10 04:25

阿里云的Qwen2.5-Coder 和 Qwen2.5-Math专有模型怎么样？

阿里云发布Qwen2.5系列模型，最新发布的Qwen2.5系列中包括普通的大语言模型(LLM)以及针对编程和数学的专用模型：Qwen2.5-Coder和Qwen2.5-Math。

碳治郎AI·2025-05-10 02:08

Qwen2.5模型结构

self.lm_head=nn.Linear(config.hidden_size,config.vocab_size,bias=False)这个是用来干嘛的输出层，词汇投影层，将模型输出的隐藏状态向量映射回词表空间，用于预测下一个token#预测logits，未经过softmaxlm_logits=self.lm_head(hidden_states)#shape:[B,L,vocab_size

AloneCat2012·2025-05-10 01:35

Qwen3 ：119 种语言 + 多模态全搞定

Qwen3像个会偷懒的学霸：简单问题（如聊天）让少数“专家”快速搞定，复杂问题（如写代码）再调动所有专家深度分析。

超算服务器Andy·2025-05-09 15:27

互联网大厂Java求职面试：AI集成与云原生架构设计

我之前用SpringAI接入了一个Qwen大模型，写了个智能客服系统。不过说实话，刚开始的时候我有点懵，不知道怎么处理多模态数据。技术总监：嗯，那你是怎么解决的呢？郑薪苦：我查了文档，发现Sp

在未来等你·2025-05-09 01:56

深度学习-159-综述之混合专家模型和推理模型以及工作流和智能体的概念

文章目录1专家混合模型(MoE)1.1专家1.2路由器1.3稀疏和密集MoE2混合推理模型2.1快思考模式2.2慢思考模式2.3两种模式的切换2.4混合推理模型Qwen33工作流和智能体3.1工作流(Workflow

皮皮冰燃·2025-05-08 11:24

Qwen3 混合思维模版解读

Qwen3对话模版解读引言在人工智能迅速发展的今天，大型语言模型（LargeLanguageModels，简称LLM）正逐渐成为各类应用的核心组件。

江小皮不皮·2025-05-08 09:17

AI日报 - 2025年04月30日

▎商业动向|阿里巴巴发布Qwen3，xAI推Grok3Mini/3.5，Axiom获1500万美元融资大型模型竞争加剧，AI初创公司获资本青睐，企业级AI应用加速落地（CohereCommandA,WriterPalmyraX5

訾博ZiBo·2025-05-07 11:24

Jetson × Qwen 实时边缘蒸馏与推理优化实战：轻量部署、动态蒸馏与性能加速全流程解析

Jetson×Qwen实时边缘蒸馏与推理优化实战：轻量部署、动态蒸馏与性能加速全流程解析关键词Jetson、Qwen、大模型蒸馏、边缘推理优化、动态蒸馏、TensorRT、边缘部署、轻量模型压缩、性能加速

观熵·2025-05-07 07:32

Qwen2-VL出现RuntimeError: CUDA error: too many resources requested for launch CUDA kernel errors的解决方案

本文主要介绍了Qwen2-VL出现RuntimeE

爱编程的喵喵·2025-05-07 04:44

Qwen2_5-Omni-3B：支持视频、音频、图像和文本的全能AI，可在本地运行

Qwen2.5-Omni-3B是阿里云推出的全能AI模型。它能同时处理视频、音频、图像和文本。只有3B参数，却能在本地运行强大的多模态功能。近日，已经在HuggingFace上发布。

李孟聊人工智能·2025-05-07 03:42

[论文笔记] pai-megatron qwen1.5报错

Qwen1.5-0.5b-chat使用example中fintune.py报错·Issue#77·QwenLM/Qwen1.5·GitHub解决方案：transformers升级到4.37.0pipinstallsetuptools

心心喵·2025-05-06 16:03

qwen3

通义千问Qwen3模型：思考更深邃，行动更迅速模型参数Qwen3系列模型的参数量从0.6B到235B不等，具体如下：模型名称总参数量激活参数量架构类型Qwen3-235B-A22B2350亿220亿MoEQwen3

KangkangLoveNLP·2025-05-06 13:44

NoThinking vs Thinking：推理模型无需思考也能有效

我们使用最先进的DeepSeek-R1-Distill-Qwen模型，发现通过简单的提示绕过思考过程（记作NoThinking）可以出人意料地有效。

王哥儿聊AI·2025-05-06 10:25

window11 部署llama.cpp并运行Qwen2-0.5B-Instruct-GGUF

吾名爱妃，性好静亦好动。好编程，常沉浸于代码之世界，思维纵横，力求逻辑之严密，算法之精妙。亦爱篮球，驰骋球场，尽享挥洒汗水之乐。且喜跑步，尤钟马拉松，长途奔袭，考验耐力与毅力，每有所进，心甚喜之。吾以为，编程似布阵，算法如谋略，需精心筹谋，方可成就佳作。篮球乃团队之艺，协作共进，方显力量。跑步与马拉松，乃磨炼身心之途，愈挫愈勇，方能达至远方。愿交志同道合之友，共探此诸般妙趣。诸君，此文尚佳，望点赞

Aiffy爱妃·2025-05-06 03:06

如何让通义千问大模型支持结构化输出？

通过Ollama把qwen3大

cmoaciopm·2025-05-06 00:52

Qwen2.5模型性能测评 - 速度指标

1.Tokens/s（每秒生成Token数）测量目标首次Token速度：第一个Token的生成时间（与TimetoFirstToken关联）后续Token速度：排除首个Token后的持续生成速率工具与方法fromtransformersimportAutoModelForCausalLM,AutoTokenizerimporttimemodel_name="/root/.cache/modelsc

风筝超冷·2025-05-05 16:30

【RAG实战】基于 LangChain+Transformers+Qwen3 的RAG 智能产品助手实现

1、背景介绍就在2025年4月29日凌晨，阿里巴巴正式推出新一代大语言模型通义千问Qwen3，并宣布全面开源。这一消息瞬间引爆AI圈，被誉为“开源大模型王座再易主”的里程碑事件。

大模型研究院·2025-05-05 10:16

No module named ‘llama_index.readers‘

frommodelscopeimportsnapshot_download#1、下载模型##推理模型model_dir=snapshot_download(model_id="deepseek-ai/DeepSeek-R1-Distill-Qwen

GIS从业者·2025-05-04 17:56

Phi-3 模型手机部署教程（微软发布的可与GPT-3.5媲美的小模型）

前面几篇博文，老牛同学和大家一起在个人电脑部署了Qwen2、GLM4、Llama3、ChatTTS和StableDiffusion等LLM大模型，也通过API和WebUI的方式完成了体验。

老牛同学·2025-05-04 10:43

阿里巴巴旗下的Qwen团队正式发布其最新一代大型语言模型——Qwen3系列

订阅：https://rengongzhineng.io/2025年4月28日，阿里巴巴旗下的Qwen团队正式发布其最新一代大型语言模型——Qwe

新加坡内哥谈技术·2025-05-04 10:11

Chainlit集成LlamaIndex并使用ollama本地模型实现AI知识库检索网页对话应用

，今天教大家如何使用本地llm模型和向量模型实现本地AI知识库问答系统，当然这个对你的电脑的显卡有一定要求，比如我本地测试的电脑使用的时英伟达3060TI的4G现存的显卡使用ollama部署了阿里云的qwen

泰山AI·2025-05-04 01:13

看看Qwen3自己怎么回答-Qwen3的两种思考模式是什么？

Qwen3的两种思考模式是“快速模式”和“深度模式”，分别对应不同的推理策略和应用场景：1.快速模式（ChatMode）特点：专注于快速生成简洁、直接的回答，适用于日常对话、简单问题或对时效性要求高的场景

释迦呼呼·2025-05-03 17:51

Electron Forge【实战】带图片的 AI 聊天

改用支持图片的AI模型qwen-turbo仅支持文字，要想体验图片聊天，需改用qwen-vl-plussrc/initData.ts{id:2,name:"aliyun",title:"阿里--通义千问

朝阳39·2025-05-02 23:50

抢先体验全新极小大模型Qwen3:0.6B

全民都在期待DeepSeek-R2的发布，但是一不小心被阿里截胡了，2025年4月29日，阿里巴巴发布并开源了通义千问Qwen3系列大模型。

康顺哥·2025-05-02 15:57

本地大模型编程实战(28)查询图数据库NEO4J(1)

使用qwen2.5做实验，用llama3.1查不出内容。文章目录安装`NEO4J`准备图数据查询图数据总结代码安装NEO4J参见：在windows系统中安装图数据库NEO4J。

火云牌神·2025-05-02 10:53

通义灵码正式上线 Qwen3，编程智能体马上来了！

刚刚，Qwen3正式发布并全部开源8款「混合推理模型」。

阿里云云原生·2025-05-02 05:47

Ollama 安装 QWen3 及配置外网访问指南

一、Ollama安装QWen3安装步骤首先尝试运行QWen3模型：ollamarunqwen3如果遇到版本不兼容错误（Error412），表示需要升级Ollama：curl-fsSLhttps://ollama.com

进取星辰·2025-05-02 04:13

DataWorks Copilot 集成 Qwen3-235B-A22B混合推理模型，AI 效能再升级！

刚刚，阿里云一站式智能大数据开发治理平台DataWorks正式接入Qwen3模型，可支持235B最大尺寸。

阿里云大数据AI技术·2025-05-01 14:40

Qwen最新多模态大模型：Qwen2.5-Omni介绍与快速入门

一、模型技术突破：重新定义多模态交互近日，Qwen2.5-Omni正式发布了！

人肉推土机·2025-05-01 04:36

【爆款预定】五一长假+Qwen3发布=AI效率巅峰？告别瞎指挥，大模型实用指南助你假期躺赢！

【爆款预定】五一长假+Qwen3发布=AI效率巅峰？告别瞎指挥，大模型实用指南助你假期躺赢！导读：AI圈风起云涌，阿里Qwen3携高分测评强势来袭！

aiAIman·2025-05-01 04:34

Qwen3跑分到底在“秀”什么？小白也能看懂的LLM能力单，让你选型不迷路！

Qwen3跑分到底在“秀”什么？小白也能看懂的LLM能力单，让你选型不迷路！导读：是不是感觉每次大厂发布新AI模型，都会甩出一堆让人头大的“跑分表”？