Qwen 第6页

llamaindex实现企业级RAG应用（一）

在上一篇文章中使用Qwen2进行RAG代码实践，手动实现了一版简易的RAG应用，在实际工作中通常都用会使用langchain或llamaindex架构来搭建rag应用，并且会非常复杂。

弈秋001·2025-03-15 15:15

qwen2.5的技术。

RMSNorm（RootMeanSquareNormalization，均方根归一化）是一种用于深度学习的归一化技术，是LayerNorm（层归一化）的一种改进。它通过计算输入数据的均方根（RootMeanSquare,RMS）来进行归一化，避免了传统归一化方法中均值和方差的计算1.LayerNorm（层归一化）LayerNorm（层归一化）是一种用于深度学习的归一化技术，主要用于稳定训练过程、加

KangkangLoveNLP·2025-03-14 13:29

【大模型技术】基于通义千问（Qwen）实现对话系统

使用Qwen提供的API生成自然语言回复。核心功能：多轮对话：用户可以连续提问，系统根据上下文生成连贯的回答。上下文管理：通过维护对话历史，确保模型理解用户的意图。

大数据追光猿·2025-03-14 08:48

QwQ-32B企业级本地部署：结合XInference与Open-WebUI使用

QwQ-32B是阿里巴巴Qwen团队推出的一款推理模型，拥有320亿参数，基于Transformer架构，采用大规模强化学习方法训练而成。

大势下的牛马·2025-03-14 00:56

离线服务器ollama新增qwen2:0.5b模型

离线服务器ollama新增qwen2:0.5b模型Dify集成ollama前面已经介绍过离线服务器CentOS使用的docker安装的ollama，其中在ollama中已经安装了deepseek-r1:

slient_love·2025-03-13 20:30

基于SWIFT和Qwen1.5-0.5B-Chat进行大模型全参微调（魔搭社区）

1，swift框架安装pipinstallms-swift2，模型下载gitclonehttps://www.modelscope.cn/qwen/Qwen1.5-0.5B-Chat.git二、数据集准备使用

m0_65156252·2025-03-13 18:47

从Swish到SwiGLU：激活函数的进化与革命，qwen2.5应用的激活函数

swiGLU和RMSNorm1.什么是swiGLUSwiGLU（Swish-GatedLinearUnit）是一种结合了Swish激活函数和GLU（GatedLinearUnit）门控机制的激活函数，广泛应用于现代大型语言模型中1.什么是Swish激活函数1.1Swish激活函数Swish激活函数是一种平滑的、非单调的激活函数，由GoogleBrain团队在2017年提出。它结合了ReLU的非线性

KangkangLoveNLP·2025-03-13 09:02

开源模型应用落地-qwen模型小试-Qwen-Agent（十一）

一、前言Qwen-Agent是一个利用开源语言模型Qwen的工具使用、规划和记忆功能的框架。其模块化设计允许开发人员创建具有特定功能的定制代理，为各种应用程序提供了坚实的基础。

开源技术探险家·2025-03-12 22:47

如果，你想找 AI大模型相关的工作，这三个建议你一定要看！

由难到简单，依次是：大模型算法（⭐⭐⭐⭐⭐）模型部署加速（⭐⭐⭐⭐）RAG等相关技术（⭐⭐⭐）纯应用（⭐⭐）Prompt工程师等其他自媒体（⭐）会简单应用就行02这结果方向，B站找几个视频看看，这里推荐用Qwen7B

我爱学大模型·2025-03-11 14:45

多模态模型在做选择题时，如何设置Prompt，如何精准定位我们需要的选项

我们这里以Qwen2-VL-7B-instruct为例：假设我们需要分析一张图片的情绪（从现有的情绪中进行选择），并且我们需要它以思维链的形式展现出来，我们可以这样设置prompt：emotion6_CoT

暗巷提灯·2025-03-11 03:10

vllm多卡部署Qwen2.5-72B-Instruct-GPTQ-Int4

双卡v10032G部署结果如下，推理时长16s3卡，tensor_parallel_size=3，tensor并行的数量一定要能被attentionheads整除4卡，tensor_parallel_size=4，推理速度4s

Yanc_L·2025-03-10 20:54

用双色球数据集微调后的大模型

最近用Qwen/Qwen1.5-1.8B-Chat大模型来微调训练双色球2003001-2025011的数据集，实验测一下大模型出球的预测情况。

qq_29790801·2025-03-10 17:33

【大模型】DeepSeek-R1-Distill-Qwen部署及API调用

DeepSeek-R1-Distill-Qwen是由中国人工智能公司深度求索（DeepSeek）开发的轻量化大语言模型，基于阿里巴巴的Qwen系列模型通过知识蒸馏技术优化而来。

油泼辣子多加·2025-03-10 17:29

Spark-TTS：基于大模型的文本语音合成工具

一、介绍SparkTTS完全基于Qwen2.5构建，无需额外的生成模型，它不依赖于单独的模型来生成声学特征，而是直接从LLM预测的代码中重建音频。这种方

CITY_OF_MO_GY·2025-03-10 13:35

开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现推理加速的正确姿势-Docker-OpenResty（三）

一、前言目前，大语言模型已升级至Qwen2.5版本。无论是语言模型还是多模态模型，均在大规模多语言和多模态数据上进行预训练，并通过高质量数据进行后期微调以贴近人类偏好。

开源技术探险家·2025-03-10 06:43

大模型与图数据库RAG通俗流程拆解

图构建（略）neo4j、tugraph等均可，不影响GraphRAG核心框架模型向量化模型bce-embedding-base_v1重排序模型bce-reranker-base_v1大语言模型Qwen/

gallonyin·2025-03-10 02:15

DeepSeek-R1的Qwen和Llama区别

好的，我现在需要回答用户关于DeepSeek-R1-Distill-Qwen-32B、DeepSeek-R1-Distill-Llama-70BPro和DeepSeek-R1-Distill-Qwen-

百态老人·2025-03-10 01:08

[论文笔记] LLaMA3.1与Qwen2与Apple 技术报告中预训练方案对比

https://arxiv.org/pdf/2407.21075https://arxiv.org/pdf/2407.10671https://arxiv.org/pdf/2407.21783LLaMA3.1LLaMA3.1技术报告：https://ai.meta.com/blog/meta-llama-3-1/

心心喵·2025-03-10 01:02

Qwen微调-环境配置-week9

在这里插入图片描述](https://img-blog.csdnimg.cn/direct/213a0fb70a2e430684155bbd06a7ff36.png#pic_center)Qwen1.5

breeze281·2025-03-08 23:01

Qwen1.5-7B-实现RAG应用详细步骤

1.准备工作1.1安装依赖确保你的环境中安装了以下工具和库：Python：建议使用Python3.8或更高版本。PyTorch：用于运行深度学习模型。Transformers：HuggingFace提供的库，支持加载和运行预训练模型。FAISS：用于向量检索的高效库。GPTQ支持库：如auto-gptq或gptqmodel。安装命令运行以下命令安装所需的Python包：pipinstalltorc

大数据追光猿·2025-03-08 23:01

阿里Qwen-1.8B的介绍和下载部署详细步骤

一、Qwen-1.8B的介绍Qwen-1.8B是阿里云推出的通义千问系列中的一个轻量化版本，参数量为18亿（1.8B）。

大数据追光猿·2025-03-08 23:31

深入浅出的理解deepseek类大模型（附运行代码）

我们把Qwen2模型想象成一个非常聪明的“阅读理解专家”。这个专家，就像我们人类一样，需要先“看”到文字，然后才能理解文字的意思，最后才能回答问题或者生成新的文字。

AI人工智能时代·2025-03-08 08:47

驭码CodeRider 闪电适配阿里QwQ-32B：8小时全栈集成，AI编程效率飞跃！

今日凌晨，国产大模型领域迎来重大突破：阿里正式发布32B推理模型QwQ-32B，根据Qwen公布的基准测试数据，QwQ-32B整体性能可媲美DeepSeek-R1，在数学推理、编程能力和通用能力等关键测试中展现出卓越性能

极小狐·2025-03-07 20:10

阿里云CTO：通义稳居全球最强开源大模型，性能接近GPT-4o

基础模型升级，性能媲美GPT-4o，发布最强开源模型Qwen2.5系列，

首席数智官·2025-03-07 20:39

vLLM部署Qwen2.5-VL-7B-Instruct实战：从hf-mirror下载权重全流程

本文将重点演示如何从国内镜像站https://hf-mirror.com高效下载Qwen2.5-VL-7B-Instruct模型权重，并通过vLLM完成部署。

几道之旅·2025-03-07 12:58

阿里深夜推出全新推理模型，仅1/20参数媲美DeepSeek R1满血版

一、参数效率革命：小体积承载大智慧阿里深夜推出全新推理模型，仅1/20参数媲美DeepSeekR1，就在刚才，阿里Qwen团队正式公布了最新研究成果——QwQ-32B大语言模型。

万事可爱^·2025-03-07 11:37

【AGI】中国大模型扛把子：通义家族

阿里云推出的**通义千问（Qwen）**系列大模型，凭借其多层次的技术架构、多样化的模型生态及开源战略，已成为全球AI领域的重要标

LeeZhao@·2025-03-07 09:40

深入探究LLamaFactory推理DeepSeek蒸馏模型时无法展示＜think＞思考过程的问题

3.自定义模板实现优化界面展示：实现思考过程的可视化实现方法参数调整影响分析实验一实验二进入大模型应用与实战专栏|查看更多专栏内容问题背景最近在本地环境中部署了DeepSeek-R1-Distill-Qwen

羊城迷鹿·2025-03-07 08:00

Hugging Face Agents Course （Dummy Agent）

参考链接：https://qwen.readthedocs.io/en/latest/getting_started/concepts.htmlhttps://huggingface.co/agents-course

ZHOU_CAMP·2025-03-07 02:53

只需几步！在本地电脑轻松部署DeepSeek大模型

它提供了丰富的模型库，包括Qwen、Llama等1700+大语言模型，并支持用户上传自己的模型。

魔法小匠·2025-03-07 01:42

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机多卡-RTX 4090双卡（五）

一、前言本篇文章将使用LLaMA-Factory去高效微调QWen2系列模型，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。

开源技术探险家·2025-03-06 23:26

驭码CodeRider 闪电适配阿里QwQ-32B：8小时全栈集成，AI编程效率飞跃！

今日凌晨，国产大模型领域迎来重大突破：阿里正式发布32B推理模型QwQ-32B，根据Qwen公布的基准测试数据，QwQ-32B整体性能可媲美DeepSeek-R1，在数学推理、编程能力和通用能力等关键测试中展现出卓越性能

·2025-03-06 22:12

如何从零开始训练大模型？（附AGI大模型路线图）

跟规模相对接近的2b、7b模型比，得分比qwen2b高，和qwen7b比有的高有的低。这个是minicpm的详细技术文档。https://shengdi

脱泥不tony·2025-03-06 21:13

媲美满血R1+，刚刚，阿里推理模型QwQ-32B开源

小尺寸，不要671B，只要32B，推理门槛低QwQ-32B与其他领先模型的性能对比，包括DeepSeek-R1-Distilled-Qwen

X.Cristiano·2025-03-06 17:03

LangChain链与记忆处理[10]：四种基础内置链、四种文档处理链，以及链的自定义和五种运行方式，让你的大模型更加智能

链与记忆处理[10]：四种基础内置链、四种文档处理链，以及链的自定义和五种运行方式，让你的大模型更加智能参考文章可以使用国产LLM进行下述项目复现：初识langchain[1]：Langchain实战教学，利用qwen2.1

汀、人工智能·2025-03-05 03:15

基于Ubuntu+vLLM+NVIDIA T4高效部署DeepSeek大模型实战指南

为了解决这一难题，我们转向了官方提供的优化版本——DeepSeek-R1-Distill-Qwen

来自于狂人·2025-03-05 02:01

ollama + qwen2.5-coder + VS Code + Continue 实现本地AI 辅助写代码

ollama+qwen2.5-coder+VSCode+Continue实现本地AI辅助写代码1.下载Ollama和qwen2.5-coder模型1.1安装ollama方式方式一：官网下载安装文件https

不二人生·2025-03-04 07:15

基于DeepSeek 的图生文最新算法 VLM-R1

具体来说，对于引用表达式理解（REC）的任务，我们使用R1和SFT方法训练了Qwen2.5-VL。结果表明，在域内测试数据

AI算法网奇·2025-03-03 18:02

llama_factory微调QWen1.5

GitHub-hiyouga/LLaMA-Factory:UnifyEfficientFine-Tuningof100+LLMsUnifyEfficientFine-Tuningof100+LLMs.Contributetohiyouga/LLaMA-FactorydevelopmentbycreatinganaccountonGitHub.https://github.com/hiyouga/L

Kun Li·2025-03-03 02:50

大模型微调入门（Transformers + Pytorch）

down_deepseek.pyfrommodelscopeimportsnapshot_downloadmodel_dir=snapshot_download('deepseek-ai/DeepSeek-R1-Distill-Qwen

昵称不能为null·2025-03-03 00:06

深度学习-136-LangGraph之应用实例(五)构建RAG问答系统同时从不同的角度对比优化效果

测试调用4总结与优化4.1问题分析4.2对比不同的返回文档数4.3对比不同的嵌入模型4.3.1嵌入模型nomic-embed-text4.3.2嵌入模型bge-m34.4对比不同的大模型4.4.1大模型qwen2

皮皮冰燃·2025-03-02 23:59

Qwen的github主页 - 介绍

HuggingFace|ModelScope|Paper｜️DemoWeChat(微信)|Discord｜APIQwen-Cha

强化学习曾小健·2025-03-02 20:41

本地大模型编程实战(27)初探langgraph的流式输出

本次演练将全部使用qwen2.5:

火云牌神·2025-03-01 15:22

[论文笔记] LLM大模型剪枝篇——2、剪枝总体方案

N=20（N：剪枝崩溃临界点，LLaMA2在45%，Mistral-7B在35%，Qwen在20%，Phi-2在25%）对后(P

心心喵·2025-03-01 04:25

2.9 部署模型-大模型ACP模拟题-真题

/model/qwen2_5-1_5b-instruct"--port8000B.vllmserve".

admin皮卡·2025-02-28 17:12

qwenvl 以及qwenvl 2 模型架构理解

qwenvl模型理解：参考资料：https://qwenlm.github.io/zh/blog/qwen2-vl/https://github.com/QwenLM/Qwen2-VLtab=readme-ov-filehttps

m0_74823239·2025-02-28 12:09

Ollama本地私有化部署通义千问大模型Qwen2.5

目录Qwen2.5介绍Qwen2.5新闻Ollama介绍Linux安装Ollama一键安装Ollama手工安装Ollama卸载OllamaOllama运行Qwen2基于Transformers进行推理本文复现环境

ErbaoLiu·2025-02-27 20:17

LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人

前言LangChain是一个用于开发由大型语言模型（LargeLanguageModels，简称LLMs）驱动的应用程序的框架。它提供了一个灵活的框架，使得开发者可以构建具有上下文感知能力和推理能力的应用程序，这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库：Python和JavaScript库。包含了各种组件的接口和集成，一个基本的运行时，用于将这些组件组合

闯江湖50年·2025-02-27 20:45

【AI学习】2024年末一些AI总结的摘录

从OpenAI的主导地位到Claude的异军突起，从xAI到中国的DeepSeek和Qwen，整个行业呈现出百花齐放的态势。让我们梳理2024年的关键进展，并展望2025年的研究方向。

bylander·2025-02-27 01:21

Ollama微调

它支持多种流行的开源大语言模型，如Llama2、Qwen2.5等。在上一篇文章中我们部署Ollama，并使用简单命令管理Ollama。接下来我们学习Ollama的高级应用。

软件不硬·2025-02-26 19:08

推荐频道

Qwen

llamaindex实现企业级RAG应用（一）

qwen2.5的技术。

【大模型技术】基于 通义千问（Qwen）实现对话系统

QwQ-32B企业级本地部署：结合XInference与Open-WebUI使用

离线服务器ollama新增qwen2:0.5b模型

基于SWIFT和Qwen1.5-0.5B-Chat进行大模型全参微调（魔搭社区）

从Swish到SwiGLU：激活函数的进化与革命，qwen2.5应用的激活函数

开源模型应用落地-qwen模型小试-Qwen-Agent（十一）

如果，你想找 AI大模型相关的工作，这三个建议你一定要看！

多模态模型在做选择题时，如何设置Prompt，如何精准定位我们需要的选项

vllm多卡部署Qwen2.5-72B-Instruct-GPTQ-Int4

用双色球数据集微调后的大模型

【大模型】DeepSeek-R1-Distill-Qwen部署及API调用

Spark-TTS：基于大模型的文本语音合成工具

开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现推理加速的正确姿势-Docker-OpenResty（三）

大模型与图数据库RAG通俗流程拆解

DeepSeek-R1的Qwen和Llama区别

[论文笔记] LLaMA3.1与Qwen2与Apple 技术报告中预训练方案对比

Qwen微调-环境配置-week9

Qwen1.5-7B-实现RAG应用详细步骤

阿里Qwen-1.8B的介绍和下载部署详细步骤

深入浅出的理解deepseek类大模型（附运行代码）

驭码CodeRider 闪电适配阿里QwQ-32B：8小时全栈集成，AI编程效率飞跃！

阿里云CTO：通义稳居全球最强开源大模型，性能接近GPT-4o

vLLM部署Qwen2.5-VL-7B-Instruct实战：从hf-mirror下载权重全流程

阿里深夜推出全新推理模型，仅1/20参数媲美DeepSeek R1满血版

【AGI】中国大模型扛把子：通义家族

深入探究LLamaFactory推理DeepSeek蒸馏模型时无法展示＜think＞思考过程的问题

Hugging Face Agents Course （Dummy Agent）

只需几步！在本地电脑轻松部署DeepSeek大模型

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机多卡-RTX 4090双卡（五）

驭码CodeRider 闪电适配阿里QwQ-32B：8小时全栈集成，AI编程效率飞跃！

如何从零开始训练大模型？（附AGI大模型路线图）

媲美满血R1+，刚刚，阿里推理模型QwQ-32B开源

LangChain链与记忆处理[10]：四种基础内置链、四种文档处理链，以及链的自定义和五种运行方式，让你的大模型更加智能

基于Ubuntu+vLLM+NVIDIA T4高效部署DeepSeek大模型实战指南

ollama + qwen2.5-coder + VS Code + Continue 实现本地AI 辅助写代码

基于DeepSeek 的图生文最新算法 VLM-R1

llama_factory微调QWen1.5

大模型微调入门（Transformers + Pytorch）

深度学习-136-LangGraph之应用实例(五)构建RAG问答系统同时从不同的角度对比优化效果

Qwen的github主页 - 介绍

本地大模型编程实战(27)初探langgraph的流式输出

[论文笔记] LLM大模型剪枝篇——2、剪枝总体方案

2.9 部署模型-大模型ACP模拟题-真题

qwenvl 以及qwenvl 2 模型架构理解

Ollama本地私有化部署通义千问大模型Qwen2.5

LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人

【AI学习】2024年末一些AI总结的摘录

Ollama微调

【大模型技术】基于通义千问（Qwen）实现对话系统