qwen2

开源模型应用落地-qwen模型小试-调用Qwen2-7B-Instruct-进阶篇（十二）

然而，就在前几天阿里云又发布了Qwen2版本。无论是语言模型还是多模态模型，均在大规模多语言和多模态数据上进行预训练，并通过高质量数据进行后期微调以贴近人类偏好。

开源技术探险家·2025-03-20 19:23

llamaindex实现企业级RAG应用（一）

在上一篇文章中使用Qwen2进行RAG代码实践，手动实现了一版简易的RAG应用，在实际工作中通常都用会使用langchain或llamaindex架构来搭建rag应用，并且会非常复杂。

弈秋001·2025-03-15 15:15

离线服务器ollama新增qwen2:0.5b模型

离线服务器ollama新增qwen2:0.5b模型Dify集成ollama前面已经介绍过离线服务器CentOS使用的docker安装的ollama，其中在ollama中已经安装了deepseek-r1:

slient_love·2025-03-13 20:30

[论文笔记] LLaMA3.1与Qwen2与Apple 技术报告中预训练方案对比

https://arxiv.org/pdf/2407.21075https://arxiv.org/pdf/2407.10671https://arxiv.org/pdf/2407.21783LLaMA3.1LLaMA3.1技术报告：https://ai.meta.com/blog/meta-llama-3-1/

心心喵·2025-03-10 01:02

深入浅出的理解deepseek类大模型（附运行代码）

我们把Qwen2模型想象成一个非常聪明的“阅读理解专家”。这个专家，就像我们人类一样，需要先“看”到文字，然后才能理解文字的意思，最后才能回答问题或者生成新的文字。

AI人工智能时代·2025-03-08 08:47

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机多卡-RTX 4090双卡（五）

一、前言本篇文章将使用LLaMA-Factory去高效微调QWen2系列模型，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。

开源技术探险家·2025-03-06 23:26

深度学习-136-LangGraph之应用实例(五)构建RAG问答系统同时从不同的角度对比优化效果

测试调用4总结与优化4.1问题分析4.2对比不同的返回文档数4.3对比不同的嵌入模型4.3.1嵌入模型nomic-embed-text4.3.2嵌入模型bge-m34.4对比不同的大模型4.4.1大模型qwen2

皮皮冰燃·2025-03-02 23:59

Ollama本地私有化部署通义千问大模型Qwen2.5

目录Qwen2.5介绍Qwen2.5新闻Ollama介绍Linux安装Ollama一键安装Ollama手工安装Ollama卸载OllamaOllama运行Qwen2基于Transformers进行推理本文复现环境

ErbaoLiu·2025-02-27 20:17

记录一些可用的AI工具网站

AI乐曲生成AI视频生成AI音频分离AI对话大模型当前时代巅峰，MicrosoftCopilot：https://copilot.microsoft.com个人机可以部署的开源模型巅峰，阿里的通义千问Qwen2

starvapour·2025-02-23 13:51

华为NPU服务器昇腾Ascend 910B2部署通义千问Qwen2.5——基于mindie镜像一路试错版（一）

blog.csdn.net/xiezhipu/article/details/145467032)[昇腾，mindie，镜像，部署vllm：第2篇，启动mindieservice_daemon服务，支持对Qwen2

几道之旅·2025-02-12 10:06

华为NPU服务器昇腾Ascend 910B2部署通义千问Qwen2.5——基于mindie镜像一路试错版（三）

blog.csdn.net/xiezhipu/article/details/145467032)[昇腾，mindie，镜像，部署vllm：第2篇，启动mindieservice_daemon服务，支持对Qwen2

几道之旅·2025-02-12 10:06

我把DeepSeek-R1推理能力知识蒸馏到Qwen2，效果真的炸裂！！！

我把DeepSeek-R1推理能力知识蒸馏到Qwen2，效果真的炸裂！！！

AI生成曾小健·2025-01-31 03:00

VLM 系列——Qwen2 VL——论文解读——前瞻（源码解读）

一、概述1、是什么是一系列多模态大型语言模型（MLLM），其中包括2B、7B、72B三个版本，整体采用视觉编码器+LLM形式（可以认为没有任何投射层）。比较创新的是图像缩放方式+3DLLM位置编码+（预估后面的训练方式也不太一样）。能够处理包括文本、图像在内的多种数据类型，具备图片描述、单图文问答、多图问对话、视频理解对话、json格式、多语言、agent、高清图理解（代码编写和debug论文暂时

TigerZ*·2025-01-16 18:48

开源模型应用落地-qwen2-7b-instruct-LoRA微调-unsloth（让微调起飞）-单机单卡-V100（十七）

一、前言本篇文章将在v100单卡服务器上，使用unsloth去高效微调QWen2系列模型，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。

开源技术探险家·2024-09-14 13:28

vllm在线推理踩坑记

最近在《AI大模型全栈工程师》课程里看老师推荐使用vllm部署大模型，优点就不详细介绍了，这里摘抄一段来自于Qwen2上手指南对于它的简单介绍：它易于使用，且具有最先进的服务吞吐量、高效的注意力键值内存管理

懂点投资的码农·2024-09-14 12:14

【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人

系列篇章No.文章1【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践2【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人3【Qwen2部署实战

寻道AI小兵·2024-09-12 06:09

vLLM (3) - Sequence & SequenceGroup

系列文章目录vLLM(1)-Qwen2推理&部署vLLM(2)-架构总览vLLM(3)-Sequence&SequenceGroup文章目录系列文章目录前言一、SequenceStage&SequenceStatus1

戴昊光·2024-09-07 02:08

开源模型应用落地-qwen2-7b-instruct-LoRA微调-ms-swift-单机单卡-V100（十二）

一、前言本篇文章将在v100单卡服务器上，使用ms-swift去高效微调QWen2系列模型，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。

开源技术探险家·2024-08-31 10:41

小白学大模型——Qwen2理论篇

一、Qwen2架构图二、Qwen2技术修改点TransformerArchitecturewithSwiGLUactivation:不多说，最主流的transformer架构，不变。

fan_fan_feng·2024-08-25 14:41

paddle nlp 3.0 全面拥抱开源大模型

首先安装神圣的飞桨自然语言处理框架3.0pipinstall--upgradepaddlenlp==3.0.0b0阿里云通义千问（Qwen2）系列大模型介绍阿里云通义千问（Qwen2）是阿里云推出的一系列先进的大型语言模型

路人与大师·2024-08-24 04:40

推荐频道