QWEN 第3页

走向边缘智能，美格智能携手阿加犀成功在高算力AI模组上运行一系列大语言模型

近日，美格智能发挥软硬件一体协同开发能力，融合阿加犀卓越的AI优化部署技术，在搭载高通QCS8550平台的高算力AI模组上，成功运行了一系列大语言模型，包括LLaMA-2、通义千问Qwen、百川大模型、

美格智能·2023-12-15 23:38

baichuan-7B-chat微调报错及解决记录使用的仓库：LLaMA-Factory 2023年11月27日

我所使用的代码仓库是LLaMA-Factoryhiyouga/LLaMA-Factory:Easy-to-useLLMfine-tuningframework(LLaMA,BLOOM,Mistral,Baichuan,Qwen

ygdzzx·2023-12-15 13:57

大模型的实践应用13-量化后的通义千问Qwen的18亿参数在CPU上的部署，最小2GB显存可跑，并利用两种文本流式方式输出

大家好，我是微学AI，今天给大家介绍大模型的实践应用13-量化后的通义千问Qwen的18亿参数在CPU上的部署，最小2GB显存可跑，并利用两种文本流式方式输出。

微学AI·2023-12-14 21:01

Qwen 通义千问 14B 模型，长文本问答效果测试

千问的config：seq_len=2kmax_position_embedding=8k注意，以下实验结果的字数是token数，不是中文字符数。不使用动态ntk12000字输入：乱码5000字输入：乱码1500字输入：正常不使用动态ntk，使用线性位置插值缩放4倍12000字输入：乱码5000字输入：正常，但废话多，质量低。1500字输入：正常，但答案错误不使用动态ntk，使用线性位置插值缩放2

防搞活机·2023-12-07 01:31

2023-12-05 AIGC-阿里通义千问QWEN-说明

摘要：2023-12-05AIGC-阿里通义千问QWEN-说明代码仓库:GitHub-QwenLM/Qwen:TheofficialrepoofQwen(通义千问)chat&pretrainedlargelanguagemodelproposedbyAlibabaCloud

悟世者·2023-12-05 21:06

RoPE旋转位置编码浅析

RoPE旋转位置编码浅析本文介绍了旋转位置编码RoPE在大模型中的广泛应用，包括Llama、Mistral7B、Baichuan、ChatGLM、Qwen、…等。

段智华·2023-12-05 08:47

llama.cpp部署通义千问Qwen-14B

今天在github上看到前几天llama.cpp已经支持Qwen的推理了，但是由于是近期才开源的，网上还没有太多使用llama.cpp来推理通义千问的实例。本着学习的目的，今天就来实

静待梅花开·2023-12-04 01:22

3090微调多模态模型Qwen-VL踩坑

如下:[{"id":"identity_0","conversations":[{"from":"user","value":"你好"},{"from":"assistant","value":"我是Qwen-VL

微凉的衣柜·2023-12-04 00:34

通义千问模型学习和 SDK试用

通义千问-14B-Chat-Int4·模型库(modelscope.cn)**通义千问-14B（Qwen-14B）**是阿里云研发的通义千问大模型系列的140亿参数规模的模型。

wangqiaowq·2023-12-03 21:00

阿里千问Qwen-72 b在中文测试中击败了GPT-3.5

2023.11.30我们在ModelScope和HuggingFace上发布了Qwen-72B和Qwen-72B-Chat，它们在3T令牌上进行训练并支持32k上下文，以及Qwen-1.8B和Qwen-

极道Jdon·2023-12-03 08:00

阿里云开源通义千问720亿参数模型，性能超越大部分商用闭源大模型

12月1日，阿里云举办通义千问发布会，开源通义千问720亿参数模型Qwen-72B。

CSDN云计算·2023-12-02 17:47

阿里云通义千问720亿参数模型开源，适配企业级、科研级高性能应用

12月1日，阿里云举办通义千问发布会，开源通义千问720亿参数模型Qwen-72B。

光锥智能·2023-12-02 08:06

关于大模型在文本分类上的尝试

文章目录前言所做的尝试总结前言总共25个类别，在BERT上的效果是48%，数据存在不平衡的情况，训练数据分布如下：训练数据不多，4000左右所做的尝试1、基于Qwen-14b-base做LoraSFT，

ToTensor·2023-11-30 16:13

手把手教你Autodl平台Qwen-7B-Chat FastApi 部署调用

手把手带你在AutoDL上部署Qwen-7B-ChatFastApi调用项目地址：https://github.com/datawhalechina/self-llm.git如果大家有其他模型想要部署教程

Unicornlyy·2023-11-29 23:44

手把手教你在AutoDL上Qwen-7B-Chat WebDemo Qwen-7B-Chat 网络演示

手把手带你在AutoDL上Qwen-7B-ChatWebDemoQwen-7B-Chat网络演示项目地址：https://github.com/datawhalechina/self-llm.git如果大家有其他模型想要部署教程

Unicornlyy·2023-11-29 23:44

手把手教你在AutoDL上部署Qwen-7B-hat Transformers 部署调用

手把手带你在AutoDL上部署Qwen-7B-hatTransformers调用项目地址：https://github.com/datawhalechina/self-llm.git如果大家有其他模型想要部署教程

Unicornlyy·2023-11-29 23:10

阿里基于Qwen-Chat提出Qwen-Audio!

论文链接：https://arxiv.org/pdf/2311.07919.pdf开源代码：https://github.com/QwenLM/Qwen-Audio引言大型语言模型（LLMs）由于其良好的知识保留能力

希尔贝壳AISHELL·2023-11-29 16:20

Langchain-Chatchat学习

参考：Langchain-Chatchat+阿里通义千问Qwen保姆级教程|次世代知识管理解决方案-知乎(zhihu.com)中文LLM生态观察模型就开源的部分而言，从一开始的MOSS[1]ChatGLM

wangqiaowq·2023-11-29 16:17

通义千问 Qwen-7B-Chat-Int4 模型本地化部署

如需在本地或离线环境下运行本项目，需要首先将项目所需的模型下载至本地，通常开源LLM与Embedding模型可以从HuggingFace下载。以本项目中默认使用的LLM模型THUDM/ChatGLM2-6B与Embedding模型moka-ai/m3e-base为例：下载模型需要先安装GitLFS，然后运行参考：通义千问部署搭建_代码浪人的博客-CSDN博客gitclonehttps://www.

wangqiaowq·2023-11-29 16:46

开源语音大语言模型——Qwen-Audio

论文链接：https://arxiv.org/pdf/2311.07919.pdf开源代码：https://github.com/QwenLM/Qwen-Audio一、背景大型语言模型（LLMs）由于其良好的知识保留能力

伪_装·2023-11-28 06:39

盘点2023年Q3的开源模型，这些值得推荐！

LLaMA2Baichuan2ChatGLM2-6BQwen-14BInternLM-20BTigerbot-13BTigerbot-70B多模态模型LLaVA1.5VisualGLM-6BVisCPMNexT-GPTMiniGPT-5Qwen-VLAgent

快乐小码农·2023-11-26 10:57

阿里基于Qwen-Chat提出Qwen-Audio!

论文链接：https://arxiv.org/pdf/2311.07919.pdf开源代码：https://github.com/QwenLM/Qwen-Audio引言大型语言模型（LLMs）由于其良好的知识保留能力

希尔贝壳AISHELL·2023-11-25 07:44

大模型增量预训练参数说明

欢迎关注公众号模型参数model_type模型类型，例如bloom,llama，baichuan，qwen等。model_name_or_path模型名称或者路径。

hj_caas·2023-11-24 02:32

主流开源大语言模型的微调方法

文章目录模型ChatGLM2网址原生支持微调方式ChatGLM3网址原生支持微调方式Baichuan2网址原生支持微调方式Qwen网址原生支持微调方式框架FireflyEfficient-Tuning-LLMsSuperAdapters

羊城迷鹿·2023-11-23 19:11

荣耀董事长换帅，辟谣“借壳上市”；传拼多多入局大模型，年薪百万招兵买马；ChatGPT Voice语音聊天免费开放| 极客头条

阿里巴巴发布音频语言模型Qwen-Audio荣耀董事长换帅，辟谣“借壳上市”TCL芯片公司摩星宣布解散，有员工签署N+1赔偿小米武汉科技园将于今年年底竣工消息称拼多多入局大模型，年薪百万招兵买马消息称

极客日报·2023-11-23 09:47

本地部署 Qwen-14B-Chat

本地部署Qwen-14B-Chat1.Qwen-14B概述2.Github地址3.创建虚拟环境4.安装依赖项5.快速使用6.启动web演示7.访问Qwen1.Qwen-14B概述通义千问-14B（Qwen

engchina·2023-11-20 14:48

Qwen-14B-Chat-Int4推理报错:ImportError: libcudart.so.12: cannot open shared object file

在Qwen-14B-Chat-Int4推理时，发现报错，缺少optimum和auto-gptq两个pip包Traceback(mostrecentcalllast):File"test_qwen_14b_int4

城南皮卡丘·2023-11-20 12:59

qwen大模型，推理速度慢，单卡/双卡速度慢，flash-attention安装，解决方案

场景阿里的通义千问qwen大模型，推理速度慢，单卡/双卡速度慢。

Bean_zx·2023-11-20 06:19

【工程实践】Docker使用记录

1.写Dockerfile1.1全新镜像FROMnvidia/cuda:11.7.1-devel-ubuntu22.04ENVWORKDIR=/data/Qwen-14B-ChatWORKDIR$WORKDIRADD

DonngZH·2023-11-17 18:57

阿里巴巴将开源720亿参数大模型；开源语言大模型演进史

目前，阿里巴巴已经开源通义千问140亿参数模型Qwen-14B和70亿参数模型Qwen-7B。

go2coding·2023-11-11 05:45

LLM系列 | 26：阿里千问Qwen模型解读、本地部署

今天这篇小作文主要介绍中文大模型阿里千问Qwen，具体包括模型细节解读和实战这2部分。如需与小编进一步交流(包括完整代码获取)，可以通过主页添加小编好友。简介Qwen是一个全能的语言模型系列，包含各种

JasonLiu1919·2023-11-04 18:44

搭建一个自己的学术语音助手（2）

这部分代码实现中LLM服务时符合openai的api标准，也就是说只需要把里面用到LLM地方服务换了可以用chatgpt、本地部署的LLM服务、智谱、qwen服

远洋之帆·2023-11-01 02:48

Qwen7b微调保姆级教程

我们构造了一个修改大模型自我认知的3轮对话的玩具数据集，使用QLoRA算法，只需要5分钟的训练时间，就可以完成微调，并成功修改了LLM模型的自我认知(以Qwen7b-Chat为例)。

算法美食屋·2023-10-30 03:41

BaiChuan-QWen

QWenTokenizer选择bytepairencoding(BPE)作为分词方法vacabulary在中文上做了增强，验证增加vocabulary的规模不会为下游任务带来负面影响ModelPositionalembedding：选择RoPE，反向更新时选择FP32的精度而不是FP16或BP16，以提高模型精度Bias：在多数layer中去除了bias，但是在注意力的QKV的layer中，加入了

银晗·2023-10-30 03:09

Qwen-VL:A versatile vision-language model for understanding,localization,text reading and beyond

1.introductionQwen-VL和QWen-VL-chat，QWen-VL是一个预训练模型，通过连接一个视觉编码器扩展了QWen-7B语言模型的视觉能力，经过三个阶段训练后，QWen-VL具有感知和理解多层次尺度视觉信号的能力

Kun Li·2023-10-17 18:02

【通义千问】大模型Qwen GitHub开源工程学习笔记（4）-- 模型的量化与离线部署

摘要：量化方案基于AutoGPTQ，提供了Int4量化模型，其中包括Qwen-7B-Chat和Qwen-14B-Chat。更新承诺在模型评估效果几乎没有损失的情况下，降低存储要求并提高推理速度。

大表哥汽车人·2023-10-14 13:11

【通义千问】Qwen从本地加载分词器报错‘‘tokenizer class not exist‘‘

问题描述：将模型文件下载到本地，模型文件==>https://huggingface.co/Qwen/Qwen-7B-Chat/tree/main通过【from_pretrained】去加载本地磁盘上的分词器

大表哥汽车人·2023-10-08 15:00

使用4090显卡部署 Qwen-14B-Chat-Int4

使用4090显卡部署Qwen-14B-Chat-Int41.Qwen-Agent概述2.Github地址3.创建虚拟环境4.安装依赖项5.快速使用6.启动web演示7.访问Qwen1.Qwen-Agent

engchina·2023-10-06 13:20

【通意千问】大模型GitHub开源工程学习笔记（2）--使用Qwen进行推理的示例代码解析，及transformers的库使用

使用Transformers来使用模型如希望使用Qwen-chat进行推理，所需要写的只是如下所示的数行代码。

大表哥汽车人·2023-10-01 12:04

【通意千问】大模型GitHub开源工程学习笔记（3）-- 通过Qwen预训练语言模型自动完成给定的文本

摘要：本笔记分析了使用预训练的模型生成文本的示例代码。它的步骤如下：使用已加载的分词器tokenizer对输入文本进行处理，转换为模型可以理解的格式。输入文本是国家和首都的信息，最后一句是未完成的，需要模型来生成。将处理后的输入转移到模型所在的设备上（例如GPU或CPU）。使用模型的generate方法对输入进行处理，生成预测的输出。使用分词器的decode方法将生成的输出从模型理解的格式转换回文

大表哥汽车人·2023-09-30 05:23

第十三篇-Tesla P40+ModelScope+Gradio+QWen-14B-Int4

本文主要实现Qwen-14B-Chat-Int4部署与测试环境系统：CentOS-7CPU:14C28T显卡：TeslaP4024G驱动:515CUDA:11.7cuDNN:8.9.2.26创建环境condacreate

木卫二号Coding·2023-09-29 17:39

阿里云开源通义千问多模态大模型 Qwen-VL

Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发，支持图文输入，具备多模态信息理解能力。

深圳市晶立弘泰电子·2023-09-27 19:21

【LLM】Windows10环境部署阿里通义千问大模型(Qwen-14B-Chat-Int4)

喝不完一杯咖啡·2023-09-27 19:49

【通意千问】大模型GitHub开源工程学习笔记（1）

9月25日，阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。立马就到了GitHub去fork。

大表哥汽车人·2023-09-27 07:42

利用WSL2本地部署-通义千问Qwen-7B-Chat

本文主要介绍了利用WSL2本地部署通义千问Qwen-7B-Chat的方案，希望大家能通过本文搭建起自己的大语言模型。

ryancurry·2023-09-26 12:18

阿里云通义千问14B模型开源！性能超越Llama2等同等尺寸模型

9月25日，阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。

CSDN云计算·2023-09-26 05:38

Qwen-VL：多功能视觉语言模型，能理解、能定位、能阅读等

面向文本的视觉问答4.3指代表达理解4.4视觉语言任务中的小样本学习4.4现实用户行为下的指令遵循5相关工作6总结与展望附录A数据集细节A.2视觉问答A.3定位A.4文本识别B多任务预训练的数据格式C超参数总览题目:Qwen-VL

猴猴猪猪·2023-09-23 21:00

第十二篇-Tesla P40+ModelScope+Gradio+QWen+MindChat

本文主要实现Qwen-7B-Chat与MindChat-Qwen-7B的简单部署与测试环境系统：CentOS-7CPU:14C28T显卡：TeslaP4024G驱动:515CUDA:11.7cuDNN:

木卫二号Coding·2023-09-21 16:56

首发Qwen-VL-Chat模型的A卡本地部署教程

木法星人·2023-09-19 01:25

qwen微调

envapt-getupdateapt-getinstallgit-lfsgitinitgitlfsinstallmkdirQwencdQwengitclonehttps://huggingface.co/Qwen

王多头发·2023-09-17 23:06

推荐频道

QWEN

走向边缘智能，美格智能携手阿加犀成功在高算力AI模组上运行一系列大语言模型

baichuan-7B-chat微调报错及解决记录 使用的仓库：LLaMA-Factory 2023年11月27日

大模型的实践应用13-量化后的通义千问Qwen的18亿参数在CPU上的部署，最小2GB显存可跑，并利用两种文本流式方式输出

Qwen 通义千问 14B 模型，长文本问答效果测试

2023-12-05 AIGC-阿里通义千问QWEN-说明

RoPE旋转位置编码浅析

llama.cpp部署通义千问Qwen-14B

3090微调多模态模型Qwen-VL踩坑

通义千问 模型学习 和 SDK试用

阿里千问Qwen-72 b在中文测试中击败了GPT-3.5

阿里云开源通义千问720亿参数模型，性能超越大部分商用闭源大模型

阿里云通义千问720亿参数模型开源，适配企业级、科研级高性能应用

关于大模型在文本分类上的尝试

手把手教你Autodl平台Qwen-7B-Chat FastApi 部署调用

手把手教你在AutoDL上Qwen-7B-Chat WebDemo Qwen-7B-Chat 网络演示

手把手教你在AutoDL上部署Qwen-7B-hat Transformers 部署调用

阿里基于Qwen-Chat提出Qwen-Audio!

Langchain-Chatchat学习

通义千问 Qwen-7B-Chat-Int4 模型本地化部署

开源语音大语言模型——Qwen-Audio

盘点2023年Q3的开源模型，这些值得推荐！

阿里基于Qwen-Chat提出Qwen-Audio!

大模型增量预训练参数说明

主流开源大语言模型的微调方法

荣耀董事长换帅，辟谣“借壳上市”；传拼多多入局大模型，年薪百万招兵买马；ChatGPT Voice语音聊天免费开放| 极客头条

本地部署 Qwen-14B-Chat

Qwen-14B-Chat-Int4推理报错:ImportError: libcudart.so.12: cannot open shared object file

qwen大模型，推理速度慢，单卡/双卡速度慢，flash-attention安装，解决方案

【工程实践】Docker使用记录

阿里巴巴将开源720亿参数大模型；开源语言大模型演进史

LLM系列 | 26：阿里千问Qwen模型解读、本地部署

搭建一个自己的学术语音助手（2）

Qwen7b微调保姆级教程

BaiChuan-QWen

Qwen-VL:A versatile vision-language model for understanding,localization,text reading and beyond

【通义千问】大模型Qwen GitHub开源工程学习笔记（4）-- 模型的量化与离线部署

【通义千问】Qwen从本地加载分词器报错‘‘tokenizer class not exist‘‘

使用4090显卡部署 Qwen-14B-Chat-Int4

【通意千问】大模型GitHub开源工程学习笔记（2）--使用Qwen进行推理的示例代码解析，及transformers的库使用

【通意千问】大模型GitHub开源工程学习笔记（3）-- 通过Qwen预训练语言模型自动完成给定的文本

第十三篇-Tesla P40+ModelScope+Gradio+QWen-14B-Int4

阿里云开源通义千问多模态大模型 Qwen-VL

【LLM】Windows10环境部署阿里通义千问大模型(Qwen-14B-Chat-Int4)

【通意千问】大模型GitHub开源工程学习笔记（1）

利用WSL2本地部署-通义千问Qwen-7B-Chat

阿里云通义千问14B模型开源！性能超越Llama2等同等尺寸模型

Qwen-VL：多功能视觉语言模型，能理解、能定位、能阅读等

第十二篇-Tesla P40+ModelScope+Gradio+QWen+MindChat

首发Qwen-VL-Chat模型的A卡本地部署教程

qwen微调

baichuan-7B-chat微调报错及解决记录使用的仓库：LLaMA-Factory 2023年11月27日

通义千问模型学习和 SDK试用