E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Qwen
【llm对话系统】大模型 Llama、
Qwen
和 ChatGLM 的网络结构和训练方法对比
1.引言近年来,大型语言模型(LLM)取得了令人瞩目的进展,其中Llama、
Qwen
和ChatGLM是三个备受关注的开源模型。
kakaZhui
·
2025-02-02 07:54
llama
人工智能
AIGC
chatgpt
python
2025年02月01日Github流行趋势
项目名称:
Qwen
2.5-VL项目地址url:https://github.com/Q
油泼辣子多加
·
2025-02-01 21:21
GitHub每日趋势
github
我把DeepSeek-R1推理能力知识蒸馏到
Qwen
2,效果真的炸裂!!!
我把DeepSeek-R1推理能力知识蒸馏到
Qwen
2,效果真的炸裂!!!
AI生成曾小健
·
2025-01-31 03:00
自然语言处理
人工智能
阿里巴巴
Qwen
团队发布AI模型,可操控PC和手机
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行!订阅:https://rengongzhineng.io/这周,科技界的目光几乎都被DeepSeek的R1模型吸引,但阿里巴巴并没有袖手旁观。1月
新加坡内哥谈技术
·
2025-01-30 08:50
人工智能
深度学习
语言模型
学习
如何评价deepseek上线的deepseek-V3模型?怎么使用?
该模型在多项评测中表现出色,超越了
Qwen
2.5-72B和Llama-3.1-405B等开源模型,并与世界顶尖的闭源模型如GPT-4o和Claude-3.5-Sonnet相媲美。
百态老人
·
2025-01-30 01:36
学习
开源模型应用落地-
qwen
模型小试-
Qwen
2.5-7B-Instruct-LangGraph-链式处理(一)
Qwen
2.5模型是一款备受瞩目的大语言模型,它具备出色的语言理解和生成能力,在广泛的自然语言处理任务中都展现出了卓越的性能。
开源技术探险家
·
2025-01-29 21:33
开源模型-实际应用落地
#
深度学习
自然语言处理
语言模型
langchain
如何从零开始训练大模型(预训练方向)
跟规模相对接近的2b、7b模型比,得分比
qwen
2b高,和
qwen
7b比有的高有的低。这个是minicpm的详细技术文档:https://shengd
AI小白熊
·
2025-01-29 16:43
prompt
人工智能
ai
大模型
程序员
转行
学习
DeepSeek-R1-Distill-
Qwen
-1.5B:最佳小型LLM?
但今天我们不是在讨论这两款超级模型,而是讨论DeepSeek-R1的一个蒸馏版本——DeepSeek-R1-Distill-
Qwen
-1.5B,它可能是今天被低估的版本,虽然只有15亿个参数,但它悄无声息地在一些主要基准上超越了
李孟聊人工智能
·
2025-01-29 13:53
AI
Agents实战
chatgpt
人工智能
gpt
AI
agi
DeepSeek
Qwen
大模型算法到底值不值得入行?
post-training分成两种,一种是以提升通用能力为目的的,比如openai、国内
qwen
专门做这个的团队。这种也不敢评,强就完了。不过某
和老莫一起学AI
·
2025-01-29 12:07
算法
深度学习
机器学习
人工智能
产品经理
学习
转行
通义千问
Qwen
2-VL-2B:技术架构、核心原理、微调操作与场景应用详解
通义千问
Qwen
2-VL-2B:技术架构、核心原理、微调操作与场景应用详解引言近年来,多模态大模型在人工智能领域取得了显著进展,尤其是在视觉语言理解(Vision-LanguageUnderstanding
zhangjiaofa
·
2025-01-29 10:16
大模型
通义千问
大模型
多模态
模型微调
Qwen
-VL论文解读
Qwen
-VL:用于理解、定位、文本阅读等的通用视觉-语言模型摘要在本文中,我们介绍了
Qwen
-VL系列,这是一组大规模的视觉-语言模型(LVLMs),旨在感知和理解文本和图像。
dream_home8407
·
2025-01-29 09:10
人工智能
使用Ollama 在Ubuntu运行deepseek大模型:以deepseek-r1为例
支持的deepseek-r1模型deepseek-r1DeepSeek-R1-Distill-
Qwen
-1.5Bollamarundeepseek-r1:1.5bDeepSeek-R1-Distill-
Qwen
skywalk8163
·
2025-01-29 02:06
人工智能
ubuntu
linux
人工智能
ollama
[论文笔记] llama-factory 微调
qwen
2.5、llama3踩坑
一、bug1、pre-tokenize的时候,会OOM解决:在yaml文件中添加streaming参数#tokenizestreaming:Truemax_steps:10000https://github.com/hiyouga/LLaMA-Factory/blob/3a023bca2a502810a436cfba7708df164754ea62/src/llamafactory/hparams
心心喵
·
2025-01-28 20:14
论文笔记
深度学习
人工智能
llamafactory0.9.0微调
qwen
2vl
LLaMA-Factory/data/README_zh.mdatmain·hiyouga/LLaMA-Factory·GitHubEfficientlyFine-Tune100+LLMsinWebUI(ACL2024)-LLaMA-Factory/data/README_zh.mdatmain·hiyouga/LLaMA-Factoryhttps://github.com/hiyouga/LLa
Kun Li
·
2025-01-28 15:07
多模态大语言模型
lmm
qwen2vl
部署通义千问
Qwen
模型时,遇到Flash-Attention2装不上的问题
参考
Qwen
2-VL最佳实践—swift2.5.0.dev0文档我不去装什么Flash-Attention2,说是要编译好几个小时,然后我这边一直报错。
清米Dummy
·
2025-01-28 00:49
python
开源模型应用落地-
qwen
模型小试-调用
Qwen
2-VL-7B-Instruct-更清晰地看世界-vLLM+Docker(七)
一、前言学习
Qwen
2-VL,为我们打开了一扇通往先进人工智能技术的大门。让我们能够深入了解当今最前沿的视觉语言模型的工作原理和强大能力。
开源技术探险家
·
2025-01-27 20:51
开源模型-实际应用落地
#
深度学习
AI编程
AIGC
Firefly-LLaMA2-Chinese - 开源中文LLaMA2大模型
github:https://github.com/yangjianxin1/Firefly-LLaMA2-Chinese本项目与Firefly一脉相承,专注于低资源增量预训练,既支持对Baichuan2、
Qwen
伊织产研
·
2025-01-27 00:07
Firefly-LLaMA2
LLaMA-2
Qwen
1.5:使用VLLM加速推理模型(包含:OpenAI如何调用)
如何安装和配置VLLM库在开始使用VLLM库之前,首先需要确保安装正确的版本。以下指南将帮助你完成安装和配置。安装VLLM库根据你的需求选择合适的版本进行安装。如果你只需要基本功能,可以安装版本0.3。使用以下命令安装:pipinstallvllm==0.3如果你需要使用GPTQ-int8量化模型,那么应该安装0.4或更高版本:pipinstallvllm>=0.4启动模型服务在安装完毕后,可以通
写bug如流水
·
2025-01-27 00:06
大模型
vllm
Qwen1.5
openAI
深入解析vLLM:加速大模型推理的高效框架
深入解析vLLM:加速大模型推理的高效框架引言在现代深度学习应用中,大型语言模型(如GPT、GLM、LLaMA、
Qwen
等)的推理速度和资源利用率成为关键挑战。
秋声studio
·
2025-01-27 00:34
口语化解析
人工智能
模型调优
nlp
vLLM
大模型项目落地时,该如何估算模型所需GPU算力资源
大模型的规模、参数的理解模型参数单位我们的项目中客户之前测试过
Qwen
1.5-110B的模型,效果还比较满意。(
Qwen
还是国产模型中比较稳定的也是很多项目的首选)模型中
kcarly
·
2025-01-26 03:49
大模型知识乱炖
认识系列
gpu算力
深度学习
自然语言处理
AIGC
马科维茨资产组合模型+金融研报AI长文本智能体(
Qwen
-Long)增强方案(理论+Python实战)
2.5清理工作2.7get_ai_weights函数汇总3.汇总代码4.反思4.1不足之处4.2提升思路5.启后0.承前本篇博文是对前两篇文章,链接:5.马科维茨资产组合模型+政策意图AI金融智能体(
Qwen
-Max
AI量金术师
·
2025-01-25 13:31
金融资产组合模型进化论
人工智能
金融
python
机器学习
算法
大数据
线性回归
Qwen
-VL: 一种多功能的视觉-语言模型,用于理解、定位、文本阅读等
论文题目:
Qwen
-VL:AVersatileVision-LanguageModelforUnderstanding,Localization,TextReading,andBeyond论文地址:https
&永恒的星河&
·
2025-01-25 01:04
LLMs
LVLMs
LLMs
基于Langchain框架,采用
Qwen
2.5大模型,搭建自己的Agent,ReACT效果比RAG好
最近在做RAG,调研后发现ReACT好像更具有说服力,对最终结果的解释也更加合理。举个例子,我扔给大模型这样一个问题:15的平方是多少?另外,法国的首都是哪里?采用ReACT的运行结果如下:>EnteringnewAgentExecutorchain...我需要先计算15的平方,然后搜索法国的首都。Action:平方计算器ActionInput:"15"Observation:15的平方等于225
张登杰踩
·
2025-01-24 18:10
langchain
python
人工智能
语言模型
6. 马科维茨资产组合模型+政策意图AI金融智能体(DeepSeek-V3)增强方案(理论+Python实战)
1.2WhatisDeepSeek2.重写AI金融智能体函数3.汇总代码4.反思4.1不足之处4.2提升思路5.启后0.承前本篇博文是对上一篇文章,链接:5.马科维茨资产组合模型+政策意图AI金融智能体(
Qwen
-Max
AI量金术师
·
2025-01-24 15:16
金融资产组合模型进化论
人工智能
金融
python
机器学习
算法
大数据
数学建模
深入理解旋转位置编码(RoPE)及其在大型语言模型中的应用
apply_rotary_pos_emb函数3、demo_apply_rotary_pos_emb函数三、完整RoPE代码Demo前言随着自然语言处理(NLP)领域的快速发展,预训练的语言模型如BERT、GPT系列、PaLM、
Qwen
tangjunjun-owen
·
2025-01-23 21:00
语言模型-多模态大模型
语言模型
人工智能
自然语言处理
RoPE
旋转位置编码
SGLang安装教程,部署你的大模型,性能比vllm好,实现张量并行,数据并行,加快推理速度,亲测效果好。
目前大模型部署工具主要是vllm,最近出现了SGLang,很多新开源大模型都支持SGLang的部署推理,例如deepseek-R1,
Qwen
2.5,Mistral,GLM-4,MiniCPM3,InternLM2
张登杰踩
·
2025-01-23 17:03
人工智能
结对编程
python
个性化的语言模型构建思路
将开源模型(如Llama3、
Qwen
、Falcon3…等)转变为个人专属的大语言模型,通常涉及知识库的构建、微调(fine-tuning)和模型定制等步骤。
由数入道
·
2025-01-23 11:19
人工智能
语言模型
人工智能
自然语言处理
论文阅读--
Qwen
2&2.5技术报告
Qwen
21引言所有模型都是在超过7trilliontoken(7万亿)的高质量、大规模数据集上预训练的2Tokenizer&Model2.1Tokenizer沿用
Qwen
(Bai等人,2023a)的做法
__如果
·
2025-01-22 17:55
论文阅读
qwen
构建企业私有RAG大模型: (可商用)
Qwen
2.5开源模型vLLM部署及示例
在企业真实场景中,开发接口通常需要针对具体需求进行定制化处理,以更好地适配RAG应用系统的实际需求。相关代码后续会以Git仓库的形式分享。本章将继续探讨开源大模型的部署。在RAG系统的架构中,大模型扮演着至关重要的角色,是整个流程的“最后一环”。知识库的构建、检索,以及知识的排序与整合,都是为了为大模型提供准确、完整的上下文知识。这种知识支撑可以显著降低大模型生成过程中的幻觉问题(如生成不可靠或错
小敢摘葡萄
·
2025-01-22 16:17
开源
人工智能
机器学习
神经网络
智能手机
交互
【LLM】Ollama:本地大模型 WebAPI 调用
部署Ollama:使用以下命令进行部署:dockerrun-d-p11434:11434--nameollama--restartalwaysollama/ollama:latest进入容器并下载
qwen
2.5
T0uken
·
2025-01-20 23:22
python
开发语言
OpenBayes 一周速览|一键部署
Qwen
2.5-Coder,0编程经验实现代码生成自由!
手写阿拉伯文数据集CollectiveActivity集体活动视频数据集MultimodalSpectroscopic化学多模光谱数据集CDFSOD-benchmark跨域小样本对象检测基准数据集3个教程:一键部署
Qwen
2.5
·
2025-01-20 22:17
实战千问2大模型第五天——VLLM 运行
Qwen
2-VL-7B(多模态)
一、简介VLLM是一种高效的深度学习推理库,通过PagedAttention算法有效管理大语言模型的注意力内存,其特点包括24倍的吞吐提升和3.5倍的TGI性能,无需修改模型结构,专门设计用于加速大规模语言模型(LLM)的推理过程。它通过优化显存管理、支持大模型的批处理推理以及减少不必要的内存占用,来提高多GPU环境下的推理速度和效率。VLLM的核心特点包括:显存高效性:VLLM能够动态管理显存,
学术菜鸟小晨
·
2025-01-20 02:50
千问
多模型
qwen2
vl
第二课堂笔记——大语言模型
part1——
qwen
在这一部分中需要完成初步运行通义千问,流式输出与在网页窗口进行对话。1.环境准备首先配置满足需求的环境。配置环境代码中:!
skna_
·
2025-01-19 06:26
笔记
语言模型
人工智能
大模型-
Qwen
2.5 技术报告解读
Abstract主要是在介绍通义千问2.5(
Qwen
2.5)这一大型语言模型系列,涵盖了它在不同训练阶段的改进、多样化配置、可获取途径以及在各项性能评测中的出色表现等多个方面,旨在展示其先进性与实用性。
数据分析能量站
·
2025-01-19 06:55
机器学习
人工智能
Python调用通义千问
qwen
2.5模型步骤
Qwen
2.5模型简介1.1模型概述
Qwen
2.5是阿里云推出的一款超大规模语言模型,它基于阿里巴巴达摩院在自然语言处理领域的研究和积累。
我就是全世界
·
2025-01-19 05:15
python
人工智能
从零开始:在服务器上部署大模型并集成到 vscode +Cline使用
在本文中,我将引导你一步一步地在阿里云服务器上部署
Qwen
大模型,并将其集成到Cline插件中。我们将从零开始,详细介绍每个步骤,确保即使是初学者也能轻松上手。
一个正经的AI
·
2025-01-19 00:35
服务器
vscode
运维
AI编程
Jetson显卡上运行
Qwen
2-1.5b模型时报错“RuntimeError triu_tril_cuda_template not implemented for ‘BFloat16‘”
Jetson显卡上运行
Qwen
2-1.5b模型时报错“RuntimeErrortriu_tril_cuda_templatenotimplementedfor‘BFloat16’”问题描述:CUDA_DEVICE
wang151038606
·
2025-01-19 00:31
python中bug
人工智能
pytorch
人工智能
python
【大模型LoRa微调】
Qwen
2.5 Coder 指令微调【代码已开源】
本文需要用到的代码已经放在GitHub的仓库啦,别忘了给仓库点个小心心~~~https://github.com/LFF8888/FF-Studio-Resources第001个文件哦~一、引言:大语言模型与指令微调1.1大语言模型发展简史随着深度学习的飞速发展,特别是Transformer架构在自然语言处理(NLP)领域的成功,大语言模型(LLM,LargeLanguageModel)成为近年来
FF-Studio
·
2025-01-18 07:31
大语言模型
开源
阿里云通义开源首个推理步骤评估标准,探索AI推理模型新路径
1月16日,阿里云通义开源全新的数学推理过程奖励模型
Qwen
2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型;在识别推理错误步骤能力上,
Qwen
2.5-Math-PRM以
·
2025-01-17 01:49
量子位
Qwen
-VL环境搭建&推理测试
引子这几天阿里的
Qwen
2.5大模型在大模型圈引起了轰动,号称地表最强中文大模型。
要养家的程序猿
·
2025-01-16 19:57
AI算法
python
计算机视觉
ai
VLM 系列——
Qwen
2 VL——论文解读——前瞻(源码解读)
一、概述1、是什么是一系列多模态大型语言模型(MLLM),其中包括2B、7B、72B三个版本,整体采用视觉编码器+LLM形式(可以认为没有任何投射层)。比较创新的是图像缩放方式+3DLLM位置编码+(预估后面的训练方式也不太一样)。能够处理包括文本、图像在内的多种数据类型,具备图片描述、单图文问答、多图问对话、视频理解对话、json格式、多语言、agent、高清图理解(代码编写和debug论文暂时
TigerZ*
·
2025-01-16 18:48
AIGC算法
AIGC
人工智能
transformer
计算机视觉
图像处理
探索
Qwen
-VL:一个全栈式的视觉语言模型开发框架
探索
Qwen
-VL:一个全栈式的视觉语言模型开发框架
Qwen
-VLTheofficialrepoofQwen-VL(通义千问-VL)chat&pretrainedlargevisionlanguagemodelproposedbyAlibabaCloud
钟洁祺
·
2025-01-16 17:03
多模态大模型微调
Qwen
-VL微调及日志
%pipinstallmodelscope-U%pipinstalltransformersacceleratetiktoken-U%pipinstalleinopstransformers_stream_generator-U%pipinstallpillow-U%pipinstalltorchvision%pipinstallmatplotlib-Ufrommodelscopeimport(s
Messi^
·
2024-09-14 15:10
人工智能-大模型应用
python
人工智能
深度学习
开源模型应用落地-
qwen
2-7b-instruct-LoRA微调-unsloth(让微调起飞)-单机单卡-V100(十七)
一、前言本篇文章将在v100单卡服务器上,使用unsloth去高效微调
QWen
2系列模型,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。
开源技术探险家
·
2024-09-14 13:28
开源模型-实际应用落地
#
深度学习
语言模型
自然语言处理
vllm在线推理踩坑记
最近在《AI大模型全栈工程师》课程里看老师推荐使用vllm部署大模型,优点就不详细介绍了,这里摘抄一段来自于
Qwen
2上手指南对于它的简单介绍:它易于使用,且具有最先进的服务吞吐量、高效的注意力键值内存管理
懂点投资的码农
·
2024-09-14 12:14
大语言模型
ai
语言模型
python
【
Qwen
2部署实战】
Qwen
2初体验:用Transformers打造智能聊天机器人
系列篇章No.文章1【
Qwen
部署实战】探索
Qwen
-7B-Chat:阿里云大型语言模型的对话实践2【
Qwen
2部署实战】
Qwen
2初体验:用Transformers打造智能聊天机器人3【
Qwen
2部署实战
寻道AI小兵
·
2024-09-12 06:09
AI大模型Qwen系列探索实践
人工智能
AIGC
语言模型
AI编程
Qwen
LangChain入门:使用Python和通义千问打造免费的
Qwen
大模型聊天机器人
前言LangChain是一个用于开发由大型语言模型(LargeLanguageModels,简称LLMs)驱动的应用程序的框架。它提供了一个灵活的框架,使得开发者可以构建具有上下文感知能力和推理能力的应用程序,这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库:Python和JavaScript库。包含了各种组件的接口和集成,一个基本的运行时,用于将这些组件组合
海哥python
·
2024-09-12 06:02
AI
langchain
python
机器人
详述Python环境下配置AI大模型
Qwen
-72B的步骤
随着人工智能技术的发展,大规模预训练模型如
Qwen
-72B等逐渐成为研究和应用的重点。本篇博客旨在提供一份详细的指南,帮助Python开发者们在自己的环境中顺利配置并使用
Qwen
-72B大模型。
Play_Sai
·
2024-09-12 05:57
#
Python开发
python
AI大模型
人工智能
LLM系列(4):通义千问7B在Swift/DeepSpeed上微调秘诀与实战陷阱避坑指南
LLM系列(4):通义千问7B在Swift/DeepSpeed上微调秘诀与实战陷阱避坑指南阿里云于2023年8月3日开源通义千问70亿参数模型,包括通用模型
Qwen
-7B以及对话模型
Qwen
-7B-Chat
汀、人工智能
·
2024-09-12 00:21
LLM工业级落地实践
人工智能
自然语言处理
prompt
Swifi
DeepSpeed
通义千问
Qwen
LLAMA Factory: 简洁高效的大语言模型训练平台
LLAMAFactory:简洁高效的大语言模型训练平台LLaMA-Factory易于使用的LLM微调框架(LLaMA,BLOOM,Mistral,百川,
Qwen
,ChatGLM)。
俞纬鉴Joshua
·
2024-09-11 08:57
上一页
1
2
3
4
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他