E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
qwen
conda 清除 tarballs 减少磁盘占用 、 conda rename 重命名环境、conda create -n
qwen
--clone 当前环境
版权:本文由【墨理学AI】原创首发、各位读者大大、敬请查阅、感谢三连声明:作为全网AI领域干货最多的博主之一,❤️不负光阴不负卿❤️文章目录condaclean--tarballscondarename重命名环境condacreate-nqwen--clone某个环境condaremove删除环境建立huggingface模型下载路径的软链接❤️欢迎和墨理一起学AIcondaclean--tarb
墨理学AI
·
2025-03-31 07:50
环境搭建
一文读懂
conda
conda环境管理
LiblibAI 接入阿里通义大模型,推出 10 秒 AI 视频生成功能
此外,LiblibAI基于
qwen
-turbo打造了提示词
自不量力的A同学
·
2025-03-31 07:49
人工智能
手动调参 vs 自动化:大语言模型微调的终极对决!
然而,在实际操作中,许多团队如
Qwen
选择采用手动调参而非自动化调参工具,这一决策背后蕴含着多方面的考量。一、模型复杂性与计算资源限制大语言模型的复杂性不容小觑,其参数量往往达到数十亿甚至上百亿。
从零开始学习人工智能
·
2025-03-31 06:44
自动化
语言模型
人工智能
Qwen
2.5-Omni 多模态旗舰模型深度解析:性能、部署与个人玩家上手指南
目录1.
Qwen
2.5-Omni核心技术创新(1)统一的多模态架构(2)超长上下文支持(1MTokens)(3)高效推理优化2.与主流竞品全方位对比性能Benchmark对比(MMLU、VQA等任务)3
张3蜂
·
2025-03-30 23:54
#
神经网络
开源
#
设计模式
人工智能
语言模型
开源协议
【大模型开发】将vocab解码
举个例子:词汇你好;在
Qwen
的词汇表中使用一个token表示的,按理来说,我们可以直接在vocab.json文件中直接表示为"你好":108
SUNX-T
·
2025-03-30 21:14
大模型
python
语言模型
高性能部署实战:vLLM 安装配置 × tokens/s 提升 × 并发测试(适配国产模型)
高性能部署实战:vLLM安装配置×tokens/s提升×并发测试(适配国产模型)本文目标:带你完整掌握如何使用vLLM高性能推理引擎部署国产大模型(如
Qwen
/DeepSeek),包括环境准备、部署流程
AI筑梦师
·
2025-03-30 21:44
人工智能
深度学习
【大模型篇】阿里云
Qwen
2.5-Max:超大规模 MoE 模型架构和性能评估
一、引言
Qwen
2.5-Max是阿里云通义千问团队研发的超大规模Mixture-of-Expert(MoE)模型,旨在通过超大规模的数据和模型规模扩展来提升模型的智能水平。
大F的智能小课
·
2025-03-30 03:05
大模型理论和实战
阿里云
云计算
Ollama入门指南:部署与实战最新模型(DeepSeek-V3、
Qwen
2.5、Llama3)
一、Ollama核心优势与适用场景Ollama通过简化模型部署流程,支持开发者快速调用DeepSeek-V3(开源MoE模型)、
Qwen
2.5-Max(阿里编程旗舰模型)、Llama3(Meta基础模型
AndrewHZ
·
2025-03-30 02:32
深度学习新浪潮
算法
深度学习
语言模型
LLM
ollama
神经网络
模型部署
【大模型】视觉语言模型:
Qwen
2.5-VL的使用
官方github地址:https://github.com/QwenLM/
Qwen
2.5-VL目录
Qwen
家族的最新成员:
Qwen
2.5-VL主要增强功能模型架构更新快速开始使用Transformers
Jackilina_Stone
·
2025-03-29 12:59
#
大模型
语言模型
人工智能
Qwen2.5-VL
python
阿里全模态模型
Qwen
2.5-Omni现已开源,其7B尺寸的版本实现了全球顶尖的性能表现
今日,通义千问
Qwen
2.5-Omni-7B正式开源,作为通义系列首个端到端全模态大模型,它能够同时处理文本、图像、音频、视频等多类型输入,并实时生成文本与自然语音合成输出。
万才博客
·
2025-03-29 10:17
ai
AI编程
【拥抱AI】对比embedding模型gte-
Qwen
2-7B-instruct和bge-m3:latest(三)
为了更全面地评估gte-
Qwen
2-7B-instruct和bge-m3:latest的性能,我们可以从以下几个方面进行详细比较:1.模型架构和规模gte-
Qwen
2-7B-instruct架构:基于Transformer
奔跑草-
·
2025-03-28 14:22
人工智能
人工智能
embedding
Qwen
2-Audio
Qwen
2.5-VL
Qwen
2.5_Omni傻傻分不清
引言:
Qwen
系列多模态大模型阿里巴巴
Qwen
团队在这一领域持续深耕,推出了一系列备受瞩目的多模态大模型。
kakaZhui
·
2025-03-27 18:56
前沿多模态大模型:论文与实战
人工智能
AIGC
chatgpt
语音识别
qwen
_vl_utils代码分析
函数列表:序号函数名简要说明1round_by_factor(number:int,factor:int)->int返回最接近number,且能被factor整除的整数。2ceil_by_factor(number:int,factor:int)->int返回大于等于number,且能被factor整除的最小整数。3floor_by_factor(number:int,factor:int)->i
fydw_715
·
2025-03-27 13:43
qwen
计算机视觉
人工智能
Docker vLLM 快速部署
Qwen
2.5
Dockerfile:FROMkevinchina/deeplearning:llamafactory20241027#设置工作目录WORKDIR/app#暴露端口EXPOSE8000EXPOSE7860#使用JSON格式的ENTRYPOINT,指定要执行的命令#ENTRYPOINT["llamafactory-cli","api","--model_name_or_path","/data/xi
XD742971636
·
2025-03-25 18:23
深度学习机器学习
深度学习
AI
LLM
llama
Langchain+Ollama实现
Qwen
模型+客服问答私有数据FAQ-实现RAG
本文使用Ollama直接运行本地
Qwen
模型,需要先安装好ollama。
showker
·
2025-03-25 18:21
python
开发语言
OpenManus 架构的详细技术实现
一、OpenManus架构的详细技术实现1.核心分层架构的深度解析底层:LLM层模型选择与适配:OpenManus允许用户替换底层LLM(如mPLUG-Owl3、
Qwen
、Llama等),通过统一接口调用模型
大势下的牛马
·
2025-03-22 22:12
搭建本地gpt
架构
OpenManus
Manus
Agent
01年实习生被曝负责字节RL核心算法!系字节LLM攻坚小组成员
用上该算法后,
Qwen
2.5-32B模型只经过RL训练,不引入蒸馏等其他技术,在AIME2024基准上拿下50分,优于相同setting下使用GRPO算法的DeepSeek-R1-Zero-
Qwen
,且
·
2025-03-22 22:24
量子位
DeepSeek 部署指南 (使用 vLLM 本地部署)
我们以deepseek-ai/DeepSeek-R1-Distill-
Qwen
-7B模型为例进行演示。1、安装Python环境首先,您需要安装Python环境。
AGI大模型资料分享员
·
2025-03-22 19:51
人工智能
语言模型
学习
chatgpt
深度学习
大模型
deepseek
llama-factory 微调
Qwen
2.5-3B-Instruct
0、资源链接官方readme:https://github.com/hiyouga/LLaMA-Factory/blob/v0.9.1/README_zh.md官方文档:https://llamafactory.readthedocs.io/zh-cn/latest/官方推荐的知乎教程:https://zhuanlan.zhihu.com/p/6952876071、安装LLaMAFactorygi
coco_1998_2
·
2025-03-22 14:16
llama
factory
fine
tune
Qwen
2-Audio:通义千问音频大模型技术解读
阿里巴巴通义千问团队,推出了
Qwen
-Audio系列模型,这里我们一起看下最新版本
Qwen
2-Audio。
Qwen
2-Audio不仅能够理解各种音频信号,还能根据语音指令做出文本回应,甚至可以进
kakaZhui
·
2025-03-21 01:41
音视频
AIGC
人工智能
python
chatgpt
开源模型应用落地-
qwen
模型小试-调用
Qwen
2-7B-Instruct-进阶篇(十二)
一、前言经过前五篇“
qwen
模型小试”文章的学习,我们已经熟练掌握
qwen
大模型的使用。然而,就在前几天阿里云又发布了
Qwen
2版本。
开源技术探险家
·
2025-03-20 19:23
开源模型-实际应用落地
#
深度学习
自然语言处理
语言模型
LangChain入门:使用Python和通义千问打造免费的
Qwen
大模型聊天机器人
前言LangChain是一个用于开发由大型语言模型(LargeLanguageModels,简称LLMs)驱动的应用程序的框架。它提供了一个灵活的框架,使得开发者可以构建具有上下文感知能力和推理能力的应用程序,这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库:Python和JavaScript库。包含了各种组件的接口和集成,一个基本的运行时,用于将这些组件组合
南七小僧
·
2025-03-20 18:44
人工智能
网站开发
AI技术产品经理
服务器
数据库
windows
有了大模型为何还需要Agent智能体
Agent(智能体)是一种能感知环境、自主决策、执行动作的智能实体,当它与大语言模型(如通义千问
QWen
、GPT)结合时,形成一种**“增强型AI系统”**。
全栈你个大西瓜
·
2025-03-20 09:59
人工智能
人工智能
AI
Agent
Agent
智能体
Agent
原理
agent实现:通过prompt方式实现agent自定义使用
参看:https://github.com/TommyZihao/openvino_tonypihttps://github.com/QwenLM/
Qwen
/blob/main/examples/react_prompt.md
loong_XL
·
2025-03-20 05:27
深度学习
大模型AI
prompt
agent
打磨下
大模型
vllm部署说明和注意事项
DeepSeek-R1-Distill-
Qwen
-32B可去modelscope下载:整体大小约为60GB部署DeepSeek-R1-Distill-
Qwen
-32B模型,
ai一小生
·
2025-03-17 14:59
python
人工智能
持续部署
通过docker-compose部署
qwen
2-vl-7b模型
docker-compose部署
qwen
2-vl-7b模型准备工作docker-compose.yml遇到的报错在ONE-API设置测试脚本准备工作1、安装较新版本的docker-compose2、安装
scutshijie
·
2025-03-17 14:28
docker
容器
运维
语言模型
开源模型应用落地-
Qwen
2-VL-7B-Instruct-vLLM-OpenAI API Client调用
一、前言学习
Qwen
2-VL,为我们打开了一扇通往先进人工智能技术的大门。让我们能够深入了解当今最前沿的视觉语言模型的工作原理和强大能力。
开源技术探险家
·
2025-03-17 13:52
开源大语言模型-新手试炼
深度学习
AI编程
AIGC
本地部署大模型QPS推理测试
2.2、50字左右问题2.3、100字左右问题3、测试代码3.1、通用测试代码3.2、通用测试代码(仅供参考)4、测试结果4.1、通用测试结果4.2、RAG测试结果1、测试环境1.1、显卡1.2、模型
Qwen
2.5
内卷焦虑人士
·
2025-03-17 03:30
QPS
本地部署
大模型测试
RAG
主流开源大模型能力对比矩阵
模型名称核心优势主要局限Llama2/3✅多语言生态完善✅Rotary位置编码✅GQA推理加速⚠️数据时效性差⚠️隐私保护不足
Qwen
✅千亿参数规模✅中文语境优化✅复杂文本生成⚠️需高性能硬件⚠️领域知识需二次训练
时光旅人01号
·
2025-03-16 12:09
人工智能
开源
python
深度学习
pytorch
大模型火爆 2025:LLaMA、
Qwen
、DeepSeek 核心原理+就业秘籍,快速入门 AI 工程师
1.大模型核心原理:从零开始理解AI模型这些是大型语言模型(LLMs)的核心技术,适合初学者逐步深入学习。以下是详细拆解,让小白也能掌握:LLaMA系列模型核心原理详解:什么是LLaMA?:LLaMA是一个基于人工智能的语言模型,像一个超级聪明的聊天机器人,能理解和生成人类语言。它由Meta公司开发,类似ChatGPT,但更开源、灵活。核心原理:Transformer架构:想象一个工厂流水线,LL
weixin_40941102
·
2025-03-16 03:38
llama
人工智能
【奇点时刻】通义千问开源QwQ-32B技术洞察报告(扫盲帖)
以下报告将基于今天各大社区对
Qwen
/QwQ-32B(下文简称「QwQ-32B」)模型的讨论、测评与实测体验进行综合性分析与洞察。
碣石潇湘无限路
·
2025-03-16 03:37
开源
人工智能
llamaindex实现企业级RAG应用(一)
在上一篇文章中使用
Qwen
2进行RAG代码实践,手动实现了一版简易的RAG应用,在实际工作中通常都用会使用langchain或llamaindex架构来搭建rag应用,并且会非常复杂。
弈秋001
·
2025-03-15 15:15
transformer
自然语言处理
深度学习
人工智能
qwen
2.5的技术。
RMSNorm(RootMeanSquareNormalization,均方根归一化)是一种用于深度学习的归一化技术,是LayerNorm(层归一化)的一种改进。它通过计算输入数据的均方根(RootMeanSquare,RMS)来进行归一化,避免了传统归一化方法中均值和方差的计算1.LayerNorm(层归一化)LayerNorm(层归一化)是一种用于深度学习的归一化技术,主要用于稳定训练过程、加
KangkangLoveNLP
·
2025-03-14 13:29
qwen2.5
深度学习
人工智能
transformer
pytorch
自然语言处理
python
神经网络
【大模型技术】基于 通义千问(
Qwen
)实现对话系统
使用
Qwen
提供的API生成自然语言回复。核心功能:多轮对话:用户可以连续提问,系统根据上下文生成连贯的回答。上下文管理:通过维护对话历史,确保模型理解用户的意图。
大数据追光猿
·
2025-03-14 08:48
大模型
python
人工智能
学习方法
语言模型
QwQ-32B企业级本地部署:结合XInference与Open-WebUI使用
QwQ-32B是阿里巴巴
Qwen
团队推出的一款推理模型,拥有320亿参数,基于Transformer架构,采用大规模强化学习方法训练而成。
大势下的牛马
·
2025-03-14 00:56
搭建本地gpt
RAG
知识库
人工智能
QwQ-32B
离线服务器ollama新增
qwen
2:0.5b模型
离线服务器ollama新增
qwen
2:0.5b模型Dify集成ollama前面已经介绍过离线服务器CentOS使用的docker安装的ollama,其中在ollama中已经安装了deepseek-r1:
slient_love
·
2025-03-13 20:30
AI
软件开发
服务器
运维
人工智能
docker
基于SWIFT和
Qwen
1.5-0.5B-Chat进行大模型全参微调(魔搭社区)
1,swift框架安装pipinstallms-swift2,模型下载gitclonehttps://www.modelscope.cn/
qwen
/
Qwen
1.5-0.5B-Chat.git二、数据集准备使用
m0_65156252
·
2025-03-13 18:47
大模型学习笔记
python
开发语言
从Swish到SwiGLU:激活函数的进化与革命,
qwen
2.5应用的激活函数
swiGLU和RMSNorm1.什么是swiGLUSwiGLU(Swish-GatedLinearUnit)是一种结合了Swish激活函数和GLU(GatedLinearUnit)门控机制的激活函数,广泛应用于现代大型语言模型中1.什么是Swish激活函数1.1Swish激活函数Swish激活函数是一种平滑的、非单调的激活函数,由GoogleBrain团队在2017年提出。它结合了ReLU的非线性
KangkangLoveNLP
·
2025-03-13 09:02
qwen2.5
人工智能
算法
神经网络
机器学习
深度学习
cnn
自然语言处理
开源模型应用落地-
qwen
模型小试-
Qwen
-Agent(十一)
一、前言
Qwen
-Agent是一个利用开源语言模型
Qwen
的工具使用、规划和记忆功能的框架。其模块化设计允许开发人员创建具有特定功能的定制代理,为各种应用程序提供了坚实的基础。
开源技术探险家
·
2025-03-12 22:47
开源模型-实际应用落地
#
深度学习
自然语言处理
语言模型
如果,你想找 AI大模型相关的工作,这三个建议你一定要看!
由难到简单,依次是:大模型算法(⭐⭐⭐⭐⭐)模型部署加速(⭐⭐⭐⭐)RAG等相关技术(⭐⭐⭐)纯应用(⭐⭐)Prompt工程师等其他自媒体(⭐)会简单应用就行02这结果方向,B站找几个视频看看,这里推荐用
Qwen
7B
我爱学大模型
·
2025-03-11 14:45
人工智能
chatgpt
AI大模型
AI
大模型入门
转行
程序员
多模态模型在做选择题时,如何设置Prompt,如何精准定位我们需要的选项
我们这里以
Qwen
2-VL-7B-instruct为例:假设我们需要分析一张图片的情绪(从现有的情绪中进行选择),并且我们需要它以思维链的形式展现出来,我们可以这样设置prompt:emotion6_CoT
暗巷提灯
·
2025-03-11 03:10
prompt
vllm多卡部署
Qwen
2.5-72B-Instruct-GPTQ-Int4
双卡v10032G部署结果如下,推理时长16s3卡,tensor_parallel_size=3,tensor并行的数量一定要能被attentionheads整除4卡,tensor_parallel_size=4,推理速度4s
Yanc_L
·
2025-03-10 20:54
人工智能
用双色球数据集微调后的大模型
最近用
Qwen
/
Qwen
1.5-1.8B-Chat大模型来微调训练双色球2003001-2025011的数据集,实验测一下大模型出球的预测情况。
qq_29790801
·
2025-03-10 17:33
人工智能
NLP
【大模型】DeepSeek-R1-Distill-
Qwen
部署及API调用
DeepSeek-R1-Distill-
Qwen
是由中国人工智能公司深度求索(DeepSeek)开发的轻量化大语言模型,基于阿里巴巴的
Qwen
系列模型通过知识蒸馏技术优化而来。
油泼辣子多加
·
2025-03-10 17:29
大模型实战
算法
gpt
langchain
人工智能
Spark-TTS:基于大模型的文本语音合成工具
一、介绍SparkTTS完全基于
Qwen
2.5构建,无需额外的生成模型,它不依赖于单独的模型来生成声学特征,而是直接从LLM预测的代码中重建音频。这种方
CITY_OF_MO_GY
·
2025-03-10 13:35
魅力语音
语音识别
深度学习
人工智能
开源模型应用落地-
Qwen
2.5-7B-Instruct与vllm实现推理加速的正确姿势-Docker-OpenResty(三)
一、前言目前,大语言模型已升级至
Qwen
2.5版本。无论是语言模型还是多模态模型,均在大规模多语言和多模态数据上进行预训练,并通过高质量数据进行后期微调以贴近人类偏好。
开源技术探险家
·
2025-03-10 06:43
开源模型-实际应用落地
#
深度学习
自然语言处理
语言模型
大模型与图数据库RAG通俗流程拆解
图构建(略)neo4j、tugraph等均可,不影响GraphRAG核心框架模型向量化模型bce-embedding-base_v1重排序模型bce-reranker-base_v1大语言模型
Qwen
/
gallonyin
·
2025-03-10 02:15
产品笔记
AI
知识图谱
DeepSeek-R1的
Qwen
和Llama区别
好的,我现在需要回答用户关于DeepSeek-R1-Distill-
Qwen
-32B、DeepSeek-R1-Distill-Llama-70BPro和DeepSeek-R1-Distill-
Qwen
-
百态老人
·
2025-03-10 01:08
llama
人工智能
[论文笔记] LLaMA3.1与
Qwen
2与Apple 技术报告中预训练方案对比
https://arxiv.org/pdf/2407.21075https://arxiv.org/pdf/2407.10671https://arxiv.org/pdf/2407.21783LLaMA3.1LLaMA3.1技术报告:https://ai.meta.com/blog/meta-llama-3-1/
心心喵
·
2025-03-10 01:02
论文笔记
论文阅读
深度学习
人工智能
Qwen
微调-环境配置-week9
在这里插入图片描述](https://img-blog.csdnimg.cn/direct/213a0fb70a2e430684155bbd06a7ff36.png#pic_center)
Qwen
1.5
breeze281
·
2025-03-08 23:01
python
人工智能
机器学习
上一页
1
2
3
4
5
6
7
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他