E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Qwen
如何配置在vscode的Cline插件中调用Ollama本地部署的DeepSeek R1/V3、千问2.5等大模型
Qwen
系列:如
Qwen
2、
Qwen
2.5,由阿里巴巴开发,在中文环境下表现优异。Llama系列:如Llama3、Llama2,具备强大的语言理解和
代码简单说
·
2025-04-06 18:20
2025开发必备
vscode
ide
编辑器
vscode
cline
vscode
ollama
vscode调用本地大模型
vscode调deepseek
04-参数量差20倍!QwQ 32B性能竟超越DeepSeek 671B?性能对比实测
1.QwQ介绍QwQ是
Qwen
系列的推理模型。与传统的指令调优模型相比,具备思考和推理能力的QwQ在下游任务中,尤其是在处理难题时,能够显著提高性能。QwQ-32B是一个中等规模的推
anda0109
·
2025-04-06 07:09
AI应用探索
ai
人工智能
语言模型
文章目录(会持续更新)建议收藏
一、AI1.本地部署AIOllama:教程:暂无(看情况出)LMStudio:教程:LMStudio本地部署Deepseek-R1+
Qwen
2教程-CSDN博客评测(对比):文章直链:Ollama还是LMStudio
Johnny-一个爱研究AI的学生
·
2025-04-05 18:43
目录
人工智能
RAG 系统构建闭环实战:数据清洗 × 嵌入策略 × 更新机制 × 多语言 × 权限控制
你可能已经成功部署了一个RAG系统:✅文档上传→向量化→大模型问答✅页面漂亮,支持ChatUI/API接入✅使用国产模型(
Qwen
/DeepSeek等)+私有部署但现实往往是:上传一次文档之后,内容就很久没人更新每次新增资料都要手动处理
AI筑梦师
·
2025-04-05 12:36
人工智能
大模型
RAG
本地部署
Qwen
2大模型之五:vLLM与大语言模型的关系
本地部署
Qwen
2大模型之一:Ollama方式部署第一篇记录了通过Ollama方式在本地部署
Qwen
2大模型的过程,操作很顺利,看到大模型反应的那一刻很是激动,大大增强了我继续探索的信心。
康顺哥
·
2025-04-05 02:57
#
AI大模型
ai
AI编程
人工智能
机器学习
llama
语言模型
基于Transformer框架实现微调后
Qwen
/DeepSeek模型的非流式批量推理
在基于LLamaFactory微调完具备思维链的DeepSeek模型之后(详见《深入探究LLamaFactory推理DeepSeek蒸馏模型时无法展示<think>思考过程的问题》),接下来就需要针对微调好的模型或者是原始模型(注意需要有一个本地的模型文件,全量微调就是saves下面的文件夹,如果是LoRA,还需要进行一步导出模型的操作),实现快速高效的模型推理。本文将详细分享如何基于Transf
羊城迷鹿
·
2025-04-05 02:27
transformer
Deepseek
大模型推理
微调
如何在本地部署魔搭上千问
Qwen
2.5-VL-32B-Instruct-AWQ模型在显卡1上面运行推理,并开启api服务
环境:云服务器UbuntuNVIDIAH2096GBQwen2.5-VL-32BQwen2.5-VL-72B问题描述:如何在本地部署魔搭上千问
Qwen
2.5-VL-32B-Instruct-AWQ模型在显卡
玩人工智能的辣条哥
·
2025-04-04 19:15
实操经验专题
Qwen2.5VL32B
推理
模型部署
AI大模型
通义千问
用LLama factory时报类似Process 2504721 got signal: 1的解决方法
之前用nohup来远程跑LLamafactory微调脚本,是没有问题的,但今天发现运行类似下面这个命令时,nohupllamafactory-clitrainexamples/train_qlora/
qwen
_lora.yaml
蛐蛐蛐
·
2025-04-04 04:28
llama
人工智能
大模型
在 Jetson 上部署
Qwen
2.5:国产轻量大模型的边缘推理全流程实战
在Jetson上部署
Qwen
2.5:国产轻量大模型的边缘推理全流程第1章:为什么要在Jetson上部署国产大模型?
AI筑梦师
·
2025-04-03 21:44
人工智能
国产大模型
部署
RWKV-7 2.9B 模型正式发布,SOTA 架构,带来 SOTA 使用体验
英文和多语言测评RWKV-7-2.9B模型的英文和多语言能力,均显著超越所有同尺寸模型,包括Llama3.23B、
Qwen
2
RWKV元始智能
·
2025-04-03 07:15
人工智能
自然语言处理
语言模型
RWKV
【Python】基于
qwen
_agent 构建 AI 绘画智能助手
基于
qwen
_agent构建AI绘画智能助手前言近年来,大模型技术迅猛发展,AI绘画也成为了热门应用之一。
林九生
·
2025-04-03 02:44
Python
人工智能
人工智能
python
开发语言
Qwen
-2.5、DeepSeek-R1、DeepSeek-V3 核心区别
1.定位与核心能力
Qwen
-2.5(阿里云):通用型大语言模型,擅长多模态处理(文本、图像、音频等)和超长上下文支持(最高支持100万token)。
瞬间动力
·
2025-04-02 18:45
人工智能
大数据
语言模型
AI编程
java
学习计划暂停更新,一些有意思的分享
微调参考:从简单的自我认知修改开始学习,在微调库中基本都有identity.json,直接修改{(name)}数据用于微调即可
Qwen
模型还不错,1.5B很适合入门学习。
笙枫
·
2025-04-02 11:36
学习
BERT与Transformer到底选哪个-上部
就像「包子」和「面食」的关系——BERT是「Transformer家族」的「明星成员」,而GPT、
Qwen
、DeepSeek这些大模型则是「Transformer家族」的「超级后辈」。
TGITCIC
·
2025-04-02 11:33
AI-大模型的落地之道
bert
transformer
人工智能
gpt
大模型
aigc
2025-04-01 AGI大模型学习路线,非常详细收藏我这一篇就够了
大模型学习路线建议先从主流的Llama开始,然后选用中文的
Qwen
/Baichuan/ChatGLM,先快速上手体验prompt工程,然后再学习其架构,跑微调脚本如果要深入学习,建议再按以下步骤,从更基础的
大模型入门学习
·
2025-04-01 18:25
agi
学习
人工智能
程序员
大模型教程
AI
大模型
大模型:国内主要大模型的对比及其特点总结
千亿参数,多任务统一学习框架特点:多模态能力突出(文本、图像、视频生成)中文理解强,支持古文、成语等复杂语义企业级工具链完善(ERNIESDK)应用场景:营销文案、设计辅助、企业知识库2.阿里云·通义千问(
Qwen
meisongqing
·
2025-04-01 13:18
人工智能
大模型
阿里这次放大招了:
Qwen
2.5-Omni-7B 是开源多模态的天花板?
解构通义全模态引擎:
Qwen
2.5-Omni-7B架构、机制与实测阿里巴巴在2025年3月正式发布并开源了通义千问系列的又一力作——
Qwen
2.5-Omni-7B,这是全球首个实现真实多模态统一建模、流式对话响应的
AI筑梦师
·
2025-04-01 12:43
人工智能学习框架
架构
人工智能
深度学习
agi
AIGC
阿里最新开源全模态大模型——
Qwen
2.5-Omni-7B,7B就能搞定“看听说写”,AI越来越像人了
3月27日凌晨,阿里通义千问团队发布
Qwen
模型家族中新一代端到端全模态大模型
Qwen
2.5-Omni,标志着AI“类人化”再进一步。
算家计算
·
2025-04-01 12:11
话题文章
算家云
算力租赁
Qwen2.5-Omni
通义千问
全模态大模型
开源大模型
ollama运行
qwen
2.5-coder:7b
1.linux安装curl-fsSLhttps://ollama.com/install.sh|shollamaserve#启动ollamaollamacreate#从模型文件创建模型ollamashow#显示模型信息ollamarun#运行模型,会先自动下载模型ollamapull#从注册仓库中拉取模型ollamapush#将模型推送到注册仓库ollamalist#列出已下载模型ollamaps
苍墨穹天
·
2025-04-01 12:41
大模型
人工智能
ollama
conda 清除 tarballs 减少磁盘占用 、 conda rename 重命名环境、conda create -n
qwen
--clone 当前环境
版权:本文由【墨理学AI】原创首发、各位读者大大、敬请查阅、感谢三连声明:作为全网AI领域干货最多的博主之一,❤️不负光阴不负卿❤️文章目录condaclean--tarballscondarename重命名环境condacreate-nqwen--clone某个环境condaremove删除环境建立huggingface模型下载路径的软链接❤️欢迎和墨理一起学AIcondaclean--tarb
墨理学AI
·
2025-03-31 07:50
环境搭建
一文读懂
conda
conda环境管理
LiblibAI 接入阿里通义大模型,推出 10 秒 AI 视频生成功能
此外,LiblibAI基于
qwen
-turbo打造了提示词
自不量力的A同学
·
2025-03-31 07:49
人工智能
手动调参 vs 自动化:大语言模型微调的终极对决!
然而,在实际操作中,许多团队如
Qwen
选择采用手动调参而非自动化调参工具,这一决策背后蕴含着多方面的考量。一、模型复杂性与计算资源限制大语言模型的复杂性不容小觑,其参数量往往达到数十亿甚至上百亿。
从零开始学习人工智能
·
2025-03-31 06:44
自动化
语言模型
人工智能
Qwen
2.5-Omni 多模态旗舰模型深度解析:性能、部署与个人玩家上手指南
目录1.
Qwen
2.5-Omni核心技术创新(1)统一的多模态架构(2)超长上下文支持(1MTokens)(3)高效推理优化2.与主流竞品全方位对比性能Benchmark对比(MMLU、VQA等任务)3
张3蜂
·
2025-03-30 23:54
#
神经网络
开源
#
设计模式
人工智能
语言模型
开源协议
【大模型开发】将vocab解码
举个例子:词汇你好;在
Qwen
的词汇表中使用一个token表示的,按理来说,我们可以直接在vocab.json文件中直接表示为"你好":108
SUNX-T
·
2025-03-30 21:14
大模型
python
语言模型
高性能部署实战:vLLM 安装配置 × tokens/s 提升 × 并发测试(适配国产模型)
高性能部署实战:vLLM安装配置×tokens/s提升×并发测试(适配国产模型)本文目标:带你完整掌握如何使用vLLM高性能推理引擎部署国产大模型(如
Qwen
/DeepSeek),包括环境准备、部署流程
AI筑梦师
·
2025-03-30 21:44
人工智能
深度学习
【大模型篇】阿里云
Qwen
2.5-Max:超大规模 MoE 模型架构和性能评估
一、引言
Qwen
2.5-Max是阿里云通义千问团队研发的超大规模Mixture-of-Expert(MoE)模型,旨在通过超大规模的数据和模型规模扩展来提升模型的智能水平。
大F的智能小课
·
2025-03-30 03:05
大模型理论和实战
阿里云
云计算
Ollama入门指南:部署与实战最新模型(DeepSeek-V3、
Qwen
2.5、Llama3)
一、Ollama核心优势与适用场景Ollama通过简化模型部署流程,支持开发者快速调用DeepSeek-V3(开源MoE模型)、
Qwen
2.5-Max(阿里编程旗舰模型)、Llama3(Meta基础模型
AndrewHZ
·
2025-03-30 02:32
深度学习新浪潮
算法
深度学习
语言模型
LLM
ollama
神经网络
模型部署
【大模型】视觉语言模型:
Qwen
2.5-VL的使用
官方github地址:https://github.com/QwenLM/
Qwen
2.5-VL目录
Qwen
家族的最新成员:
Qwen
2.5-VL主要增强功能模型架构更新快速开始使用Transformers
Jackilina_Stone
·
2025-03-29 12:59
#
大模型
语言模型
人工智能
Qwen2.5-VL
python
阿里全模态模型
Qwen
2.5-Omni现已开源,其7B尺寸的版本实现了全球顶尖的性能表现
今日,通义千问
Qwen
2.5-Omni-7B正式开源,作为通义系列首个端到端全模态大模型,它能够同时处理文本、图像、音频、视频等多类型输入,并实时生成文本与自然语音合成输出。
万才博客
·
2025-03-29 10:17
ai
AI编程
【拥抱AI】对比embedding模型gte-
Qwen
2-7B-instruct和bge-m3:latest(三)
为了更全面地评估gte-
Qwen
2-7B-instruct和bge-m3:latest的性能,我们可以从以下几个方面进行详细比较:1.模型架构和规模gte-
Qwen
2-7B-instruct架构:基于Transformer
奔跑草-
·
2025-03-28 14:22
人工智能
人工智能
embedding
Qwen
2-Audio
Qwen
2.5-VL
Qwen
2.5_Omni傻傻分不清
引言:
Qwen
系列多模态大模型阿里巴巴
Qwen
团队在这一领域持续深耕,推出了一系列备受瞩目的多模态大模型。
kakaZhui
·
2025-03-27 18:56
前沿多模态大模型:论文与实战
人工智能
AIGC
chatgpt
语音识别
qwen
_vl_utils代码分析
函数列表:序号函数名简要说明1round_by_factor(number:int,factor:int)->int返回最接近number,且能被factor整除的整数。2ceil_by_factor(number:int,factor:int)->int返回大于等于number,且能被factor整除的最小整数。3floor_by_factor(number:int,factor:int)->i
fydw_715
·
2025-03-27 13:43
qwen
计算机视觉
人工智能
Docker vLLM 快速部署
Qwen
2.5
Dockerfile:FROMkevinchina/deeplearning:llamafactory20241027#设置工作目录WORKDIR/app#暴露端口EXPOSE8000EXPOSE7860#使用JSON格式的ENTRYPOINT,指定要执行的命令#ENTRYPOINT["llamafactory-cli","api","--model_name_or_path","/data/xi
XD742971636
·
2025-03-25 18:23
深度学习机器学习
深度学习
AI
LLM
llama
Langchain+Ollama实现
Qwen
模型+客服问答私有数据FAQ-实现RAG
本文使用Ollama直接运行本地
Qwen
模型,需要先安装好ollama。
showker
·
2025-03-25 18:21
python
开发语言
OpenManus 架构的详细技术实现
一、OpenManus架构的详细技术实现1.核心分层架构的深度解析底层:LLM层模型选择与适配:OpenManus允许用户替换底层LLM(如mPLUG-Owl3、
Qwen
、Llama等),通过统一接口调用模型
大势下的牛马
·
2025-03-22 22:12
搭建本地gpt
架构
OpenManus
Manus
Agent
01年实习生被曝负责字节RL核心算法!系字节LLM攻坚小组成员
用上该算法后,
Qwen
2.5-32B模型只经过RL训练,不引入蒸馏等其他技术,在AIME2024基准上拿下50分,优于相同setting下使用GRPO算法的DeepSeek-R1-Zero-
Qwen
,且
·
2025-03-22 22:24
量子位
DeepSeek 部署指南 (使用 vLLM 本地部署)
我们以deepseek-ai/DeepSeek-R1-Distill-
Qwen
-7B模型为例进行演示。1、安装Python环境首先,您需要安装Python环境。
AGI大模型资料分享员
·
2025-03-22 19:51
人工智能
语言模型
学习
chatgpt
深度学习
大模型
deepseek
llama-factory 微调
Qwen
2.5-3B-Instruct
0、资源链接官方readme:https://github.com/hiyouga/LLaMA-Factory/blob/v0.9.1/README_zh.md官方文档:https://llamafactory.readthedocs.io/zh-cn/latest/官方推荐的知乎教程:https://zhuanlan.zhihu.com/p/6952876071、安装LLaMAFactorygi
coco_1998_2
·
2025-03-22 14:16
llama
factory
fine
tune
Qwen
2-Audio:通义千问音频大模型技术解读
阿里巴巴通义千问团队,推出了
Qwen
-Audio系列模型,这里我们一起看下最新版本
Qwen
2-Audio。
Qwen
2-Audio不仅能够理解各种音频信号,还能根据语音指令做出文本回应,甚至可以进
kakaZhui
·
2025-03-21 01:41
音视频
AIGC
人工智能
python
chatgpt
开源模型应用落地-
qwen
模型小试-调用
Qwen
2-7B-Instruct-进阶篇(十二)
一、前言经过前五篇“
qwen
模型小试”文章的学习,我们已经熟练掌握
qwen
大模型的使用。然而,就在前几天阿里云又发布了
Qwen
2版本。
开源技术探险家
·
2025-03-20 19:23
开源模型-实际应用落地
#
深度学习
自然语言处理
语言模型
LangChain入门:使用Python和通义千问打造免费的
Qwen
大模型聊天机器人
前言LangChain是一个用于开发由大型语言模型(LargeLanguageModels,简称LLMs)驱动的应用程序的框架。它提供了一个灵活的框架,使得开发者可以构建具有上下文感知能力和推理能力的应用程序,这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库:Python和JavaScript库。包含了各种组件的接口和集成,一个基本的运行时,用于将这些组件组合
南七小僧
·
2025-03-20 18:44
人工智能
网站开发
AI技术产品经理
服务器
数据库
windows
有了大模型为何还需要Agent智能体
Agent(智能体)是一种能感知环境、自主决策、执行动作的智能实体,当它与大语言模型(如通义千问
QWen
、GPT)结合时,形成一种**“增强型AI系统”**。
全栈你个大西瓜
·
2025-03-20 09:59
人工智能
人工智能
AI
Agent
Agent
智能体
Agent
原理
agent实现:通过prompt方式实现agent自定义使用
参看:https://github.com/TommyZihao/openvino_tonypihttps://github.com/QwenLM/
Qwen
/blob/main/examples/react_prompt.md
loong_XL
·
2025-03-20 05:27
深度学习
大模型AI
prompt
agent
打磨下
大模型
vllm部署说明和注意事项
DeepSeek-R1-Distill-
Qwen
-32B可去modelscope下载:整体大小约为60GB部署DeepSeek-R1-Distill-
Qwen
-32B模型,
ai一小生
·
2025-03-17 14:59
python
人工智能
持续部署
通过docker-compose部署
qwen
2-vl-7b模型
docker-compose部署
qwen
2-vl-7b模型准备工作docker-compose.yml遇到的报错在ONE-API设置测试脚本准备工作1、安装较新版本的docker-compose2、安装
scutshijie
·
2025-03-17 14:28
docker
容器
运维
语言模型
开源模型应用落地-
Qwen
2-VL-7B-Instruct-vLLM-OpenAI API Client调用
一、前言学习
Qwen
2-VL,为我们打开了一扇通往先进人工智能技术的大门。让我们能够深入了解当今最前沿的视觉语言模型的工作原理和强大能力。
开源技术探险家
·
2025-03-17 13:52
开源大语言模型-新手试炼
深度学习
AI编程
AIGC
本地部署大模型QPS推理测试
2.2、50字左右问题2.3、100字左右问题3、测试代码3.1、通用测试代码3.2、通用测试代码(仅供参考)4、测试结果4.1、通用测试结果4.2、RAG测试结果1、测试环境1.1、显卡1.2、模型
Qwen
2.5
内卷焦虑人士
·
2025-03-17 03:30
QPS
本地部署
大模型测试
RAG
主流开源大模型能力对比矩阵
模型名称核心优势主要局限Llama2/3✅多语言生态完善✅Rotary位置编码✅GQA推理加速⚠️数据时效性差⚠️隐私保护不足
Qwen
✅千亿参数规模✅中文语境优化✅复杂文本生成⚠️需高性能硬件⚠️领域知识需二次训练
时光旅人01号
·
2025-03-16 12:09
人工智能
开源
python
深度学习
pytorch
大模型火爆 2025:LLaMA、
Qwen
、DeepSeek 核心原理+就业秘籍,快速入门 AI 工程师
1.大模型核心原理:从零开始理解AI模型这些是大型语言模型(LLMs)的核心技术,适合初学者逐步深入学习。以下是详细拆解,让小白也能掌握:LLaMA系列模型核心原理详解:什么是LLaMA?:LLaMA是一个基于人工智能的语言模型,像一个超级聪明的聊天机器人,能理解和生成人类语言。它由Meta公司开发,类似ChatGPT,但更开源、灵活。核心原理:Transformer架构:想象一个工厂流水线,LL
weixin_40941102
·
2025-03-16 03:38
llama
人工智能
【奇点时刻】通义千问开源QwQ-32B技术洞察报告(扫盲帖)
以下报告将基于今天各大社区对
Qwen
/QwQ-32B(下文简称「QwQ-32B」)模型的讨论、测评与实测体验进行综合性分析与洞察。
碣石潇湘无限路
·
2025-03-16 03:37
开源
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他