E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Qwen
(LLaMa Factory)大模型训练方法--准备模型(
Qwen
2-0.5B)
1、准备训练框架LLaMAFactory是一款开源低代码大模型微调框架,集成了业界最广泛使用的微调技术,支持通过WebUI界面零代码微调大模型,目前已经成为开源社区内最受欢迎的微调框架。2、运行环境要求硬件:GPU:推荐使用24GB显存的显卡或者更高配置软件:python:3.10pytorch:2.1.2+cuda12.1操作系统:Ubuntu22.043、准备训练模型在开展大模型训练之前,由于
风起晨曦
·
2025-06-04 23:21
llama
AI编程实战:Python +
Qwen
-agent 实现chat2SQL智能助手系统(二)
项目目标满足自己筛选基金经理;写一个跟AI相关的项目;学习与锻炼Python编程;学习与使用开源框架
Qwen
-agent。
AIGC包拥它
·
2025-06-04 03:47
AI编程
python
flask
pycharm
mysql
sql
AI编程实战:Python +
Qwen
-agent 实现chat2SQL智能助手系统
项目目标满足自己筛选基金经理;写一个跟AI相关的项目;学习与锻炼Python编程;学习与使用开源框架
Qwen
-agent。
AIGC包拥它
·
2025-06-04 03:16
AI编程
python
pycharm
mysql
sql
Spring AI 中 ChatClient常用方法
ChatClient是SpringAI中一个简洁高效的组件,它能让你仅用几行代码就轻松对接Deepseek、
Qwen
等主流AI大模型。
Java架构何哥
·
2025-06-04 01:39
AI大模型
ChatClient常用方法
ChatClient链式调用
如何使用Ollama在本地运行
Qwen
3并支持MCP和工具使用
Qwen
3是阿里巴巴
Qwen
团队最新发布的开源大语言模型,提供具有竞争力的性能,高度模块化和工具使用能力。
大语言模型
·
2025-06-03 20:02
人工智能
大模型应用
LLM
AI大模型
deepseek
Qwen3
MCP
【LlamaIndex】基于
Qwen
+ LlamaIndex 构建多轮记忆式情感对话系统1.0版
目录一、项目简介二、核心技术栈三、环境准备四、自定义洛溪:提示词是灵魂五、一步步搭建AI洛溪1️⃣初始化模型&Prompt2️⃣构建有记忆的聊天引擎3️⃣加入“初始剧情”,增加沉浸感六、实时对话体验七、后续优化八、完整运行代码九、总结:不仅仅是“女朋友”在大语言模型飞速发展的今天,聊天机器人不仅能答题解惑、写代码、写文案,还能成为“情感陪伴”的载体。今天,我们将带你用不到100行代码,打造一个**
一叶千舟
·
2025-06-03 10:17
AI大模型应用【项目实例】
人工智能
LLM
Llamaindex
qwen
【仿生系统】
qwen
的仿生机器人解决方案
收到完整需求后,我将从系统架构设计、算法实现路径、训练方法三个维度为您构建完整的仿生机器人解决方案。以下是分阶段实施方案:一、核心系统架构设计(模块化可进化架构)1.多模态感知引擎-视觉子系统:YOLOv8+SAM组合实现实时物体检测+场景语义分割-听觉子系统:Whisper+SpeakerEmbedding+情感识别三重处理-语言理解:基于LLaMA3的增量式语义解析(IncrementalPa
DFminer
·
2025-06-03 04:39
机器人
【深度学习新浪潮】以Dify为例的大模型平台的对比分析
可扩展性和安全性五个维度展开对比分析:一、核心功能对比平台核心功能多模型支持插件与工具链Dify低代码开发、RAG增强、Agent自律执行、企业级安全支持GPT-4/5、Claude、Llama3、Gemini及开源模型(如
Qwen
-VL
小米玄戒Andrew
·
2025-06-02 21:40
深度学习新浪潮
深度学习
人工智能
算法
transformer
计算机视觉
AI
Agent
AI智能体平台
qwen
2.5 并行计算机制:依靠 PyTorch 和 Transformers 库的分布式能力
qwen
2.5并行计算机制:依靠PyTorch和Transformers库的分布式能力完整可运行代码:importtorchimporttorch.nn.functionalasFfromtransformers
ZhangJiQun&MXP
·
2025-06-02 16:03
教学
2024大模型以及算力
2021
AI
python
pytorch
人工智能
python
大数据
prompt
深度学习
机器学习
ImportError: /usr/local/app/.local/lib/python3.10/site-packages/flash_attn_2_cuda.cpython-310-x86_64
linuxtransformers4.39.0tokenizers0.15.2torch2.1.2+cu121flash-attn2.3.3在使用vllm运行xverse/XVERSE-13B-256K时(代码如下):
qwen
_model
Cyril_KI
·
2025-06-02 11:03
LLM
llm
qwen
flash-attn
Qwen
2.5-Omni 多模态部署保姆级教程:图文问答×接口调用×Gradio UI 全都有
个人简介作者简介:全栈研发,具备端到端系统落地能力,专注大模型的压缩部署、多模态理解与Agent架构设计。热爱“结构”与“秩序”,相信复杂系统背后总有简洁可控的可能。我叫观熵。不是在控熵,就是在观测熵的流动个人主页:观熵个人邮箱:
[email protected]
座右铭:愿科技之光,不止照亮智能,也照亮人心!专栏导航观熵系列专栏导航:AI前沿探索:从大模型进化、多模态交互、AIGC内容生成,到
观熵
·
2025-06-02 05:53
国产大模型部署实战全流程指南
ui
人工智能
通义千问
大模型封装
深度学习
Qwen
3 本地部署指南:打造完全离线的AI助手
Qwen
3是阿里巴巴
Qwen
团队推出的最新开源大语言模型(LargeLanguageModel,LLM),它提供了令人印象深刻的性能,同时具备高度模块化和强大的工具调用能力。
我爱学大模型
·
2025-06-01 15:08
人工智能
AI大模型
AI
Qwen3
本地部署大模型
LLM
大语言模型
Qwen
2学习笔记1:
Qwen
2模型原理
代码位置:在
Qwen
2Tokenizer类中定义(此类继承自PreTrainedTokenizer),负责处理token的转化。
guoyukun1
·
2025-06-01 02:11
学习
笔记
【大模型】情绪对话模型项目研发
一、使用框架:
Qwen
大模型后端+Open-webui前端实现使用LLamaFactory的STF微调数据集,vllm后端部署,二、框架安装下载千问大模型安装魔塔社区库文件pipinstall modelscopeDownload.py
SSH_5523
·
2025-05-31 14:16
大模型
python
语言模型
人工智能
17、Swift框架微调实战(2)-QWQ-32B LORA微调cot数据集
1、QWQ-32B介绍1.1基本介绍QwQ是
Qwen
系列的大模型之一,专注于推理能力(reasoning)。
Andy_shenzl
·
2025-05-31 02:14
大模型学习
Swift
QWQ
微调
LORA
23、Swift框架微调实战(3)-
Qwen
2.5-VL-7B LORA微调OCR数据集
一、模型介绍
Qwen
2.5-VL是阿里通义千问团队开源的视觉语言模型,具有3B、7B和72B三种不同规模,能够识别常见物体、分析图像中的文本、图表等元素,并具备作为视觉Agent的能力。
Andy_shenzl
·
2025-05-31 02:43
大模型学习
swift
微调
LoRA
ocr
【保姆级教程 】模型蒸馏新突破:利用大模型提升小模型能力的Reasoning模型实践指南!
今天我们就用
Qwen
2.5-1.5B小模型(相当于AI界的初中生)来进行实践!什么是模型蒸馏?
大模型入门教程
·
2025-05-30 16:59
人工智能
产品经理
AI
大模型
大模型学习
程序员
大模型教学
大模型现象级发现-2025年上半年 资料收集
思考模型-不思考的小技巧2025-05-27最新实验:不听人类指令OpenAI模型拒绝自我关闭https://x.com/PalisadeAI/status/1926084635903025621公众号
qwen
3
CSPhD-winston-杨帆
·
2025-05-30 15:51
人工智能
ai大模型7B级别对比
针对DeepSeek和
Qwen
两大开源7B级大模型的对比分析,从性能、架构、应用场景等维度展开:性能对比DeepSeek-7B擅长数学与代码生成,在HumanEval基准测试中Python代码生成准确率约
慎思笃行丨
·
2025-05-30 10:45
人工智能
《手把手大模型应用教程》- 常用Agent开发框架
最近需要做Agent智能体开发,在经过一番比较后,得出两个较好的框架:Langchain和
Qwen
-Agent,两个框架都比较优秀,但是在实现上有略微差别,本文会将大体框架的优势以及劣势进行比较分析,下篇会着重进入智能体开发
Alex_81D
·
2025-05-28 01:28
python
AI人工智能
后端
python
大模型应用
字节豆包团队开源 BAGEL - 多模态理解和生成统一模型
在标准多模态理解排行榜上,BAGEL的表现优于
Qwen
2.5-VL和InternVL-2.5等当前顶级开源VLM,其文本到图像的质量可与SD3等强大的专业生成器相媲美。
吴脑的键客
·
2025-05-27 00:18
AI作画
开源
AIGC
人工智能
AI作画
深入解读
Qwen
3技术报告(五):后训练对齐
重磅推荐专栏:《大模型AIGC》《课程大纲》《知识星球》本专栏致力于探索和讨论当今最前沿的技术趋势和应用领域,包括但不限于ChatGPT和StableDiffusion等。我们将深入研究大型模型的开发和应用,以及与之相关的人工智能生成内容(AIGC)技术。通过深入的技术解析和实践经验分享,旨在帮助读者更好地理解和应用这些领域的最新进展5.后训练对齐:从基础模型到可用助手预训练完成后的大型语言模型虽
小爷毛毛(卓寿杰)
·
2025-05-26 14:22
大模型AIGC
深度学习基础/原理
人工智能
自然语言处理
深度学习
语言模型
[特殊字符] Function Calling 技术详解与
Qwen
模型实践指南
随着多模态大模型(如GPT-4、
Qwen
2.5等)逐渐支持插件、API调用等能力,FunctionCalling(函数调用)技术正成为连接模型与外部世界的桥梁。
_深海凉_
·
2025-05-26 13:46
AI相关
人工智能
语言模型
深度学习实战108-基于通义千问
Qwen
2.5-Omni的智能数字人实时对话系统实现
大家好,我是微学AI,今天给大家介绍一下深度学习实战108-基于通义千问
Qwen
2.5-Omni的智能数字人实时对话系统实现。
微学AI
·
2025-05-26 04:23
深度学习实战(进阶)
大模型的实践应用
深度学习
人工智能
Qwen
LLM
Omni
Qwen
3全面解析:阿里巴巴新一代开源大模型入门指南
Qwen
3全面解析:阿里巴巴新一代开源大模型入门指南引言:
Qwen
3的横空出世
Qwen
3是什么?
Ven%
·
2025-05-25 07:31
简单说深度学习
开源
qwen3
python
人工智能
【全网首发】使用 LoRA 微调
Qwen
2.5-VL-7B-Instruct:完整流程解析
引言今天凌晨(2025年1月28日),
Qwen
团队正式发布
Qwen
2.5-VL,这是
Qwen
模型家族的旗舰视觉语言模型(VLM)。
HovChen_
·
2025-05-25 06:53
python
人工智能
自然语言处理
神经网络
深度学习
pytorch
语言模型
【读代码】BAGEL:统一多模态理解与生成的模型
该模型在统一架构下实现了三大核心能力:多模态理解:在MME、MMBench等9大评测基准中超越
Qwen
2.5-VL等主流模型文本生成图像:生成质量媲美SD3等专业生成模型智能图像编辑:支持自由格式编辑、
kakaZhui
·
2025-05-25 04:13
前沿多模态大模型:论文与实战
AIGC
人工智能
大模型
图像生成
【国产大模型 × 制造调度】智能生产线调度系统实战构建与多工位优化落地解析
【国产大模型×制造调度】智能生产线调度系统实战构建与多工位优化落地解析关键词智能制造、生产调度优化、DeepSeek、千问
Qwen
、工位路径规划、任务推理、产线重排、边云协同、设备状态建模、批次任务压缩
观熵
·
2025-05-25 04:10
国产大模型部署实战全流程指南
制造
人工智能
国产大模型
通过vllm部署
qwen
3大模型以及基于 vLLM 的 OpenAI 兼容 API 接口调用方法总结
一,通过vllm部署
qwen
3模型。
Gq.xxu
·
2025-05-25 01:54
网络
linux
运维
llama
ai
人工智能
基于 SGLang 部署
Qwen
2.5 7B 模型
本文将详细介绍如何使用SGLang快速部署
Qwen
2.57B模型,并深入探讨SGLang的关键性能优化技术,以及预期可以达到的延迟和吞吐量。
kakaZhui
·
2025-05-24 14:09
AIGC
人工智能
python
chatgpt
NVIDIA 实现通义千问
Qwen
3 的生产级应用集成和部署【2025年 5月 2日】
阿里巴巴近期发布了其开源的混合推理大语言模型(LLM)通义千问
Qwen
3,此次
Qwen
3开源模型系列包含两款混合专家模型(MoE)235B-A22B(总参数2,350亿,激活参数220亿)和30B-A3B
u013250861
·
2025-05-24 05:39
#
LLM/部署&推理
jetson
大模型 agent 执行sql查询
转载,来源:Howtocallfunctionswithchatmodels1.定义client使用了阿里云的
qwen
-max模型。
Qiming_v
·
2025-05-24 02:17
sql
agent
基于Llamaindex的本地向量与大模型RAG搭建流程
Qwen
指导文档给出了基于HF或者其他使用APIKey大模型的示例,场景不符。Llamaindex自身相关文档,尤其是关键插件的用户手册难寻,接口说明也很少。
1024点线面
·
2025-05-23 03:10
AIGC
python
开发语言
ollama
RAG
llamaindex
向量模型
大模型
2025.5.25 关于AI的第一次分享
在国内市场,
Qwen
3凭借其出色的本地化能力和技术创新,成为国产AI的佼佼者。Deepseek系列及其他AI模型也在各自细分领域持续发力,推动着A
爱意随风起风止意难平
·
2025-05-22 18:14
AI
人工智能
AI
Qwen
3开源震撼来袭,引领大模型新时代
目录引言
Qwen
3开源发布性能卓越超越同行(一)基准评测实力碾压(二)以小博大参数优势五大特性创新升级(一)丰富模型参数体系(二)混合思考灵活切换(三)推理能力显著提升(四)MCP集成Agent增强(五
gadiaola
·
2025-05-22 17:09
人工智能
语言模型
人工智能
qwen
2:7b本地化部署:Ollama更新、设置、api调用
qwen
2服务
本篇介绍了如何使用Ollama本地化部署
qwen
2:7b,以及进行Ollama的参数设置以及使用api调用
qwen
2的api服务的方法。
金桃不烦恼
·
2025-05-22 14:51
语言模型
chatgpt
阿里云
JAVA请求vllm的api服务报错Unsupported upgrade request、 Invalid HTTP request received.
环境:vllm0.8.5java17
Qwen
3-32B-FP8问题描述:JAVA请求vllm的api服务报错Unsupportedupgraderequest、InvalidHTTPrequestreceived.WARNING
玩人工智能的辣条哥
·
2025-05-22 05:20
人工智能
JAVA
java
http
开发语言
vllm
Qwen3-32B-FP8
大模型的实践应用43-基于
Qwen
3(32B)+LangChain框架+MCP+RAG+传统算法的旅游行程规划系统
大家好,我是微学AI,今天给大家介绍一下大模型的实践应用43-基于
Qwen
3(32B)+LangChain框架+MCP+RAG+传统算法的旅游行程规划系统。
微学AI
·
2025-05-21 04:05
大模型的实践应用
深度学习实战(进阶)
langchain
算法
旅游
MCP
Qwen
【多模态大模型实战】 搭建通义千问
Qwen
2.5-VL-7B-Instruct多模态模型,以及推理微调
模型信息
Qwen
2.5是
Qwen
大型语言模型的最新系列。对于
Qwen
2.5,我们发布了从0.5亿到72亿参数不等的一系列基础语言模型和指令调优语言模型。
AI智韵
·
2025-05-20 18:03
大模型论文翻译与实战
人工智能
语言模型
深度学习
用JAVA实现人工智能:采用框架Spring AI Java
QWen
目前有100万免费Token额度,可以快速实现需求。同时,因为
qwen
也是个开源的模型,我们可以自己搭建模型来实现免费使用。目录?编辑SpringAI集成人工智能
m0_74823863
·
2025-05-20 15:16
面试
学习路线
阿里巴巴
java
人工智能
spring
LLaMA-Factory微调大模型
Qwen
2.5
1、开始ModelScope社区GPU环境训练或微调模型都是非常耗费算力的。如果电脑的配置不高,可使用一些云服务器来做这项工作。如ModelScope(魔搭)社区的GPU环境,目前提供36小时免费运算,足够微调一个大模型了。注册ModelScope(魔搭)社区账号(可能还要注册或认证阿里云账号),进入“我的NoteBook”:我的Notebook·魔搭社区启动大概需要2分钟,等GPU环境启动好以后
will.hu
·
2025-05-20 12:57
AI
linux
Python
llama
开源模型应用落地-
qwen
2-7b-instruct-LoRA微调-ms-swift-单机多卡-RTX 4090双卡(十四)
一、前言本篇文章将使用ms-swift去高效微调
QWen
2系列模型,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。
开源技术探险家
·
2025-05-20 00:30
开源模型-实际应用落地
#
开源模型-微调实战密码
自然语言处理
深度学习
语言模型
wsl迁移到D盘失败后的处理(
qwen
-max2.5)
question1:之前我执行了wsl迁移到d盘的指令,具体什么指令忘了,现在powershell中键入wsl回车提示:适用于Linux的Windows子系统没有已安装的分发。希望在不重装wsl的情况下搞定这个问题question2:PSE:\111>wsl--importUbuntuD:\vDisk\wsl\ubuntuD:\vDisk\wsl\ubuntu.tar--version2由于未安装
BeyondTimeSpace
·
2025-05-19 20:34
Windows系统
学习记录
wsl迁移D盘
【实战指南】Rocky Linux 本地部署
Qwen
2.5-VL-Instruct(含 GPU 加速 + 多模态推理脚本)
【实战指南】RockyLinux本地部署
Qwen
2.5-VL-Instruct(含GPU加速+多模态推理脚本)适用系统:RockyLinux/CentOS/RHEL适用于本地GPU+Docker部署
Qwen
2.5
神志不清.
·
2025-05-18 21:34
Ai大模型
ai
人工智能
云计算
基于
Qwen
-14b的基础RAG实现及反思
1、概览本文主要介绍RAG的基础实现过程,给初学者提供一些帮助,RAG即检索增强生成,主要是两个步骤:检索、生成,下面将基于这两部分进行介绍。2、检索检索的主要目的是在自定义的知识库kb中查询到与问题query相关的候选答案。过程中主要涉及的几个关键内容是:文本向量化模型、向量数据库,文本向量化模型如GTE、BGE等、向量数据库如faiss、weaviate、milvus等,对于选型本文不作介绍,
带鱼工作室
·
2025-05-16 16:18
python
llm
人工智能
python
qwen
rag
阿里巴巴
Qwen
3大模型深度解析
阿里巴巴
Qwen
3大模型深度解析:技术突破、应用场景与行业竞争一、核心技术创新:推理效率与硬件适配的双重突破动态混合专家系统(MoE)
Qwen
3采用分层稀疏调度与动态专家激活机制,15B参数模型中仅需激活
不会啊~
·
2025-05-16 12:22
科技
人工智能
LLaMA Factory 深度调参
zysNLP/quickllm初始指令:llamafactory-clitrain\--stagesft\--do_trainTrue\--model_name_or_path/data/quickllm/
qwen
3
NLP小讲堂
·
2025-05-15 23:47
机器学习
人工智能
免费大模型API调用汇总
国家超算互联网平台QwQ-32B(阿里
Qwen
团队开发):新用户免费100万Tokens,支持数学推理与代码生成,性能对标Deep
大大小小聪明
·
2025-05-15 18:08
ai
AI编程
开源模型应用落地-
qwen
模型小试-调用
Qwen
2-VL-7B-Instruct-更清晰地看世界(一)
一、前言学习
Qwen
2-VL,为我们打开了一扇通往先进人工智能技术的大门。让我们能够深入了解当今最前沿的视觉语言模型的工作原理和强大能力。
开源技术探险家
·
2025-05-15 08:34
开源模型-实际应用落地
#
深度学习
AIGC
AI编程
Qwen
3 调用 FastMCP —— 查询天气案例,了解 MCP 和大模型的结合方法
问题frommodelscopeimportAutoModelForCausalLM,AutoTokenizermodel_name="
Qwen
/
Qwen
3-1.7B"#loadthetokenizerandthemodeltokenizer
·
2025-05-14 12:53
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他