E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
qwen2
开源模型应用落地-qwen模型小试-调用Qwen2-7B-Instruct-进阶篇(十二)
然而,就在前几天阿里云又发布了
Qwen2
版本。无论是语言模型还是多模态模型,均在大规模多语言和多模态数据上进行预训练,并通过高质量数据进行后期微调以贴近人类偏好。
开源技术探险家
·
2025-03-20 19:23
开源模型-实际应用落地
#
深度学习
自然语言处理
语言模型
llamaindex实现企业级RAG应用(一)
在上一篇文章中使用
Qwen2
进行RAG代码实践,手动实现了一版简易的RAG应用,在实际工作中通常都用会使用langchain或llamaindex架构来搭建rag应用,并且会非常复杂。
弈秋001
·
2025-03-15 15:15
transformer
自然语言处理
深度学习
人工智能
离线服务器ollama新增
qwen2
:0.5b模型
离线服务器ollama新增
qwen2
:0.5b模型Dify集成ollama前面已经介绍过离线服务器CentOS使用的docker安装的ollama,其中在ollama中已经安装了deepseek-r1:
slient_love
·
2025-03-13 20:30
AI
软件开发
服务器
运维
人工智能
docker
[论文笔记] LLaMA3.1与
Qwen2
与Apple 技术报告中预训练方案对比
https://arxiv.org/pdf/2407.21075https://arxiv.org/pdf/2407.10671https://arxiv.org/pdf/2407.21783LLaMA3.1LLaMA3.1技术报告:https://ai.meta.com/blog/meta-llama-3-1/
心心喵
·
2025-03-10 01:02
论文笔记
论文阅读
深度学习
人工智能
深入浅出的理解deepseek类大模型(附运行代码)
我们把
Qwen2
模型想象成一个非常聪明的“阅读理解专家”。这个专家,就像我们人类一样,需要先“看”到文字,然后才能理解文字的意思,最后才能回答问题或者生成新的文字。
AI人工智能时代
·
2025-03-08 08:47
人工智能
transformer
机器人
深度学习
开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机多卡-RTX 4090双卡(五)
一、前言本篇文章将使用LLaMA-Factory去高效微调
QWen2
系列模型,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。
开源技术探险家
·
2025-03-06 23:26
开源模型-实际应用落地
#
开源模型-微调实战密码
自然语言处理
深度学习
语言模型
深度学习-136-LangGraph之应用实例(五)构建RAG问答系统同时从不同的角度对比优化效果
测试调用4总结与优化4.1问题分析4.2对比不同的返回文档数4.3对比不同的嵌入模型4.3.1嵌入模型nomic-embed-text4.3.2嵌入模型bge-m34.4对比不同的大模型4.4.1大模型
qwen2
皮皮冰燃
·
2025-03-02 23:59
深度学习
深度学习
人工智能
LangGraph
RAG
Ollama本地私有化部署通义千问大模型Qwen2.5
目录Qwen2.5介绍Qwen2.5新闻Ollama介绍Linux安装Ollama一键安装Ollama手工安装Ollama卸载OllamaOllama运行
Qwen2
基于Transformers进行推理本文复现环境
ErbaoLiu
·
2025-02-27 20:17
数据分析&大模型
机器学习&大模型
自然语言处理&大模型
大模型
LLM
Qwen2.5
Qwen2
Ollama
记录一些可用的AI工具网站
AI乐曲生成AI视频生成AI音频分离AI对话大模型当前时代巅峰,MicrosoftCopilot:https://copilot.microsoft.com个人机可以部署的开源模型巅峰,阿里的通义千问
Qwen2
starvapour
·
2025-02-23 13:51
python/AI学习笔记
人工智能
华为NPU服务器昇腾Ascend 910B2部署通义千问Qwen2.5——基于mindie镜像一路试错版(一)
blog.csdn.net/xiezhipu/article/details/145467032)[昇腾,mindie,镜像,部署vllm:第2篇,启动mindieservice_daemon服务,支持对
Qwen2
几道之旅
·
2025-02-12 10:06
昇腾NPU部署通义千问2.5
Agent)
华为
服务器
运维
语言模型
自然语言处理
人工智能
深度学习
华为NPU服务器昇腾Ascend 910B2部署通义千问Qwen2.5——基于mindie镜像一路试错版(三)
blog.csdn.net/xiezhipu/article/details/145467032)[昇腾,mindie,镜像,部署vllm:第2篇,启动mindieservice_daemon服务,支持对
Qwen2
几道之旅
·
2025-02-12 10:06
昇腾NPU部署通义千问2.5
Agent)
华为
自然语言处理
语言模型
人工智能
docker
python
transformer
我把DeepSeek-R1推理能力知识蒸馏到
Qwen2
,效果真的炸裂!!!
我把DeepSeek-R1推理能力知识蒸馏到
Qwen2
,效果真的炸裂!!!
AI生成曾小健
·
2025-01-31 03:00
自然语言处理
人工智能
VLM 系列——
Qwen2
VL——论文解读——前瞻(源码解读)
一、概述1、是什么是一系列多模态大型语言模型(MLLM),其中包括2B、7B、72B三个版本,整体采用视觉编码器+LLM形式(可以认为没有任何投射层)。比较创新的是图像缩放方式+3DLLM位置编码+(预估后面的训练方式也不太一样)。能够处理包括文本、图像在内的多种数据类型,具备图片描述、单图文问答、多图问对话、视频理解对话、json格式、多语言、agent、高清图理解(代码编写和debug论文暂时
TigerZ*
·
2025-01-16 18:48
AIGC算法
AIGC
人工智能
transformer
计算机视觉
图像处理
开源模型应用落地-qwen2-7b-instruct-LoRA微调-unsloth(让微调起飞)-单机单卡-V100(十七)
一、前言本篇文章将在v100单卡服务器上,使用unsloth去高效微调
QWen2
系列模型,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。
开源技术探险家
·
2024-09-14 13:28
开源模型-实际应用落地
#
深度学习
语言模型
自然语言处理
vllm在线推理踩坑记
最近在《AI大模型全栈工程师》课程里看老师推荐使用vllm部署大模型,优点就不详细介绍了,这里摘抄一段来自于
Qwen2
上手指南对于它的简单介绍:它易于使用,且具有最先进的服务吞吐量、高效的注意力键值内存管理
懂点投资的码农
·
2024-09-14 12:14
大语言模型
ai
语言模型
python
【
Qwen2
部署实战】
Qwen2
初体验:用Transformers打造智能聊天机器人
系列篇章No.文章1【Qwen部署实战】探索Qwen-7B-Chat:阿里云大型语言模型的对话实践2【
Qwen2
部署实战】
Qwen2
初体验:用Transformers打造智能聊天机器人3【
Qwen2
部署实战
寻道AI小兵
·
2024-09-12 06:09
AI大模型Qwen系列探索实践
人工智能
AIGC
语言模型
AI编程
Qwen
vLLM (3) - Sequence & SequenceGroup
系列文章目录vLLM(1)-
Qwen2
推理&部署vLLM(2)-架构总览vLLM(3)-Sequence&SequenceGroup文章目录系列文章目录前言一、SequenceStage&SequenceStatus1
戴昊光
·
2024-09-07 02:08
人工智能
language
model
nlp
python
transformer
开源模型应用落地-qwen2-7b-instruct-LoRA微调-ms-swift-单机单卡-V100(十二)
一、前言本篇文章将在v100单卡服务器上,使用ms-swift去高效微调
QWen2
系列模型,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。
开源技术探险家
·
2024-08-31 10:41
开源模型-实际应用落地
#
深度学习
语言模型
自然语言处理
小白学大模型——
Qwen2
理论篇
一、
Qwen2
架构图二、
Qwen2
技术修改点TransformerArchitecturewithSwiGLUactivation:不多说,最主流的transformer架构,不变。
fan_fan_feng
·
2024-08-25 14:41
大模型
人工智能
自然语言处理
paddle nlp 3.0 全面拥抱开源大模型
首先安装神圣的飞桨自然语言处理框架3.0pipinstall--upgradepaddlenlp==3.0.0b0阿里云通义千问(
Qwen2
)系列大模型介绍阿里云通义千问(
Qwen2
)是阿里云推出的一系列先进的大型语言模型
路人与大师
·
2024-08-24 04:40
paddle
自然语言处理
开源
上一页
1
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他