E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Qwen
llamaindex实现企业级RAG应用(一)
在上一篇文章中使用
Qwen
2进行RAG代码实践,手动实现了一版简易的RAG应用,在实际工作中通常都用会使用langchain或llamaindex架构来搭建rag应用,并且会非常复杂。
弈秋001
·
2025-03-15 15:15
transformer
自然语言处理
深度学习
人工智能
qwen
2.5的技术。
RMSNorm(RootMeanSquareNormalization,均方根归一化)是一种用于深度学习的归一化技术,是LayerNorm(层归一化)的一种改进。它通过计算输入数据的均方根(RootMeanSquare,RMS)来进行归一化,避免了传统归一化方法中均值和方差的计算1.LayerNorm(层归一化)LayerNorm(层归一化)是一种用于深度学习的归一化技术,主要用于稳定训练过程、加
KangkangLoveNLP
·
2025-03-14 13:29
qwen2.5
深度学习
人工智能
transformer
pytorch
自然语言处理
python
神经网络
【大模型技术】基于 通义千问(
Qwen
)实现对话系统
使用
Qwen
提供的API生成自然语言回复。核心功能:多轮对话:用户可以连续提问,系统根据上下文生成连贯的回答。上下文管理:通过维护对话历史,确保模型理解用户的意图。
大数据追光猿
·
2025-03-14 08:48
大模型
python
人工智能
学习方法
语言模型
QwQ-32B企业级本地部署:结合XInference与Open-WebUI使用
QwQ-32B是阿里巴巴
Qwen
团队推出的一款推理模型,拥有320亿参数,基于Transformer架构,采用大规模强化学习方法训练而成。
大势下的牛马
·
2025-03-14 00:56
搭建本地gpt
RAG
知识库
人工智能
QwQ-32B
离线服务器ollama新增
qwen
2:0.5b模型
离线服务器ollama新增
qwen
2:0.5b模型Dify集成ollama前面已经介绍过离线服务器CentOS使用的docker安装的ollama,其中在ollama中已经安装了deepseek-r1:
slient_love
·
2025-03-13 20:30
AI
软件开发
服务器
运维
人工智能
docker
基于SWIFT和
Qwen
1.5-0.5B-Chat进行大模型全参微调(魔搭社区)
1,swift框架安装pipinstallms-swift2,模型下载gitclonehttps://www.modelscope.cn/
qwen
/
Qwen
1.5-0.5B-Chat.git二、数据集准备使用
m0_65156252
·
2025-03-13 18:47
大模型学习笔记
python
开发语言
从Swish到SwiGLU:激活函数的进化与革命,
qwen
2.5应用的激活函数
swiGLU和RMSNorm1.什么是swiGLUSwiGLU(Swish-GatedLinearUnit)是一种结合了Swish激活函数和GLU(GatedLinearUnit)门控机制的激活函数,广泛应用于现代大型语言模型中1.什么是Swish激活函数1.1Swish激活函数Swish激活函数是一种平滑的、非单调的激活函数,由GoogleBrain团队在2017年提出。它结合了ReLU的非线性
KangkangLoveNLP
·
2025-03-13 09:02
qwen2.5
人工智能
算法
神经网络
机器学习
深度学习
cnn
自然语言处理
开源模型应用落地-
qwen
模型小试-
Qwen
-Agent(十一)
一、前言
Qwen
-Agent是一个利用开源语言模型
Qwen
的工具使用、规划和记忆功能的框架。其模块化设计允许开发人员创建具有特定功能的定制代理,为各种应用程序提供了坚实的基础。
开源技术探险家
·
2025-03-12 22:47
开源模型-实际应用落地
#
深度学习
自然语言处理
语言模型
如果,你想找 AI大模型相关的工作,这三个建议你一定要看!
由难到简单,依次是:大模型算法(⭐⭐⭐⭐⭐)模型部署加速(⭐⭐⭐⭐)RAG等相关技术(⭐⭐⭐)纯应用(⭐⭐)Prompt工程师等其他自媒体(⭐)会简单应用就行02这结果方向,B站找几个视频看看,这里推荐用
Qwen
7B
我爱学大模型
·
2025-03-11 14:45
人工智能
chatgpt
AI大模型
AI
大模型入门
转行
程序员
多模态模型在做选择题时,如何设置Prompt,如何精准定位我们需要的选项
我们这里以
Qwen
2-VL-7B-instruct为例:假设我们需要分析一张图片的情绪(从现有的情绪中进行选择),并且我们需要它以思维链的形式展现出来,我们可以这样设置prompt:emotion6_CoT
暗巷提灯
·
2025-03-11 03:10
prompt
vllm多卡部署
Qwen
2.5-72B-Instruct-GPTQ-Int4
双卡v10032G部署结果如下,推理时长16s3卡,tensor_parallel_size=3,tensor并行的数量一定要能被attentionheads整除4卡,tensor_parallel_size=4,推理速度4s
Yanc_L
·
2025-03-10 20:54
人工智能
用双色球数据集微调后的大模型
最近用
Qwen
/
Qwen
1.5-1.8B-Chat大模型来微调训练双色球2003001-2025011的数据集,实验测一下大模型出球的预测情况。
qq_29790801
·
2025-03-10 17:33
人工智能
NLP
【大模型】DeepSeek-R1-Distill-
Qwen
部署及API调用
DeepSeek-R1-Distill-
Qwen
是由中国人工智能公司深度求索(DeepSeek)开发的轻量化大语言模型,基于阿里巴巴的
Qwen
系列模型通过知识蒸馏技术优化而来。
油泼辣子多加
·
2025-03-10 17:29
大模型实战
算法
gpt
langchain
人工智能
Spark-TTS:基于大模型的文本语音合成工具
一、介绍SparkTTS完全基于
Qwen
2.5构建,无需额外的生成模型,它不依赖于单独的模型来生成声学特征,而是直接从LLM预测的代码中重建音频。这种方
CITY_OF_MO_GY
·
2025-03-10 13:35
魅力语音
语音识别
深度学习
人工智能
开源模型应用落地-
Qwen
2.5-7B-Instruct与vllm实现推理加速的正确姿势-Docker-OpenResty(三)
一、前言目前,大语言模型已升级至
Qwen
2.5版本。无论是语言模型还是多模态模型,均在大规模多语言和多模态数据上进行预训练,并通过高质量数据进行后期微调以贴近人类偏好。
开源技术探险家
·
2025-03-10 06:43
开源模型-实际应用落地
#
深度学习
自然语言处理
语言模型
大模型与图数据库RAG通俗流程拆解
图构建(略)neo4j、tugraph等均可,不影响GraphRAG核心框架模型向量化模型bce-embedding-base_v1重排序模型bce-reranker-base_v1大语言模型
Qwen
/
gallonyin
·
2025-03-10 02:15
产品笔记
AI
知识图谱
DeepSeek-R1的
Qwen
和Llama区别
好的,我现在需要回答用户关于DeepSeek-R1-Distill-
Qwen
-32B、DeepSeek-R1-Distill-Llama-70BPro和DeepSeek-R1-Distill-
Qwen
-
百态老人
·
2025-03-10 01:08
llama
人工智能
[论文笔记] LLaMA3.1与
Qwen
2与Apple 技术报告中预训练方案对比
https://arxiv.org/pdf/2407.21075https://arxiv.org/pdf/2407.10671https://arxiv.org/pdf/2407.21783LLaMA3.1LLaMA3.1技术报告:https://ai.meta.com/blog/meta-llama-3-1/
心心喵
·
2025-03-10 01:02
论文笔记
论文阅读
深度学习
人工智能
Qwen
微调-环境配置-week9
在这里插入图片描述](https://img-blog.csdnimg.cn/direct/213a0fb70a2e430684155bbd06a7ff36.png#pic_center)
Qwen
1.5
breeze281
·
2025-03-08 23:01
python
人工智能
机器学习
Qwen
1.5-7B-实现RAG应用详细步骤
1.准备工作1.1安装依赖确保你的环境中安装了以下工具和库:Python:建议使用Python3.8或更高版本。PyTorch:用于运行深度学习模型。Transformers:HuggingFace提供的库,支持加载和运行预训练模型。FAISS:用于向量检索的高效库。GPTQ支持库:如auto-gptq或gptqmodel。安装命令运行以下命令安装所需的Python包:pipinstalltorc
大数据追光猿
·
2025-03-08 23:01
大模型
数据库
AI编程
语言模型
人工智能
深度学习
阿里
Qwen
-1.8B的介绍和下载部署详细步骤
一、
Qwen
-1.8B的介绍
Qwen
-1.8B是阿里云推出的通义千问系列中的一个轻量化版本,参数量为18亿(1.8B)。
大数据追光猿
·
2025-03-08 23:31
大模型
语言模型
python
transformer
人工智能
docker
jupyter
深度学习
深入浅出的理解deepseek类大模型(附运行代码)
我们把
Qwen
2模型想象成一个非常聪明的“阅读理解专家”。这个专家,就像我们人类一样,需要先“看”到文字,然后才能理解文字的意思,最后才能回答问题或者生成新的文字。
AI人工智能时代
·
2025-03-08 08:47
人工智能
transformer
机器人
深度学习
驭码CodeRider 闪电适配阿里QwQ-32B:8小时全栈集成,AI编程效率飞跃!
今日凌晨,国产大模型领域迎来重大突破:阿里正式发布32B推理模型QwQ-32B,根据
Qwen
公布的基准测试数据,QwQ-32B整体性能可媲美DeepSeek-R1,在数学推理、编程能力和通用能力等关键测试中展现出卓越性能
极小狐
·
2025-03-07 20:10
AI编程
驭码CodeRider
DevSecOps
gitlab
极狐GitLab
阿里云CTO:通义稳居全球最强开源大模型,性能接近GPT-4o
基础模型升级,性能媲美GPT-4o,发布最强开源模型
Qwen
2.5系列,
首席数智官
·
2025-03-07 20:39
人工智能
阿里云
云计算
vLLM部署
Qwen
2.5-VL-7B-Instruct实战:从hf-mirror下载权重全流程
本文将重点演示如何从国内镜像站https://hf-mirror.com高效下载
Qwen
2.5-VL-7B-Instruct模型权重,并通过vLLM完成部署。
几道之旅
·
2025-03-07 12:58
人工智能
智能体及数字员工
人工智能
阿里深夜推出全新推理模型,仅1/20参数媲美DeepSeek R1满血版
一、参数效率革命:小体积承载大智慧阿里深夜推出全新推理模型,仅1/20参数媲美DeepSeekR1,就在刚才,阿里
Qwen
团队正式公布了最新研究成果——QwQ-32B大语言模型。
万事可爱^
·
2025-03-07 11:37
DeepSeek
QwQ-32B
大模型
人工智能
算法
【AGI】中国大模型扛把子:通义家族
阿里云推出的**通义千问(
Qwen
)**系列大模型,凭借其多层次的技术架构、多样化的模型生态及开源战略,已成为全球AI领域的重要标
LeeZhao@
·
2025-03-07 09:40
AIGC重塑生活神器
agi
人工智能
AIGC
面试
自然语言处理
语言模型
深入探究LLamaFactory推理DeepSeek蒸馏模型时无法展示<think>思考过程的问题
3.自定义模板实现优化界面展示:实现思考过程的可视化实现方法参数调整影响分析实验一实验二进入大模型应用与实战专栏|查看更多专栏内容问题背景最近在本地环境中部署了DeepSeek-R1-Distill-
Qwen
羊城迷鹿
·
2025-03-07 08:00
DeepSeek
LLama-Factory
思维链
Hugging Face Agents Course (Dummy Agent)
参考链接:https://
qwen
.readthedocs.io/en/latest/getting_started/concepts.htmlhttps://huggingface.co/agents-course
ZHOU_CAMP
·
2025-03-07 02:53
Hugging
Face
Agents
Course
人工智能
只需几步!在本地电脑轻松部署DeepSeek大模型
它提供了丰富的模型库,包括
Qwen
、Llama等1700+大语言模型,并支持用户上传自己的模型。
魔法小匠
·
2025-03-07 01:42
AI大模型
AI大模型
DeepSeek
Ollama
大模型部署
大模型API
开源模型应用落地-
qwen
2-7b-instruct-LoRA微调-LLaMA-Factory-单机多卡-RTX 4090双卡(五)
一、前言本篇文章将使用LLaMA-Factory去高效微调
QWen
2系列模型,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。
开源技术探险家
·
2025-03-06 23:26
开源模型-实际应用落地
#
开源模型-微调实战密码
自然语言处理
深度学习
语言模型
驭码CodeRider 闪电适配阿里QwQ-32B:8小时全栈集成,AI编程效率飞跃!
今日凌晨,国产大模型领域迎来重大突破:阿里正式发布32B推理模型QwQ-32B,根据
Qwen
公布的基准测试数据,QwQ-32B整体性能可媲美DeepSeek-R1,在数学推理、编程能力和通用能力等关键测试中展现出卓越性能
·
2025-03-06 22:12
git人工智能
如何从零开始训练大模型?(附AGI大模型路线图)
跟规模相对接近的2b、7b模型比,得分比
qwen
2b高,和
qwen
7b比有的高有的低。这个是minicpm的详细技术文档。https://shengdi
脱泥不tony
·
2025-03-06 21:13
agi
人工智能
产品经理
语言模型
大数据
学习
AI大模型
媲美满血R1+,刚刚,阿里推理模型QwQ-32B开源
小尺寸,不要671B,只要32B,推理门槛低QwQ-32B与其他领先模型的性能对比,包括DeepSeek-R1-Distilled-
Qwen
X.Cristiano
·
2025-03-06 17:03
深度学习
QwQ-32B
Qwen
深度学习
LangChain链与记忆处理[10]:四种基础内置链、四种文档处理链,以及链的自定义和五种运行方式,让你的大模型更加智能
链与记忆处理[10]:四种基础内置链、四种文档处理链,以及链的自定义和五种运行方式,让你的大模型更加智能参考文章可以使用国产LLM进行下述项目复现:初识langchain[1]:Langchain实战教学,利用
qwen
2.1
汀、人工智能
·
2025-03-05 03:15
AI
Agent
langchain
LangGraph
人工智能
大模型
智能问答
chain
Agent
基于Ubuntu+vLLM+NVIDIA T4高效部署DeepSeek大模型实战指南
为了解决这一难题,我们转向了官方提供的优化版本——DeepSeek-R1-Distill-
Qwen
来自于狂人
·
2025-03-05 02:01
python
人工智能
pytorch
语言模型
ollama +
qwen
2.5-coder + VS Code + Continue 实现本地AI 辅助写代码
ollama+
qwen
2.5-coder+VSCode+Continue实现本地AI辅助写代码1.下载Ollama和
qwen
2.5-coder模型1.1安装ollama方式方式一:官网下载安装文件https
不二人生
·
2025-03-04 07:15
大模型
人工智能
大模型
基于DeepSeek 的图生文最新算法 VLM-R1
具体来说,对于引用表达式理解(REC)的任务,我们使用R1和SFT方法训练了
Qwen
2.5-VL。结果表明,在域内测试数据
AI算法网奇
·
2025-03-03 18:02
深度学习宝典
大模型
人工智能
计算机视觉
llama_factory微调
QWen
1.5
GitHub-hiyouga/LLaMA-Factory:UnifyEfficientFine-Tuningof100+LLMsUnifyEfficientFine-Tuningof100+LLMs.Contributetohiyouga/LLaMA-FactorydevelopmentbycreatinganaccountonGitHub.https://github.com/hiyouga/L
Kun Li
·
2025-03-03 02:50
大语言模型
llama
qwen
大模型微调入门(Transformers + Pytorch)
down_deepseek.pyfrommodelscopeimportsnapshot_downloadmodel_dir=snapshot_download('deepseek-ai/DeepSeek-R1-Distill-
Qwen
昵称不能为null
·
2025-03-03 00:06
python
llm
机器学习
人工智能
深度学习-136-LangGraph之应用实例(五)构建RAG问答系统同时从不同的角度对比优化效果
测试调用4总结与优化4.1问题分析4.2对比不同的返回文档数4.3对比不同的嵌入模型4.3.1嵌入模型nomic-embed-text4.3.2嵌入模型bge-m34.4对比不同的大模型4.4.1大模型
qwen
2
皮皮冰燃
·
2025-03-02 23:59
深度学习
深度学习
人工智能
LangGraph
RAG
Qwen
的github主页 - 介绍
HuggingFace|ModelScope|Paper|️DemoWeChat(微信)|Discord|APIQwen-Cha
强化学习曾小健
·
2025-03-02 20:41
#
Qwen千问源码解析及介绍
LLM大语言模型
github
本地大模型编程实战(27)初探langgraph的流式输出
本次演练将全部使用
qwen
2.5:
火云牌神
·
2025-03-01 15:22
AI编程实战
langchain
agent
智能体
流式输出
LLM
[论文笔记] LLM大模型剪枝篇——2、剪枝总体方案
N=20(N:剪枝崩溃临界点,LLaMA2在45%,Mistral-7B在35%,
Qwen
在20%,Phi-2在25%)对后(P
心心喵
·
2025-03-01 04:25
论文笔记
剪枝
算法
机器学习
2.9 部署模型-大模型ACP模拟题-真题
/model/
qwen
2_5-1_5b-instruct"--port8000B.vllmserve".
admin皮卡
·
2025-02-28 17:12
阿里云大模型ACP-考试回忆
人工智能
ai
qwenvl 以及qwenvl 2 模型架构理解
qwenvl模型理解:参考资料:https://qwenlm.github.io/zh/blog/
qwen
2-vl/https://github.com/QwenLM/
Qwen
2-VLtab=readme-ov-filehttps
m0_74823239
·
2025-02-28 12:09
面试
学习路线
阿里巴巴
android
前端
后端
Ollama本地私有化部署通义千问大模型
Qwen
2.5
目录
Qwen
2.5介绍
Qwen
2.5新闻Ollama介绍Linux安装Ollama一键安装Ollama手工安装Ollama卸载OllamaOllama运行
Qwen
2基于Transformers进行推理本文复现环境
ErbaoLiu
·
2025-02-27 20:17
数据分析&大模型
机器学习&大模型
自然语言处理&大模型
大模型
LLM
Qwen2.5
Qwen2
Ollama
LangChain入门:使用Python和通义千问打造免费的
Qwen
大模型聊天机器人
前言LangChain是一个用于开发由大型语言模型(LargeLanguageModels,简称LLMs)驱动的应用程序的框架。它提供了一个灵活的框架,使得开发者可以构建具有上下文感知能力和推理能力的应用程序,这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库:Python和JavaScript库。包含了各种组件的接口和集成,一个基本的运行时,用于将这些组件组合
闯江湖50年
·
2025-02-27 20:45
langchain
python
机器人
人工智能
【AI学习】2024年末一些AI总结的摘录
从OpenAI的主导地位到Claude的异军突起,从xAI到中国的DeepSeek和
Qwen
,整个行业呈现出百花齐放的态势。让我们梳理2024年的关键进展,并展望2025年的研究方向。
bylander
·
2025-02-27 01:21
AI学习
人工智能
gpt
学习
Ollama微调
它支持多种流行的开源大语言模型,如Llama2、
Qwen
2.5等。在上一篇文章中我们部署Ollama,并使用简单命令管理Ollama。接下来我们学习Ollama的高级应用。
软件不硬
·
2025-02-26 19:08
LLM
tool
AIGC
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他