E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
MS-Swift
利用
ms-swift
微调LLaVA-OneVision
利用
ms-swift
微调LLaVA-OneVision资料合集环境安装目录详情训练模型下载模型准备训练(train)数据和验证集(validation)数据提前改一些小bug脚本Merged-LoRA脚本
moTcream
·
2025-06-23 07:16
人工智能
AIGC
AI大模型
ms-swift
框架环境准备教程
1.前言在人工智能的发展进程中,大模型已然成为各个领域实现突破与创新的核心驱动力。而swift框架作为大模型开发的得力助手,为开发者们提供了高效且便捷的工具集,让大模型开发不再是遥不可及的挑战。在上一篇文章中,我们对swift框架进行了全景式的概览,了解了其定义、背景、核心功能以及在众多应用场景中的强大潜力。现在,我们将深入到开发实践层面,为大家详细介绍如何快速入门swift框架开发,从准备工作到
AI大模型入门教程
·
2025-06-23 07:13
人工智能
swift
开发语言
深度学习
开源
机器学习
开源模型应用落地-qwen2-7b-instruct-LoRA微调-ms-swift-单机多卡-RTX 4090双卡(十四)
一、前言本篇文章将使用
ms-swift
去高效微调QWen2系列模型,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。
开源技术探险家
·
2025-05-20 00:30
开源模型-实际应用落地
#
开源模型-微调实战密码
自然语言处理
深度学习
语言模型
千问2.5-VL-7B的推理、微调、部署_笔记2
接上篇:部署千问2.5-VL-7B_笔记1-CSDN博客这里主要记录微调过程一、模型微调这里也使用
ms-swift
对qwen2.5和qwen2-vl进行自我认知微调和图像OCR微调,并对微调后的模型进行推理
山山而川_R
·
2025-04-26 11:36
视觉大模型_1
笔记
启智平台华为昇腾910B使用
MS-Swift
微调Janus-Pro-7/1B
最近想要微调一下DeepSeek出品的Janus多模态大模型利用启智平台的昇腾910B国产计算卡进行大模型的微调查看了一下
MS-Swift
支持了Janus模型的微调,LLamafactory好像暂时还不支持该模型的微调看到了
幸福回头
·
2025-04-09 12:52
LLM
MS-Swift
人工智能
大模型微调
编写训练脚本开始训练六,进行模型推理人工评估总结前言这是使用知乎评论进行模型微调,让模型输出更加通畅接近人的使用语言一、使用的库modelscope:提供模型、数据集下载能力data-juicer:提供数据集处理能力
ms-swift
归一码字
·
2025-03-21 04:36
人工智能
【大模型实战篇】使用GPTQ量化QwQ-32B微调后的推理模型
关于QwQ-32B微调,可以参考《利用
ms-swift
微
源泉的小广场
·
2025-03-17 21:19
大模型
大模型量化
推理模型量化
量化
qwq32b
gptq量化
大模型推理
性能调优
ms-swift
3.x和2.x中参数不一致的暗坑
虽然ms-swift3.x发布也有一段时间官方文档也对使用上参数的变动做了一些说明ReleaseNote3.0—swift3.2.0.dev0文档但是这个说明基本上都是说某些参数的命名发生了变化对于一些参数命名没变但默认值/使用方式的变化暂时还没给出说明/统计文档我这边基于工作中遇到的一些坑,整理了部分,希望大家在使用的时候留意。注意,在这个文档里官方已给出的参数差异我在这不做赘述分析,只展示我个
Jumbo星
·
2025-02-27 14:29
swift
开发语言
ios
开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机多卡-RTX 4090双卡(十五)
一、前言本篇文章将使用
ms-swift
去合并微调后的模型权重,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。
开源技术探险家
·
2025-02-12 04:50
开源模型-实际应用落地
#
开源模型-微调实战密码
自然语言处理
深度学习
语言模型
开源模型应用落地-qwen2-7b-instruct-LoRA微调-ms-swift-单机单卡-V100(十二)
一、前言本篇文章将在v100单卡服务器上,使用
ms-swift
去高效微调QWen2系列模型,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。
开源技术探险家
·
2024-08-31 10:41
开源模型-实际应用落地
#
深度学习
语言模型
自然语言处理
上一页
1
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他