MS-Swift

推荐频道

MS-Swift

利用ms-swift微调LLaVA-OneVision

利用ms-swift微调LLaVA-OneVision资料合集环境安装目录详情训练模型下载模型准备训练(train)数据和验证集(validation)数据提前改一些小bug脚本Merged-LoRA脚本

moTcream·2025-06-23 07:16

AI大模型ms-swift框架环境准备教程

1.前言在人工智能的发展进程中，大模型已然成为各个领域实现突破与创新的核心驱动力。而swift框架作为大模型开发的得力助手，为开发者们提供了高效且便捷的工具集，让大模型开发不再是遥不可及的挑战。在上一篇文章中，我们对swift框架进行了全景式的概览，了解了其定义、背景、核心功能以及在众多应用场景中的强大潜力。现在，我们将深入到开发实践层面，为大家详细介绍如何快速入门swift框架开发，从准备工作到

AI大模型入门教程·2025-06-23 07:13

开源模型应用落地-qwen2-7b-instruct-LoRA微调-ms-swift-单机多卡-RTX 4090双卡（十四）

一、前言本篇文章将使用ms-swift去高效微调QWen2系列模型，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。

开源技术探险家·2025-05-20 00:30

千问2.5-VL-7B的推理、微调、部署_笔记2

接上篇：部署千问2.5-VL-7B_笔记1-CSDN博客这里主要记录微调过程一、模型微调这里也使用ms-swift对qwen2.5和qwen2-vl进行自我认知微调和图像OCR微调，并对微调后的模型进行推理

山山而川_R·2025-04-26 11:36

启智平台华为昇腾910B使用MS-Swift微调Janus-Pro-7/1B

最近想要微调一下DeepSeek出品的Janus多模态大模型利用启智平台的昇腾910B国产计算卡进行大模型的微调查看了一下MS-Swift支持了Janus模型的微调，LLamafactory好像暂时还不支持该模型的微调看到了

幸福回头·2025-04-09 12:52

大模型微调

编写训练脚本开始训练六，进行模型推理人工评估总结前言这是使用知乎评论进行模型微调，让模型输出更加通畅接近人的使用语言一、使用的库modelscope：提供模型、数据集下载能力data-juicer：提供数据集处理能力ms-swift

归一码字·2025-03-21 04:36

【大模型实战篇】使用GPTQ量化QwQ-32B微调后的推理模型

关于QwQ-32B微调，可以参考《利用ms-swift微

源泉的小广场·2025-03-17 21:19

ms-swift 3.x和2.x中参数不一致的暗坑

虽然ms-swift3.x发布也有一段时间官方文档也对使用上参数的变动做了一些说明ReleaseNote3.0—swift3.2.0.dev0文档但是这个说明基本上都是说某些参数的命名发生了变化对于一些参数命名没变但默认值/使用方式的变化暂时还没给出说明/统计文档我这边基于工作中遇到的一些坑，整理了部分，希望大家在使用的时候留意。注意，在这个文档里官方已给出的参数差异我在这不做赘述分析，只展示我个

Jumbo星·2025-02-27 14:29

开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机多卡-RTX 4090双卡（十五）

一、前言本篇文章将使用ms-swift去合并微调后的模型权重，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。

开源技术探险家·2025-02-12 04:50

开源模型应用落地-qwen2-7b-instruct-LoRA微调-ms-swift-单机单卡-V100（十二）

一、前言本篇文章将在v100单卡服务器上，使用ms-swift去高效微调QWen2系列模型，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。

开源技术探险家·2024-08-31 10:41

上一页 1 下一页

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他