peft

【速写】TRL：Trainer的细节与思考（PPO/DPO+LoRA可行性）

序言问题源于PPOTrainer里并没有跟SFTTrainer类似的peft_config参数，而SFTTrainer在带和不带peft_config参数的情况下分别对应高效微调和全量微调。

囚生CY·2025-06-06 07:08

【diffusers 进阶之 PEFT 入门（五）】LoRA 权重如何接着训练？踩坑总结和解决方案

系列文章目录【diffusers进阶之PEFT入门（一）】inject_adapter_in_model详解【diffusers进阶之PEFT入门（二）】LoraConfig如何处理lora_config

多恩Stone·2025-05-31 03:49

【大模型基础_毛玉仁】4.5 实践与应用--参数高效微调PEFT

目录4.5实践与应用4.5.1PEFT实践1）PEFT主流框架2）HF-PEFT框架使用3）PEFT相关技巧4.5.2PEFT应用1）表格数据查询2）表格数据分析4.5实践与应用实践部分介绍流行HuggingFace

XiaoJ1234567·2025-05-29 16:05

大模型企业落地应用方法对比：微调、RAG与MCP工具调用

需要高质量、领域特定的标注数据数据规模：根据需求从数千到数十万条不等，质量高于数量技术栈基础模型：GPT、LLaMA、Claude等大型语言模型训练框架：HuggingFaceTransformers、PEFT

热血的青春666·2025-05-13 04:15

大模型参数高效微调（PEFT）技术解析及微调加速实践

2023年，大模型如雨后春笋般爆发，58同城TEG-AILab作为AI平台部门，紧跟大语言模型技术发展步伐，打造了大语言模型平台，支持大语言模型训练和推理部署，并基于大语言模型平台构建了58同城生活服务领域（房产、招聘、汽车、黄页）垂类大模型灵犀大语言模型（ChatLing），支撑了业务方大模型应用的探索落地。灵犀大语言模型在公开评测集和实际应用场景下，效果均优于开源通用大语言模型以及商用通用大语

程序员莫玛·2025-05-07 19:15

NeurIPS‘24 Oral 大模型LoRA超级变体！HydraLoRA小参数，大作为！

随着大模型应用发展的深入，参数高效微调（PEFT）凭借定制化、精准性****等优势，成为大模型优化的热门方式，其中，LoRA引入‌低秩矩阵，实现了不输全面微调的下游适应性能，但是，增长的训练需求也带来了存储和传输成本

小敢摘葡萄·2025-05-01 18:06

大模型微调：技术迭代与实践指南

PEFT

人工智能培训咨询叶梓·2025-04-28 15:07

大模型微调综述

大模型微调技术详解前言什么是大模型微调为什么需要大模型微调大模型技术演进全景图阶段对比速查表微调分类及特点指令微调(InstructionFine-Tuning，IFT)全参数微调(FullFineTuning，FFT)参数高效微调（Parameter-EfficientFine-Tuning，PEFT

kuokay·2025-04-21 07:45

PEFT实战（二）——基于Prompt的参数高效微调

一、概念本文参考HuggingFace教程中的Prompt-based参数高效微调，探索如何基于prompt快速微调出我们的专属大模型。这篇文章中，我们将一起学习如何使用软提示方法训练因果语言模型，以应用于分类任务。我们知道，prompt提示可以描述任务或提供我们希望模型学习的任务示例。然而，软提示方法不是手动创建这些提示，而是向输入嵌入添加可学习参数，这些参数可以针对特定任务进行优化，同时保持预

CM莫问·2025-04-16 06:34

参数高效微调（PEFT）研究综述

因此，参数高效微调（Parameter-EfficientFine-Tuning,PEFT）方法逐渐受到研究者的关注。

Ender（弹射回家版）·2025-04-07 00:34

RWKV state tuning 微调教程

本文的Statetuning方法来自RWKV社区微调项目RWKV-PEFT。开始之前，请确保你拥有一个Linux工作区，以及支持CUDA的NV

RWKV元始智能·2025-04-03 07:15

NLP高频面试题（二十七）——SFT有哪几种参数微调方法？有什么优缺点？

尤其在监督微调过程中，如何选择合适的参数高效微调（Parameter-EfficientFine-Tuning，PEFT）方法成为关注重点。本文将梳理SFT中常用的几种参数微调方法及各自的优缺点。

Chaos_Wang_·2025-04-02 05:22

大模型最新面试题系列：微调篇之微调基础知识

一、全参数微调（Full-Finetune）vs参数高效微调（PEFT）对比1.显存使用差异全参数微调：需存储所有参数的梯度（如GPT-3175B模型全量微调需约2.3TB显存）PEFT：以LoRA为例

人肉推土机·2025-03-22 05:42

AI技术学习笔记系列001：FastLanguageModel.get_peft_model 函数各参数的详细解释

以下是关于代码中FastLanguageModel.get_peft_model函数各参数的详细解释，以及企业实际微调时的选择考量：参数详解及对微调的影响1.r=32（秩）作用：控制LoRA适配器的低秩矩阵的维度

新说一二·2025-03-17 00:43

大模型LLM基于PEFT的LoRA微调详细步骤---第一篇：模型下载篇

模型下载：HuggingFace官网：https://huggingface.co/----需要VPN魔搭社区：https://modelscope.cn/home----国内映射，不需要VPN写在篇始：国内关注方法一即可。其余几种都需要VPN，而且在服务器下载的速度有限~~。下一篇：微调详细流程以及环境...方法一：魔搭（modelscope）下载#需要安装pipinstallmodelscop

素雪风华·2025-03-15 08:42

微调alpaca-lora遇到的一些问题

Tensor相互计算会报错三、推理加载lora报错：SafetensorError:Errorwhiledeserializingheader:InvalidHeaderDeserialization四、peft

自学AI的鲨鱼儿·2025-02-19 05:42

大模型参数高效微调（PEFT）技术解析及微调加速实践

2023年，大模型如雨后春笋般爆发，58同城TEG-AILab作为AI平台部门，紧跟大语言模型技术发展步伐，打造了大语言模型平台，支持大语言模型训练和推理部署，并基于大语言模型平台构建了58同城生活服务领域（房产、招聘、汽车、黄页）垂类大模型灵犀大语言模型（ChatLing），支撑了业务方大模型应用的探索落地。灵犀大语言模型在公开评测集和实际应用场景下，效果均优于开源通用大语言模型以及商用通用大语

AI产品经理·2025-02-16 03:53

传统AI算法工程师转型指南：如何成功切入大模型领域赛道“

在做项目的过程中，为了节省训练成本，阅读了很多peft（参数高效微调）的文献，并且实践了lor

大模型玩家·2025-02-07 17:33

使用一个大语言模型对另一个大语言模型进行“调教”

•PEFT：用于微调，特别是LoRA（Low-RankAdaptation）等技术。•Accelerate：用

大霸王龙·2025-02-07 03:25

Transformers解决RuntimeError: element 0 of tensors does not require grad and does not have a grad_fn

解决办法：在get_peft_model之前加上：model.enable_input_require_grads()

怎么这么多名字都被占了·2025-02-05 18:06

【学习心得】Python好库推荐——PEFT

一、PEFT是什么？PEFT（Parameter-EfficientFine-Tuning）是一种在深度学习中进行参数高效微调的技术。

小oo呆·2025-02-01 06:48

增强大型语言模型（LLM）可访问性：深入探究在单块AMD GPU上通过QLoRA微调Llama 2的过程

ADeepDiveintoQLoRAThroughFine-tuningLlama2onasingleAMDGPU—ROCmBlogs基于之前的博客《使用LoRA微调Llama2》的内容，我们深入研究了一种称为量化低秩调整（QLoRA）的参数高效微调（PEFT

109702008·2025-01-22 11:35

大模型微调 - 基于预训练大语言模型的对话生成任务训练代码

importtorchfromdatasetsimportDatasetfrommodelscopeimportAutoTokenizer,AutoModelForCausalLMfrompeftimportLoraConfig,TaskType,get_peft_modelfrom

西笑生·2024-09-14 05:00

QLoRa使用教程

一、定义定义案例1二、实现定义QLoRa:量化+LoRa.网址：https://huggingface.co/docs/peft/main/en/developer_guides/quantization

云帆@·2024-09-13 03:12

LLM大模型落地-从理论到实践

学习目标熟悉主流LLM（Llama,ChatGLM,Qwen）的技术架构和技术细节；有实际应用RAG、PEFT和SFT的项目经验较强的NLP基础，熟悉BERT、T5、Transformer和GPT的实现和差异

hhaiming_·2024-09-04 01:12

大模型训练和推理

Tokenizer2.positionencoding3.注意力机制与transformer架构二、大模型训练1.SFT训练2.RLHF训练3.分布式并行训练技术（1）模型并行（2）数据并行4.MoE技术4.PEFT

李明朔·2024-08-30 01:27

大模型18：微调大模型方法PEFT(LoRA等) — 训练 “ChatGLM2“ 项目

微调大模型的方法之一是PEFT（Parameter-EfficientFine-Tuning），其中包括LoRA（Low-RankAdaptation）等技术。

bluewelkin·2024-08-27 01:38

预训练大模型LLM的微调PEFT（概述）

前言大模型现在已经不是什么新奇玩意了，大家都耳熟能详，我们都知道大模型要从头到尾的训练，需要巨大的人力物力，如此高昂的费用小公司是难以承受的，那么我们是否可以像牛顿一样，站在巨人的肩膀上，利用已经训练好的大模型进行二次训练以适用于我们自己的应用呢？回答当然是肯定的，我们只需要极少量的训练数据和资源，就能将大模型改造以适应我们的应用。微调的分类对大模型进行二次训练的操作我们通常称为微调（Fine-T

若石之上·2024-03-05 00:49

大模型训练——PEFT与LORA介绍

大模型训练中的PEFT（Parameter-EfficientFine-Tuning）与LoRA（Low-RankAdaptation）是两种重要的技术，它们在大型预训练模型的应用中发挥着重要作用。

MarkHD·2024-03-03 10:30

Hugging Face PEFT文档指南 - 第一章：开始使用

原文:PEFT文档指南-第一章：开始使用https://huggingface.co/docs/peft/indexPEFTPEFT（参数高效微调）是一个库，用于有效地将预训练的语言模型（PLMs）适应各种下游应用

Tim_Van·2024-02-20 13:28

peft库编写逻辑分析

Peft库编写逻辑分析（以LLaMa+prefix为例）Peft库加载finetune模型分析Peft生成代码importtorchfrompeftimportPeftModelfromtransformersimport

瓶子好亮·2024-02-19 15:17

ValueError: PEFT backend is required for this method.

根据异常栈发现USE_PEFT_BACKEND是False导致的ifnotUSE_PEFT_BACKEND:raiseValueError("PEFTbackendisrequiredforthismethod

半度、·2024-02-09 15:44

Scaling Laws for Forgetting When Fine-Tuning Large Language Models

我们发现，参数有效微调（PEFT）策略，如低秩适配器（LoRA），

UnknownBody·2024-02-07 16:23

【模型微调】| 各类微调模型总结 P-Tuning，Prefix，P-tuning v2，LoRA

文章目录1微调背景1.1Fullfine-tuning全参数微调（FFT）1.2parameter-Efficient-fine-tuning部分参数微调（PEFT）2提示词调整训练法2.1P-Tuning2.2Prefix2.3P-Tuningv23

Qodicat·2024-02-03 15:02

PEFT微调方式总结

PEFT微调方式总结PEFT微调方式总结PEFT介绍安装peft支持的微调方法和任务SEQ_CLSSEQ_2_SEQ_LMCAUSAL_LMTOKEN_CLS模型加载微调加载PROMPT_TUNING简介源码

江小皮不皮·2024-02-03 15:48

2024-01-06-AI 大模型全栈工程师 - 机器学习基础

a.什么是模型训练（Training）b.什么是模型预训练（Pre-Training）c.微调（Fine-Tuning）d.轻量化微调（ParameterEfficientFine-Tuning,PEFT

流雨声·2024-02-02 10:42

2024-01-06-AI 大模型全栈工程师 - 机器学习基础

a.什么是模型训练（Training）b.什么是模型预训练（Pre-Training）c.微调（Fine-Tuning）d.轻量化微调（ParameterEfficientFine-Tuning,PEFT

流雨声·2024-02-02 07:06

对小工蚁关于LLM的技术总结+个人思考

1.blog/trl-peft.mdatmain·huggingface/blog·GitHub2.基于强化学习的微调（这个挺好）微软发布的文本生成增强框架DTG,让LLM主动思考和生成能力提升[2305.1

河南-殷志强·2024-01-27 02:57

LLM-大模型训练-常见错误：RuntimeError: expected scalar type Half but found Float

RuntimeError:expectedscalartypeHalfbutfoundFloat原因一Peft版本不兼容，尝试使用不同版本的Peft原因二1.问题描述使用GPUV100(32GB)对

u013250861·2024-01-26 11:52

大模型参数高效微调技术原理综述

参数高效微调（Parameter-EfficientFine-tuning，PEFT）是一种新型的微调方法，旨在减少微调过程中

百度_开发者中心·2024-01-24 15:11

使用PEFT微调ChatGLM3-6B

系列文章目录该系列文章用于介绍使用peft库来进行大模型的微调第一章使用PEFT对ChatGLM3-6B进行LORA微调文章目录系列文章目录前言一、准备工作1.环境准备2.大模型准备：3.数据准备二、数据集准备和训练

saoqi_boy·2024-01-21 13:53

【llm 微调code-llama 训练自己的数据集一个小案例】

这也是一个通用的方案，使用peft微调LLM。

放飞自我的Coder·2024-01-21 13:33

【LLMs 入门实战】基于 PEFT 在私有数据集上高效微调ChatGLM2-6B

原文链接【LLMs入门实战】基于PEFT在私有数据集上高效微调ChatGLM2-6B-知乎本次微调是基于github的hiyouga/ChatGLM-Efficient-Tuning项目进行微调的。

baidu_huihui·2024-01-15 15:09

大模型入门（四）—— 基于peft 微调 LLaMa模型

https://www.cnblogs.com/jiangxinyang/p/17330352.htmlllama-7b模型大小大约27G，本文在单张/两张16GV100上基于huggingface的peft

baidu_huihui·2024-01-15 15:09

关于lora的理解

参考：【OpenLLM007】大模型炼丹术之小参数撬动大模型-万字长文全面解读PEFT参数高效微调技术-知乎(zhihu.com)图解大模型微调系列之：大模型低秩适配器LoRA（原理篇）-知乎(zhihu.com

wozwdaqian·2024-01-13 04:39

LLaMA-Factory添加adalora

LLaMA-Efficient-Tuning/commit/f3a532f56b4aa7d4200f24d93fade4b2c9042736和https://github.com/huggingface/peft

wozwdaqian·2024-01-13 04:36

大模型PEFT技术原理（一）：BitFit、Prefix Tuning、Prompt Tuning

随着预训练模型的参数越来越大，尤其是175B参数大小的GPT3发布以来，让很多中小公司和个人研究员对于大模型的全量微调望而却步，近年来研究者们提出了各种各样的参数高效迁移学习方法（Parameter-efficientTransferLearning），即固定住PretrainLanguagemodel（PLM）的大部分参数，仅调整模型的一小部分参数来达到与全部参数的微调接近的效果（调整的可以是模

wshzd·2024-01-13 00:29

@关于大模型的基础知识

微调和评估四大部分文章目录从大模型的训练说起大模型的基础调用大模型：例如调用llama2模型微调大模型从大模型的训练说起大模型的基础transformerself-attention调用大模型：例如调用llama2模型微调大模型peft

专心研究·2024-01-10 19:38

关于生成式语言大模型的一些工程思考 paddlenlp & chatglm & llama

更新了以下特性：全面支持主流开源大模型Bloom,ChatGLM,GLM,Llama,OPT的训练和推理；TrainerAPI新增张量训练能力,简单配置即可开启分布式训练；新增低参数微调能力PEFT,助力大模型高效微调

路人与大师·2024-01-09 02:57

PEFT: 在低资源硬件上对十亿规模模型进行参数高效微调

1引言最近，深度学习的研究中出现了许多大型预训练模型，例如GPT-3、BERT等，这些模型可以在多种自然语言处理任务中取得优异的性能表现。而其中，ChatGPT模型因为在对话生成方面的表现而备受瞩目，成为了自然语言处理领域的热门研究方向。然而，这些大型预训练模型的训练成本非常高昂，需要庞大的计算资源和大量的数据，一般人难以承受。这也导致了一些研究人员难以重复和验证先前的研究成果。为了解决这个问题，

智慧医疗探索者·2024-01-07 10:06

推荐频道

peft

【速写】TRL：Trainer的细节与思考（PPO/DPO+LoRA可行性）

【diffusers 进阶之 PEFT 入门（五）】LoRA 权重如何接着训练？踩坑总结和解决方案

【大模型基础_毛玉仁】4.5 实践与应用--参数高效微调PEFT

大模型企业落地应用方法对比：微调、RAG与MCP工具调用

大模型参数高效微调（PEFT）技术解析及微调加速实践

NeurIPS‘24 Oral 大模型LoRA超级变体！HydraLoRA小参数，大作为！

大模型微调：技术迭代与实践指南

大模型微调综述

PEFT实战（二）——基于Prompt的参数高效微调

参数高效微调（PEFT）研究综述

RWKV state tuning 微调教程

NLP高频面试题（二十七）——SFT有哪几种参数微调方法？有什么优缺点？

大模型最新面试题系列：微调篇之微调基础知识

AI技术学习笔记系列001：FastLanguageModel.get_peft_model 函数各参数的详细解释

大模型LLM基于PEFT的LoRA微调详细步骤---第一篇：模型下载篇

微调alpaca-lora遇到的一些问题

大模型参数高效微调（PEFT）技术解析及微调加速实践

传统AI算法工程师转型指南：如何成功切入大模型领域赛道“

使用一个大语言模型对另一个大语言模型进行“调教”

Transformers解决RuntimeError: element 0 of tensors does not require grad and does not have a grad_fn

【学习心得】Python好库推荐——PEFT

增强大型语言模型（LLM）可访问性：深入探究在单块AMD GPU上通过QLoRA微调Llama 2的过程

大模型微调 - 基于预训练大语言模型的对话生成任务 训练代码

QLoRa使用教程

LLM大模型落地-从理论到实践

大模型训练和推理

大模型18：微调大模型方法PEFT(LoRA等) — 训练 “ChatGLM2“ 项目

预训练大模型LLM的微调PEFT（概述）

大模型训练——PEFT与LORA介绍

Hugging Face PEFT文档指南 - 第一章：开始使用

peft库编写逻辑分析

ValueError: PEFT backend is required for this method.

Scaling Laws for Forgetting When Fine-Tuning Large Language Models

【模型微调】| 各类微调模型总结 P-Tuning，Prefix，P-tuning v2，LoRA

PEFT微调方式总结

2024-01-06-AI 大模型全栈工程师 - 机器学习基础

2024-01-06-AI 大模型全栈工程师 - 机器学习基础

对小工蚁关于LLM的技术总结+个人思考

LLM-大模型训练-常见错误：RuntimeError: expected scalar type Half but found Float

大模型参数高效微调技术原理综述

使用PEFT微调ChatGLM3-6B

【llm 微调code-llama 训练自己的数据集 一个小案例】

【LLMs 入门实战】基于 PEFT 在私有数据集上高效微调ChatGLM2-6B

大模型入门（四）—— 基于peft 微调 LLaMa模型

关于lora的理解

LLaMA-Factory添加adalora

大模型PEFT技术原理（一）：BitFit、Prefix Tuning、Prompt Tuning

@关于大模型的基础知识

关于生成式语言大模型的一些工程思考 paddlenlp & chatglm & llama

PEFT: 在低资源硬件上对十亿规模模型进行参数高效微调

大模型微调 - 基于预训练大语言模型的对话生成任务训练代码

【llm 微调code-llama 训练自己的数据集一个小案例】