Tuning 第2页

LLM系列(3)：探索大模型RLHF优化之道：DeepSpeed-Chat超快速入门，对齐训练精度提升一步到位

学术界对此也进行了一定的研究，如PromptTuning的技术等（不调试原始大模型，只调试相关的Prompt）。最近微软做了一个Deepspe

汀、人工智能·2024-09-07 04:18

百篇论文博文导航AI工程之路：FT、KG、RAG与Agent技术全方位探索

百篇论文博文导航AI工程之路：FT、KG、RAG与Agent技术全方位探索1.FTScalingDowntoScaleUp:AGuidetoParameter-EfficientFine-Tuning：

汀、人工智能·2024-09-06 12:00

【大模型】Agent基础知识

SynergizingReasoningandActinginLanguageModels2.2Reflection2.3LATS:LanguageAgentsTreeSearch3.微调3.1全模型微调（FullModelFine-Tuning

idiotyi·2024-09-03 19:32

深度解析：大模型微调的原理、应用与实践

我的结论是在实际落地的过程中绝大多数场景是不需要做的，所以今天主要跟大家分享一下什么是Fine-tuning、Fine-tuning的原理以及Fine-tuning的应用，以帮助大家在工作中更好的理解大模型微调

longfei.li·2024-09-01 22:56

CLIP-Adapter: Better Vision-Language Models with Feature Adapters

对比语言图像预训练（CLIP）虽然prompt-tuning用于textualinputs，但是建议CLIPAdapter在视觉或语言分支上使用功能适配器进行fine-tuneCLIPAdapter采用了一个额外的瓶颈层来学习新的特征

Tsukinousag·2024-09-01 19:22

MasaCtrl:Tuning-free mutual self-attention control for consistent image synthesis and editing

https://github.com/TencentARC/MasaCtrl/issues/13https://github.com/TencentARC/MasaCtrl/issues/13QuestionaboutMask·Issue#31·TencentARC/MasaCtrl·GitHub

Kun Li·2024-08-30 21:38

Code Llama: Open Foundation Models for Code论文阅读

作者针对infilling(FIM)、长上下文、指令专门做了微调long-contextfine-tuning(LCFT).codellama细节CodeLlama模型家族初始化:所有CodeLla

yang_daxia·2024-08-27 18:46

大模型18：微调大模型方法PEFT(LoRA等) — 训练 “ChatGLM2“ 项目

微调大模型的方法之一是PEFT（Parameter-EfficientFine-Tuning），其中包括LoRA（Low-RankAdaptation）等技术。

bluewelkin·2024-08-27 01:38

大模型19：微调大模型方法

有监督微调（SFT）、奖励模型（RM）训练，以及基于人类反馈的强化学习（RLHF）训练1.有监督微调（SFT-SupervisedFine-Tuning）数据处理数据收集：首先，需要收集大量的对话数据。

bluewelkin·2024-08-27 01:38

大模型微调方法总结：LoRA、Adapter、Prefix-tuning、P-tuning、Prompt-tuning

然而，微调（finetuning）这些大模型以适应特定任务是一个复杂且计算密集型的过程。

百度_开发者中心·2024-08-26 19:14

Prompt-Tuning：大模型微调技术

本文将重点介绍一些常见的大模型微调技术，包括Adapter-Tuning、Prefix-Tuning、

百度_开发者中心·2024-08-26 19:14

大模型微调技术（Adapter-Tuning、Prefix-Tuning、Prompt-Tuning(P-Tuning)、P-Tuning v2、LoRA）_adapter微调 p tuning

2022年11月30日，ChatGPT发布至今，国内外不断涌现出了不少大模型，呈现“百模大战”的景象，比如ChatGLM-6B、LLAMA、Alpaca等模型及在此模型基础上进一步开发的特定领域的大模型。今年3月15日，GPT-4发布后，也出现了一些多模态的大模型，比如百度的文心一言、讯飞星火认知大模型等等。要想训练一个针对特定领域的大模型，如果采用全量参数微调（FullParameterFutu

Cc不爱吃洋葱·2024-08-26 19:12

Rocksdb Tuning

Rocksdb配置选项尤其繁多，想要获得真正的高性能，需要进行详细的调优，这是项复杂的工作，需要在实践中积累经验：https://www.jianshu.com/p/8e0018b6a8b6https://cloud.tencent.com/developer/article/2329992调优RocksDB通常就是在三个amplification之间做取舍：Writeamplification-

MOONICK·2024-08-24 06:25

大模型应用中什么是SFT（监督微调）？

一、SFT的基本概念监督微调（SupervisedFine-Tuning,SFT）是对已经预训练的模型进行特定任务的训练，以提高其在该任务上的表现。

Chauvin912·2024-08-22 04:47

AI推介-大语言模型LLMs论文速览（arXiv方向）：2024.02.20-2024.02.25

论文目录~1.Zero-shotcross-lingualtransferininstructiontuningoflargelanguagemodel2.ScalingEfficientLLMs3.LLM-DA

小小帅AIGC·2024-03-26 20:39

AI推介-大语言模型LLMs论文速览（arXiv方向）：2024.02.25-2024.03.01

ArithmeticControlofLLMsforDiverseUserPreferences:DirectionalPreferenceAlignmentwithMulti-ObjectiveRewards2.KeepingLLMsAlignedAfterFine-tuning

小小帅AIGC·2024-03-06 03:25

大模型训练——PEFT与LORA介绍

大模型训练中的PEFT（Parameter-EfficientFine-Tuning）与LoRA（Low-RankAdaptation）是两种重要的技术，它们在大型预训练模型的应用中发挥着重要作用。

MarkHD·2024-03-03 10:30

学习笔记：使用 Amazon Bedrock 进行图像生成

亚马逊云科技此次为其大模型托管服务引入了Fine-tuning、Agents、KnowledgeBases和Guardrails等一系列创新功能。

·2024-02-19 16:07

预训练和微调在迁移学习中的作用

在机器学习和深度学习中，"pre-training"（预训练）和"fine-tuning"（微调）是两个常见且重要的概念，它们通常在迁移学习场景中使用，以提高模型在特定任务上的性能。

一条小小yu·2024-02-19 12:42

大模型微调大杂烩知识总结

1.前缀微调（Prefix-Tuning）前缀微调是一种针对预训练模型的微调方法，通过在模型输入前添加特定任务相关的连续前缀表示，从而引导模型生成适应特定任务的输出。

lichunericli·2024-02-15 09:56

Prompt Tuning：深度解读一种新的微调范式

相比传统fine-tuning有什么优势？自20年底开始，prompt的发展历程，哪些经典的代表方法？面向不同种类NLP任务，prompt如何选择和设计？

lichunericli·2024-02-15 09:55

ACK Timeout 相关论文

AReal-TimeUpdatingAlgorithmofRTS-CTSThresholdtoEnhanceEDCAMACPerformanceinIEEE802.11eWirelessLANs》Timeout论文中《RTSThresholdSelf-TuningAlgorithmBasedonDelayAnalysison802.11DCF

小超超爱超超·2024-02-14 18:41

大模型推理优化实践：KV cache 复用与投机采样

RTP-LLM还支持包括多模态、LoRA、P-Tuning、以及WeightOnly动态量化等

阿里技术·2024-02-12 15:01

大语言模型ChatGLM + P-Tuning微调实践

大语言模型ChatGLM+P-Tuning微调实践文章目录大语言模型ChatGLM+P-Tuning微调实践LLM微调基础本次实践环境说明ChatGLM部署以及激活conda环境安装依赖禁用W&B训练数据集

North_D·2024-02-12 13:59

小周带你正确理解Prompt-engineering,RAG,fine-tuning工程化的地位和意义

有人会说："小周，几天不见这么拉了，现在别说算法了，连code都不讲了，整上方法论了。"我并没有拉！而且方法论很重要，尤其工程化的时候，你总得知道每种技术到底适合干啥，其实主要是现实中，我在项目里发现大家对这块其实并不是分的很清楚。所以我来给大家捋一捋，因为这毕竟直接取决于你设计的解决方案是否能真正解决问题如上图所示，OpenAI把对于优化LLM返回结果分为两个方向，一个方向是横坐标系的对LLM模

周博洋K·2024-02-12 13:54

小周带你正确理解Prompt-engineering,RAG,fine-tuning工程化的地位和意义

有人会说："小周，几天不见这么拉了，现在别说算法了，连code都不讲了，整上方法论了。"我并没有拉！而且方法论很重要，尤其工程化的时候，你总得知道每种技术到底适合干啥，其实主要是现实中，我在项目里发现大家对这块其实并不是分的很清楚。所以我来给大家捋一捋，因为这毕竟直接取决于你设计的解决方案是否能真正解决问题如上图所示，OpenAI把对于优化LLM返回结果分为两个方向，一个方向是横坐标系的对LLM模

周博洋K·2024-02-12 13:22

VLM 系列——LLaVA-MoLE——论文解读

Llava-MoLE是Llava1.5的改进全称《LLaVA-MoLE:SparseMixtureofLoRAExpertsforMitigatingDataConflictsinInstructionFinetuningMLLMs

TigerZ*·2024-02-12 06:37

全世界 LoRA 训练脚本，联合起来!

来自社区的SD-XLDreamboothLoRA微调最佳实践指南太长不看版我们把Replicate在SDXLCog训练器中使用的枢轴微调(PivotalTuning)技术与Kohya训练器中使用的Prodigy

·2024-02-11 18:48

EM : Process XXX appears to be hung in Auto SQL Tuning task

董董-酱·2024-02-11 10:34

这里的*号实际表示就是RAC中所有实例都使用

您的位置:ITPUB个人空间»cc59的个人空间»日志发布新日志我的日志我的足迹我的收藏unix/linuxHA随笔backup&restoreperformancetuningTroubleshootConcepts

weixin_30732487·2024-02-11 10:34

Tuning using the Alert log File

TheAlertlogfilecontainsthefollowinginformationwhichcanbeusedintuningthedatabase:Checkpointstartandendtimes.IncompletecheckpointsTimetoperformarchivingCrashrecoverystartandcompletetimes.egg

weixin_30875157·2024-02-11 10:34

appears to be hung in Auto SQL Tuning task

appearstobehunginAutoSQLTuningtaskOracle自动定时优化任务执行失败分析错误现象：SatFeb1003:10:572024Process0x0x00007FFB81BE44A8appearstobehunginAutoSQLTuningtaskCurrenttime

夹心饼2024·2024-02-11 10:03

Process 0x%p appears to be hung in Auto SQL Tuning task“

数据库版本：11.2.0.4操作系统：Windowsserver2012问题现象：企业微信收到如下告警：EMCC数据库告警信息，请注意!!!名称:xxxxxx告警主机:1xxxxx主机类型:DatabaseInstance告警信息:Operationalerror(Process0x0x000...)detectedinD:APPADMINalertlog.xmlattime/linenumber

夹心饼2024·2024-02-11 10:03

大模型基础理论学习笔记——大模型适配

本文目录7.大模型适配7.1大模型适配基础要素7.2当前主流大模型适配方法7.2.1探针方法（Probing）（1）探针方法介绍（2）基于probing的大模型适配7.2.2微调方法（Fine-tuning

maximejia·2024-02-10 09:51

[算法前沿]--059-大语言模型Fine-tuning踩坑经验之谈

然后再对模型进行finetuning来更好满足自己的下游

三更科技公社·2024-02-09 17:20

自然语言学习nlp 六

p=118DeltaTuning，尤其是在自然语言处理（NLP）和机器学习领域中，通常指的是对预训练模型进行微调的一种策略。

wangqiaowq·2024-02-09 12:46

（2024，低比特模型量化，模型微调，QuEST，TAQuant）QuEST：通过高效选择性微调进行低比特扩散模型量化

QuEST:Low-bitDiffusionModelQuantizationviaEfficientSelectiveFinetuning公和众和号：EDPJ（进Q交流群：922230617或加VX：

EDPJ·2024-02-08 20:49

Scaling Laws for Forgetting When Fine-Tuning Large Language Models

本文是LLM系列文章，针对《ScalingLawsforForgettingWhenFine-TuningLargeLanguageModels》的翻译。

UnknownBody·2024-02-07 16:23

《AI 大模型全栈工程师》学习笔记1 - 大模型应用的技术架构

大模型应用的技术架构2.1Prompt-Response架构2.2Agent+FunctionCalling架构2.3RAG（Retrieval-AugmentedGeneration）架构2.4Fine-tuning

coffee_baba·2024-02-07 09:37

【自然语言处理】微调 Fine-Tuning 各种经典方法的概念汇总

【自然语言处理】微调Fine-Tuning各种经典方法的概念汇总前言请看此微调Fine-TuningSFT监督微调（SupervisedFine-Tuning）概念：监督学习，无监督学习，自监督学习，半监督学习

溢流眼泪·2024-02-07 07:11

全世界 LoRA 训练脚本，联合起来!

我们把Replicate在SDXLCog训练器中使用的枢轴微调(PivotalTuning)技术与Kohya训练器中使用的Prodigy优化器相结合，再加上一堆其他优化，一起对SDXL进行DreamboothLoRA

工业甲酰苯胺·2024-02-07 06:28

相机图像质量概述

前言：对很多刚入行做cameratuning的小伙伴来说，可能对图像质量还不是很了解，包括我自己刚开始接触这一行的时候也是一样，不清楚ISP是什么，为什么要调它，影响画质的因素又有哪些，哪些是ISP能调的

木东·2024-02-06 10:59

【人工智能】Fine-tuning 微调：解析深度学习中的利器(7)

在深度学习领域，Fine-tuning微调是一项重要而强大的技术，它为我们提供了在特定任务上充分利用预训练模型的途径。

魔道不误砍柴功·2024-02-06 10:24

Linux 性能调优之文件系统调优(Tuning file system utilization)

山河已无恙·2024-02-06 08:47

【机器学习与自然语言处理】预训练 Pre-Training 各种经典方法的概念汇总

【NLP概念合集：一】预训练Pre-Training，微调Fine-Tuning及其方法的概念区别前言请看此正文预训练Pre-Training无监督学习unsupervisedlearning概念：标签

溢流眼泪·2024-02-06 07:18

GPT-1, GPT-2, GPT-3, GPT-3.5, GPT-4论文内容解读

1.1whatischatGPT1.2HowdoesChatGPTwork1.3TheapplicationsofChatGPT1.3ThelimitationsofChatGPT2算法原理2.1GPT-12.1.1Unsupervisedpre-training2.1.2Supervisedfine-tuning2.1.3

BGoodHabit·2024-02-06 06:36

一文辨析清楚LORA、Prompt Tuning、P-Tuning、Adapter 、Prefix等大模型微调方法

本文探讨了大模型微调的核心概念和方法，详细介绍了如LoRA、AdapterTuning、PrefixTuning等多种微调策略。

深度学习算法与自然语言处理·2024-02-05 05:45

预训练

在CV和NLP领域，pretraining+finetuning是常用手段。而在推荐实际应用中，预训练也有一定的作用。

shudaxu·2024-02-05 02:28

【LLM】提示工程技术提炼精华分享

提示工程相比较于微调（Fine-tuning）的成本和复杂度更低，但是不能对模型本身的能力进行优化，只能基于模型已有能力进行应用。二、基

液态不合群·2024-02-04 21:48

From LLM to Conversational Agent: A Memory Enhanced Architecture with Fine-Tuning of LLM

本文是LLM系列文章，针对《FromLLMtoConversationalAgent:AMemoryEnhancedArchitecturewithFine从LLM到会话代理：一种对大型语言模型进行微调的内存增强体系结构摘要1引言2代理框架3代理调整4实验5相关工作6结论与未来工作摘要本文介绍了RAISE（ReasoningandActingthroughScratchpadandExamples

UnknownBody·2024-02-04 16:16

推荐频道

Tuning

LLM系列(3)：探索大模型RLHF优化之道：DeepSpeed-Chat超快速入门，对齐训练精度提升一步到位

百篇论文博文导航AI工程之路：FT、KG、RAG与Agent技术全方位探索

【大模型】Agent基础知识

深度解析：大模型微调的原理、应用与实践

CLIP-Adapter: Better Vision-Language Models with Feature Adapters

MasaCtrl:Tuning-free mutual self-attention control for consistent image synthesis and editing

Code Llama: Open Foundation Models for Code论文阅读

大模型18：微调大模型方法PEFT(LoRA等) — 训练 “ChatGLM2“ 项目

大模型19：微调大模型方法

大模型微调方法总结：LoRA、Adapter、Prefix-tuning、P-tuning、Prompt-tuning

Prompt-Tuning：大模型微调技术

大模型微调技术（Adapter-Tuning、Prefix-Tuning、Prompt-Tuning(P-Tuning)、P-Tuning v2、LoRA）_adapter微调 p tuning

Rocksdb Tuning

大模型应用中什么是SFT（监督微调）？

AI推介-大语言模型LLMs论文速览（arXiv方向）：2024.02.20-2024.02.25

AI推介-大语言模型LLMs论文速览（arXiv方向）：2024.02.25-2024.03.01

大模型训练——PEFT与LORA介绍

学习笔记：使用 Amazon Bedrock 进行图像生成

预训练和微调在迁移学习中的作用

大模型微调大杂烩知识总结

Prompt Tuning：深度解读一种新的微调范式

ACK Timeout 相关论文

大模型推理优化实践：KV cache 复用与投机采样

大语言模型ChatGLM + P-Tuning微调实践

小周带你正确理解Prompt-engineering,RAG,fine-tuning工程化的地位和意义

小周带你正确理解Prompt-engineering,RAG,fine-tuning工程化的地位和意义

VLM 系列——LLaVA-MoLE——论文解读

全世界 LoRA 训练脚本，联合起来!

EM : Process XXX appears to be hung in Auto SQL Tuning task

﻿﻿这里的*号实际表示就是RAC中所有实例都使用

Tuning using the Alert log File

appears to be hung in Auto SQL Tuning task

Process 0x%p appears to be hung in Auto SQL Tuning task“

大模型基础理论学习笔记——大模型适配

[算法前沿]--059-大语言模型Fine-tuning踩坑经验之谈

自然语言学习nlp 六

（2024，低比特模型量化，模型微调，QuEST，TAQuant）QuEST：通过高效选择性微调进行低比特扩散模型量化

Scaling Laws for Forgetting When Fine-Tuning Large Language Models

《AI 大模型全栈工程师》学习笔记1 - 大模型应用的技术架构

【自然语言处理】微调 Fine-Tuning 各种经典方法的概念汇总

全世界 LoRA 训练脚本，联合起来!

相机图像质量概述

【人工智能】Fine-tuning 微调：解析深度学习中的利器(7)

Linux 性能调优之文件系统调优(Tuning file system utilization)

【机器学习与自然语言处理】预训练 Pre-Training 各种经典方法的概念汇总

GPT-1, GPT-2, GPT-3, GPT-3.5, GPT-4论文内容解读

一文辨析清楚LORA、Prompt Tuning、P-Tuning、Adapter 、Prefix等大模型微调方法

预训练

【LLM】提示工程技术提炼精华分享

From LLM to Conversational Agent: A Memory Enhanced Architecture with Fine-Tuning of LLM

这里的*号实际表示就是RAC中所有实例都使用