tuning 第4页

Training language models to follow instructions with human feedback

文章使用fine-tuningwithhumanfeedback方法将语言模型与用户意图在一系列对齐。首先收集标注者对于理想模型行为的演示用于微调GPT-3（监督学习），然后收集对于模型输出

qq_43901463·2024-01-11 06:27

LLM调研笔记

这里写目录标题LLM调研1.外挂知识库2.微调数据prompting和fine-tuning的对比3.NLP的发展4.大语言模型的涌现能力5.大模型的几个关键技术6.数据预处理7.主流架构8.模型训练9

国家一级假勤奋大学生·2024-01-10 07:24

LLaMA Efficient Tuning

文章目录LLaMAEfficientTuning安装数据准备浏览器一体化界面单GPU训练train_bash1、预训练pt2、指令监督微调sft3、奖励模型训练rm4、PPO训练ppo5、DPO训练dpo

小田_·2024-01-10 07:22

raw （1）_问题处理

#灵感#raw图质量是cameratuning的第一步，当排查一些图像质量问题时，总要抓raw分析一下。罗列一些遇到的问题和解决方案。

search7·2024-01-09 22:59

抛弃模板，一种Prompt Learning用于命名实体识别任务的新范式

©原创作者|王翔论文名称：Template-freePromptTuningforFew-shotNER文献链接：https://arxiv.org/abs/2109.1353201前言1.论文的相关背景

NLP论文解读·2024-01-09 21:44

GraphGPT： Graph Instruction Tuning for Large Language Models

GraphGPT：GraphInstructionTuningforLargeLanguageModels基本信息博客贡献人猪八戒作者JiabinTang,YuhaoYang,WeiWei[单位]香港大学数据智能实验室摘要图神经网络

图学习小组·2024-01-09 20:27

吴恩达深度学习笔记(50)-超参数训练的实践

超参数训练的实践：PandasVSCaviar（Hyperparameterstuninginpractice:Pandasvs.Caviar）到现在为止，你已经听了许多关于如何搜索最优超参数的内容，在结束我们关于超参数搜索的讨论之前

极客Array·2024-01-09 05:56

【AI视野·今日NLP 自然语言处理论文速览第七十期】Thu, 4 Jan 2024

自然语言处理论文速览Thu,4Jan2024Totally29papers上期速览✈更多精彩请移步主页DailyComputationandLanguagePapersMultilingualInstructionTuningWithJustaPinchofMultilingualityAuthorsUriShaham

hitrjj·2024-01-08 13:36

[zz]TVM之神经网络Auto-Tuning

这篇文章值得一读，对于搞神经网络性能优化的同学来说，很有价值：(http://closure11.com/%E5%85%B6%E4%BB%96/2018/12/20/TVM%E4%B9%8BAuto-Tuning

crazyhank·2024-01-07 18:02

大模型的实践应用16-一种针对大型预训练模型的微调技巧：Adapter-Tuning方法的实战应用，原理详细介绍

大家好，我是微学AI，今天给大家介绍一下大模型的实践应用16-一种针对大型预训练模型的微调技巧：Adapter-Tuning方法的实战应用，原理详细介绍。

微学AI·2024-01-07 13:44

RAG实战案例：如何基于 LangChain 实现智能检索生成系统

微调（Fine-tuning）与检索增强生成（Retrieval-AugmentedGeneration，简称RAG）两种方法各有千秋，且都对此问题有着不可忽视的贡献。

技术狂潮AI·2024-01-07 12:38

TensorRT优化部署（一）--TensorRT和ONNX基础

TensorRT优化部署（三）------ONNX注册算子文章目录TensorRT部署优化前言一、模型部署目的二、TensorRT的模块2.1Layerfusion(层融合）2.2Kernelauto-tuning2.3Quantization

小豆包的小朋友0217·2024-01-07 10:07

论文解读：P-Tuning v2: Prompt Tuning Can BeComparable to Fine-tuning Universally Across Scales and Tasks

论文提出了一个新的经验发现，即适当优化的prompttuning可以在广泛的模型规模和NLU任务中普遍有效。它与微调的性能相匹配，同时只有0.

智慧医疗探索者·2024-01-07 10:35

公开课：Performance tuning in databend | Vol. 24

01《Performancetuningindatabend》分享主题：Performancetuningindatabend|Vol.24分享时间：周四晚上2021-12-1620:30-21:30分享讲师

Databend·2024-01-06 21:23

【AI】一文读懂大模型套壳——神仙打架？软饭硬吃？

目录一、套壳的风波此起彼伏二、到底什么是大模型的壳2.1大模型的3部分，壳指的是哪里大模型的内核预训练（Pre-training）调优（Fine-tuning）2.2内核的发展历程和万流归宗2.3套壳不是借壳三

giszz·2024-01-06 04:47

【AI视野·今日Sound 声学论文速览第三十九期】Tue, 2 Jan 2024

CS.Sound声学论文速览Tue,2Jan2024Totally7papers上期速览✈更多精彩请移步主页DailySoundPapersEnhancingPre-trainedASRSystemFine-tuningforDysarthricSpeechRecognitionusingAdversarialDataAugmentationAuthorsHuimengWang

hitrjj·2024-01-06 03:47

【AI视野·今日Robot 机器人论文速览第六十六期】Tue, 31 Oct 2023

今日CS.Robotics机器人学论文速览Tue,31Oct2023Totally39papers上期速览✈更多精彩请移步主页DailyRoboticsPapersDEFT:DexterousFine-TuningforReal-WorldHandPoliciesAuthorsAdityaKannan

hitrjj·2024-01-06 03:46

AIGC（生成式AI）试用 16 -- 续1，调优和提示词

FinetuningandPrompt调优和提示词1.生成式AI定义：与AI模型

Rolei_zl·2024-01-05 22:44

自然语言转SQL，一个微调ChatGPT3.5的实例(下)--模型微调及模型性能

下一步是使用以下命令将创建的文件上传到OpenAI：openai.api_key=os.getenv("OPENAI_API_KEY")print(openai.File.create(file=open("spider-finetuning.jsonl

数大招疯·2024-01-05 08:01

20、Finetuning

PEFT（Parameter-EfficientFine-Tuning）是huggingface开源的一个参数高效微调大模型的工具，里面集成了4种微调大模型的方法，可以通过微调少量参数就达到接近微调全量参数的效果

C--G·2024-01-04 20:47

基于 P-Tuning的高效微调ChatGLM2-6B

1ChatGLM2-6B介绍ChatGLM是清华技术成果转化的公司智谱AI研发的支持中英双语的对话机器人。ChatGLM基于GLM130B千亿基础模型训练，它具备多领域知识、代码能力、常识推理及运用能力；支持与用户通过自然语言对话进行交互，处理多种自然语言任务。比如：对话聊天、智能问答、创作文章、创作剧本、事件抽取、生成代码等等。代码地址：https://github.com/THUDM/Chat

智慧医疗探索者·2024-01-04 15:38

BERT(Bidirectional Encoder Representations from Transformers)理解

因此，预训练的BERT表示可以通过一个额外的输出层进行微调（fine-tuning），适用于广泛任务的最先进模型的构建，比如问答任务和语言推理，无需针对具体任务做大幅架构修改。

weixin_30425949·2024-01-04 13:59

Aligning Large Multi-Modal Model with Robust Instruction Tuning

Abstract尽管多模态任务取得了有希望的进展，但当前的大型多模态模型（LMM）很容易产生与相关图像和人类指令不一致的描述的幻觉。LRV-指令。我们通过引入第一个大型且多样化的视觉指令调整数据集来解决这个问题，该数据集名为大规模鲁棒视觉（LRV）指令。我们的数据集由GPT4生成的120k视觉指令组成，涵盖16个具有开放式指令和答案的视觉和语言任务。我们还设计了LRV-Instruction，以包

Mars_prime·2024-01-04 12:12

【LMM 008】Instruction Tuning with GPT-4

论文标题：InstructionTuningwithGPT-4论文作者：BaolinPeng,ChunyuanLi,PengchengHe,MichelGalley,JianfengGao作者单位：MicrosoftResearch

datamonday·2024-01-04 12:10

大语言模型LLM微调技术：P-Tuning

1引言Bert时代，我们常做预训练模型微调（Fine-tuning），即根据不同下游任务，引入各种辅助任务loss和垂直领域数据，将其添加到预训练模型中，以便让模型更加适配下游任务的方式。

智慧医疗探索者·2024-01-04 07:28

BERT -Bidirectional Encoder Representation from Transformers[2018GoogleLab]

整体介绍Bert主要工作分为pre-traing(预训练)与fine-tuning（微调），核心工作是预训练，微调是根据down-streamtask（下游任务）进行修改即可预训练的输入：unlabelledsentencepair

思考实践·2024-01-03 15:26

论文笔记BERT: Bidirectional Encoder Representations from Transformers

BERT:BidirectionalEncoderRepresentationsfromTransformers.应用预训练模型于下游任务有两种策略，分别是feature-based和fine-tuning

AI强仔·2024-01-03 15:26

大语言模型LLM微调技术：Prompt Tuning

预训练语言模型的发展历程截止23年3月底，语言模型发展走过了三个阶段：第一阶段：设计一系列的自监督训练目标（MLM、NSP等），设计新颖的模型架构（Transformer），遵循Pre-training和Fine-tuning

智慧医疗探索者·2024-01-03 08:57

大语言模型（LLM）框架及微调 (Fine Tuning)

大语言模型（LLM）是指由大规模训练语言模型所得的模型。这些模型通常使用深度学习方法，在巨大的文本语料库上进行训练，以学习语言的各种结构、规则和特征。LLM在自然语言处理（NLP）任务中表现出色，如机器翻译、文本生成、问题回答等。LLM框架由两个主要步骤组成：预训练和微调。在预训练阶段，模型通过对大规模语料库进行无监督学习来学习语言。这个过程通常使用Transformer模型结构，在大规模计算资源

m0_黎明·2024-01-03 01:06

DetNas(Backbone Search for Object Detection)

2.Supernetfine-tuning：使用目

cshun·2024-01-02 23:32

day4--GPT/GPT2.0

训练的两个阶段：GPT的架构图：自注意力机制：GPT-2GPT-2的架构图：GPTGPT训练的两个阶段：第一个阶段是Pre-training阶段，主要利用大型语料库完成非监督学习；第二阶段是Fine-tuning

呆呆有库·2024-01-02 14:13

【LMM 001】大型语言和视觉助手 LLaVA

论文标题：VisualInstructionTuning论文作者：HaotianLiu,ChunyuanLi,QingyangWu,YongJaeLee作者单位：UniversityofWisconsin-Madison

datamonday·2024-01-02 06:13

关于 bringup sensor 时，曝光时间异常的问题排查

这颗sensor的驱动，按datasheet的要求配置sensor的曝光后，发现最大曝光时间增加了一倍，sensorsetting用的是30fps，理论上最大的绝对曝光时间应该是33ms才正确，但实际用tuning

木东·2024-01-02 01:59

大模型训练过程概述

从该图可知大模型训练主要有4步：Pretraining—预训练阶段SupervisedFinetuning（SFT）—监督微调，也叫指令微调阶段RewardModeling—奖励模型训练阶段ReinforcementLearning

机器学习社区·2024-01-01 00:19

解决AttributeError: module ‘bitsandbytes.nn‘ has no attribute ‘Linear8bitLt‘

我之所以发生这个问题，是因为做了下面的操作：在做量化时，peft包下面tuning目录的lora.py文件中调用了bitsandbytes的nn.Linear8bitLt对象，但是bitsandbytes

gaohongfeng1·2023-12-31 10:35

Language Models as Knowledge Bases?

语言模型相比于结构化的知识库具有很多优势，比如不需要schemaengineering支持对于开放关系类别的查询容易扩展到更多数据训练时不需要humansupervision我们对各种预训练语言模型中已有的（没有fine-tuning

chansonzhang·2023-12-31 07:28

Fine-Tuning Language Models from Human Preferences

Abstract奖励学习（rewardlearning）可以将强化学习（RL）应用到由人类判断定义奖励的任务中，通过询问人类问题来构建奖励模型。奖励学习的大部分工作使用了模拟环境，但是关于价值的复杂信息经常是以自然语言的形式表达的。我们相信语言奖励学习是使强化学习在现实世界任务中实用且安全的关键。在本文中，我们基于语言模型生成式预训练方面的进展，将奖励学习应用于四种自然语言任务：continuin

chansonzhang·2023-12-31 07:54

大语言模型（LLM）框架及微调 (Fine Tuning)

大语言模型（LLM）技术作为人工智能领域的一项重要创新在今年引起了广泛的关注。LLM是利用深度学习和大数据训练的人工智能系统，专门设计来理解、生成和回应自然语言。这些模型通过分析大量的文本数据来学习语言的结构和用法，从而能够执行各种语言相关任务。LLM技术也发挥了关键作用。此外，它还在代码生成、文本摘要、翻译等任务中展现了强大的通用性。LLM技术应用类型分别为大模型、AI编程、工具和平台、基础设施

ejinxian·2023-12-31 06:20

ChatGLM-6B 部署与 P-Tuning 微调实战-使用Pycharm实战

国产大模型ChatGLM-6B微调+部署入门-使用Pycharm实战1.ChatGLM模型介绍ChatGLM-6B是一个开源的、支持中英双语的对话语言模型，基于GeneralLanguageModel(GLM)架构，具有62亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4量化级别下最低只需6GB显存）。ChatGLM-6B使用了和ChatGPT相似的技术，针对中文问答和对话

chengjinpei·2023-12-30 09:38

工具系列：TimeGPT_(5)特定领域微调模型

Fine-tuning（微调）是一种更有效地利用TimeGPT的强大过程。基础模型在大量数据上进行预训练，捕捉广泛的特征和模式。然后可以将这些模型专门用于特定的上下文或领域。

愤斗的橘子·2023-12-30 03:40

【阅读笔记】LoRAHub：Efficient Cross-Task Generalization via Dynamic LoRA Composition

WorkShop3作者团队SeaAILab,Singapore4关键词LLMs、LoRA二、文章结构LoRAHubIntroductionProblemStatementMethodologyLoRATuningonU

ZedKingCarry·2023-12-28 00:15

【Kimi帮我看论文(二)】Parameter-Efficient Fine-Tuning Methods for Pretrained Language Models—Survey

一、论文信息1标题Parameter-EfficientFine-TuningMethodsforPretrainedLanguageModels:ACriticalReviewandAssessment2

ZedKingCarry·2023-12-28 00:45

论文阅读——TÜLU

ExploringtheStateofInstructionTuningonOpenResources统一输入格式：将所有数据集格式化为遵循聊天机器人风格的模式，以统一指令数据集的各种风格和格式。

じんじん·2023-12-27 17:07

文献研读｜Prompt窃取与保护综述

PromptStealingAttacksAgainstText-to-ImageGenerationModels（PromptStealer）2.HardPromptsMadeEasy:Gradient-BasedDiscreteOptimizationforPromptTuningandDiscovery

_Meilinger_·2023-12-27 08:11

使用 PAI-Blade 加速 StableDiffusion Fine-Tuning

01背景StableDiffusion模型自从发布以来在互联网上发展迅猛，它可以根据用户输入的文本描述信息生成相关图片，用户也可以提供自己喜爱的风格的照片，来对模型进行微调。例如当我们输入"Aphotoofsksdoginabucket"，StableDiffusion模型会生成类似下面的图片：02PAI-Blade加速PyTorch训练PAI-Blade使用编译优化技术提高PyTorch程序的执

阿里云大数据AI技术·2023-12-27 00:49

记忆从灵魂中初醒苦尽甘来

psychoacoustics心理声学frequency频率intensity强度time时间waveform波形pitch音高loudness响度duration时值timbre音色(tonecolororquality)tuningfork

滴水铭心·2023-12-26 02:09

ML Design Pattern——Hyperparameter Tuning

Hyperparametertuningistheprocessoffindingtheoptimalsetofhyperparametersforamachinelearningmodel.Hyperparametersaresettingsthatcontrolthelearningprocess

卢延吉·2023-12-25 05:41

今日无更新

，使用AllenNLP了解Transformer、了解LSTM了解jieba等分词工具了解Gensim等NLP处理工具接下来要做的：基于Pytorch搞定LSTM和Transformer（使用Finetuning

我的昵称违规了·2023-12-25 02:21

论文笔记--InstructBLIP: Towards General-purpose Vision-Language Models with Instruction Tuning

论文笔记--InstructBLIP:TowardsGeneral-purposeVision-LanguageModelswithInstructionTuning1.文章简介2.文章概括3文章重点技术

Isawany·2023-12-24 03:35

【论文解读】：大模型免微调的上下文对齐方法

本文通过对alignmenttuning的深入研究揭示了其“表面性质”，即通过监督微调和强化学习调整LLMs的方式可能仅仅影响模型的语言风格，而对模型解码性能的影响相对较小。

深度人工智能·2023-12-23 14:52

推荐频道

tuning

Training language models to follow instructions with human feedback

LLM调研笔记

LLaMA Efficient Tuning

raw （1）_问题处理

抛弃模板，一种Prompt Learning用于命名实体识别任务的新范式

GraphGPT： Graph Instruction Tuning for Large Language Models

吴恩达深度学习笔记(50)-超参数训练的实践

【AI视野·今日NLP 自然语言处理论文速览 第七十期】Thu, 4 Jan 2024

[zz]TVM之神经网络Auto-Tuning

大模型的实践应用16-一种针对大型预训练模型的微调技巧：Adapter-Tuning方法的实战应用，原理详细介绍

RAG实战案例：如何基于 LangChain 实现智能检索生成系统

TensorRT优化部署（一）--TensorRT和ONNX基础

论文解读：P-Tuning v2: Prompt Tuning Can BeComparable to Fine-tuning Universally Across Scales and Tasks

公开课：Performance tuning in databend | Vol. 24

【AI】一文读懂大模型套壳——神仙打架？软饭硬吃？

【AI视野·今日Sound 声学论文速览 第三十九期】Tue, 2 Jan 2024

【AI视野·今日Robot 机器人论文速览 第六十六期】Tue, 31 Oct 2023

AIGC（生成式AI）试用 16 -- 续1，调优和提示词

自然语言转SQL，一个微调ChatGPT3.5的实例(下)--模型微调及模型性能

20、Finetuning

基于 P-Tuning的高效微调ChatGLM2-6B

BERT(Bidirectional Encoder Representations from Transformers)理解

Aligning Large Multi-Modal Model with Robust Instruction Tuning

【LMM 008】Instruction Tuning with GPT-4

大语言模型LLM微调技术：P-Tuning

BERT -Bidirectional Encoder Representation from Transformers[2018GoogleLab]

论文笔记BERT: Bidirectional Encoder Representations from Transformers

大语言模型LLM微调技术：Prompt Tuning

大语言模型（LLM）框架及微调 (Fine Tuning)

DetNas(Backbone Search for Object Detection)

day4--GPT/GPT2.0

【LMM 001】大型语言和视觉助手 LLaVA

关于 bringup sensor 时，曝光时间异常的问题排查

大模型训练过程概述

解决AttributeError: module ‘bitsandbytes.nn‘ has no attribute ‘Linear8bitLt‘

Language Models as Knowledge Bases?

Fine-Tuning Language Models from Human Preferences

大语言模型（LLM）框架及微调 (Fine Tuning)

ChatGLM-6B 部署与 P-Tuning 微调实战-使用Pycharm实战

工具系列：TimeGPT_(5)特定领域微调模型

【阅读笔记】LoRAHub：Efficient Cross-Task Generalization via Dynamic LoRA Composition

【Kimi帮我看论文(二)】Parameter-Efficient Fine-Tuning Methods for Pretrained Language Models—Survey

论文阅读——TÜLU

文献研读｜Prompt窃取与保护综述

使用 PAI-Blade 加速 StableDiffusion Fine-Tuning

记忆从灵魂中初醒 苦尽甘来

ML Design Pattern——Hyperparameter Tuning

今日无更新

论文笔记--InstructBLIP: Towards General-purpose Vision-Language Models with Instruction Tuning

【论文解读】：大模型免微调的上下文对齐方法

【AI视野·今日NLP 自然语言处理论文速览第七十期】Thu, 4 Jan 2024

【AI视野·今日Sound 声学论文速览第三十九期】Tue, 2 Jan 2024

【AI视野·今日Robot 机器人论文速览第六十六期】Tue, 31 Oct 2023

记忆从灵魂中初醒苦尽甘来