LLM微调第7页

L 先生说——如何做好读书笔记

从L先生说看到「知识卡片」的模板和范例，可执行，可实践，不求一劳永逸，在实践中不断微调。文中以图片形式展现，这里重新手写一次以加强理解。【主题】这条笔记是关

JeetChan·2024-02-14 22:41

css定位

position:fixed;left:100px;top:150px;};不会随着页面的滚动，而变化位置相对定位（position:relative);相对于自己的位置发生移动；相对于原位置发生偏移适合微调

chasing_dream·2024-02-14 09:27

使用LORA微调RoBERTa

模型微调是指在一个已经训练好的模型的基础上，针对特定任务或者特定数据集进行再次训练以提高性能的过程。微调可以在使其适应特定任务时产生显着的结果。

deephub·2024-02-14 08:15

数据库管理-第150期 Oracle Vector DB & AI-02（20240212）

数据库管理150期2024-02-12数据库管理-第150期OracleVectorDB&AI-02（20240212）1LLM2LLM面临的挑战3RAG4向量数据库+LLM总结数据库管理-第150期OracleVectorDB

胖头鱼的鱼缸（尹海文）·2024-02-14 07:25

《生成式AI与大模型核心技术开发与应用研修班》的培训通知

大模型和小模型的融合使用，或者以大模型为底座的小型化微调都是未来发展趋势。如何调用大模型开展自然语言处理、图像处理、文本识别的技术，成为目前人工智能领域人才的迫切需求。为帮助大家掌握大模型调用、

人工智能技术与咨询·2024-02-14 06:42

vLLM vs Text Generation Interface：大型语言模型服务框架的比较

在大型语言模型（LLM）的世界中，有两个强大的框架用于部署和服务LLM：vLLM和TextGenerationInterface(TGI)。这两个框架都有各自的优势，适用于不同的使用场景。

田猿笔记·2024-02-14 05:53

推理系统学习笔记

MLsys比较感兴趣，遂找些资料开始学习一下https://fazzie-key.cool/2023/02/21/MLsys/https://qiankunli.github.io/2023/12/16/llm_inference.htmlhttps

Loganer·2024-02-14 03:29

Snipaste：一个截图工具可以解决你的笔记焦虑？

前言一、Snipaste下载和安装二、截图功能1.开始截图2.回放截图记录3.微调截图区域4.画笔文字设置二、贴图功能1.开始贴图2.关闭、销毁和隐藏贴图3.选择、翻转和缩放贴图4.设置透明度5.缩列图模式三

mucherry·2024-02-14 03:16

LLM大模型常见问题解答（2）

对大模型基本原理和架构的理解大型语言模型如GPT（GenerativePre-trainedTransformer）系列是基于自注意力机制的深度学习模型，主要用于处理和生成人类语言。基本原理自然语言理解：模型通过对大量文本数据的预训练，学习到语言的统计规律，从而能够在不同的语言任务上表现出自然语言理解的能力。迁移学习：GPT类模型首先在一个广泛的数据集上进行预训练，以掌握语言的通用表示，然后可以在

lichunericli·2024-02-13 21:38

扩展说明: 指令微调 Llama 2

这篇博客是一篇来自MetaAI，关于指令微调Llama2的扩展说明。旨在聚焦构建指令数据集，有了它，我们则可以使用自己的指令来微调Llama2基础模型。目标是构建一个能够基于输入内容来生成指令的模型。

·2024-02-13 21:53

大模型注入领域知识，模型体验和Token重复知识

1如何给LLM注入领域知识？给LLM（低层次模型，如BERT、GPT等）注入领域知识的方法有很多。以下是一些建议：数据增强：在训练过程中，可以通过添加领域相关的数据来增强模型的训练数据。

lichunericli·2024-02-13 19:26

面向智算服务，构建可观测体系最佳实践

当前，随着大语言模型（LLM）

·2024-02-13 18:51

大模型基础知识

GPT模型通过在大规模无标签文本上进行预训练，然后在特定任务上进行微调，具有很强的生成能力和语言理解能力。BERT（BidirectionalEncoderRepresentationsfromT

lichunericli·2024-02-13 13:46

大模型微调知识

在模型基础上做全参数微调，需要多少显存？要确定全参数微调所需的显存量，需要考虑以下几个因素：模型的大小：模型的大小是指模型参数的数量。通常，参数越多，模型的大小就越大。

lichunericli·2024-02-13 13:46

使用LORA微调RoBERTa

模型微调是指在一个已经训练好的模型的基础上，针对特定任务或者特定数据集进行再次训练以提高性能的过程。微调可以在使其适应特定任务时产生显着的结果。

·2024-02-13 12:15

LocalAI 部署(主要针对 mac m2 启动)

它无需GPU，还有多种用途集成，允许您使用消费级硬件在本地或本地运行LLM、生成图像、音频等等，支持多个模型系列。

不正经写文章的我·2024-02-13 12:33

AI术语概念解释

LLM、AIagent、Token、AGI、NLP、知识库⼈⼯智能代理AIAgent专业解释:⼈⼯智能代理是⼀种ᇿ⽴的软件实体，能够在其环境中执⾏任务以实现既定⽬标。

nsa65223·2024-02-13 11:46

深度学习基础

深度学习基础highvariance/datamismatchwhatisdatamismatchhowtosolvedatamismatchdatasynthesis数据合成迁移学习与预训练/微调什么时候用迁移学习

EEPI·2024-02-13 10:48

网络安全的今年：量子、生成人工智能以及 LLM 和密码

尽管世界总是难以预测，但网络安全的几个强劲趋势表明未来几个月的发展充满希望和令人担忧。有一点是肯定的：2024年将是非常重要且有趣的一年。近年来，人工智能（AI）以令人难以置信的速度发展，其在网络安全中的实施只会变得更加普遍和重要。它最终可能成为行业游戏规则的改变者。今年，人工智能和量子计算的发展可能会让他们正面交锋。存在产生一些令人难以置信和不想要的结果的巨大潜力。量子计算将使当今的加密技术在一

网络研究院·2024-02-13 09:40

【冯钇嘉桐】令人期待的运动会

老师就让我们按之前跳舞的队形先站了一下，然后，老师给我们稍微调整了一下后，这个队形就算排完了。老师说让我们花束队儿的，就在头走到操场中间之前，要先从

磊磊的柠檬·2024-02-13 08:21

有道开源RAG引擎 QAnything 版本更新啦

本次开源包括了embedding,rerank,LLM

有道AI情报局·2024-02-13 05:47

书生·浦语大模型第四课作业

基础作业：构建数据集，使用XTuner微调InternLM-Chat-7B模型,让模型学习到它是你的智能小助手，效果如下图所示，本作业训练出来的模型的输出需要将不要葱姜蒜大佬替换成自己名字或昵称！

查里王·2024-02-13 00:59

这次理解透彻了！用代码从零实现大模型的自注意力、多头注意力。。。

自注意力是LLM的一大核心组件。无论是去算法岗面试还是相关应用开发，理解自注意力非常重要。

Python算法实战·2024-02-12 23:47

如何使用动态 ABAP 程序生成技术，对 ABAP 系统标准的报表行为进行微调试读版

笔者的知识星球里，有朋友提问，能不能从本地ABAP系统，提取某个标准ABAP程序的代码源，然后基于这些代码源进行微调，动态生成新的ABA

·2024-02-12 22:29

2022-12-4【日精进第77天】

姓名：李庆单位：郑州鹿野苑餐饮管理有限公司（朵家甜品厨房）每日定课（根据实际情况，每十天微调一次）：1，晨跑：5：20前，18分钟内跑完3公里；【未完成，隔离中】2，读书笔记：阅读30min+，笔记200

李庆是个做蛋糕的·2024-02-12 22:55

InternLM大模型实战-4.XTuner大模型低成本微调实战

文章目录前言笔记正文XTuner支持模型和数据集微调原理跟随文档学习快速上手自定义微调准备数据准备配置文件MS-Agent微调前言本文是对于InternLM全链路开源体系系列课程的学习笔记。

早上真好·2024-02-12 21:40

第四节课[XTuner微调]作业

文章目录前言作业基础作业-XTunerInternLM-Chat个人小助手认知微调实践前言XTuner做在第三节课LangChain作业之前，因为第三节课没想好找哪个领域，等第三节课作业做了一起部署。

早上真好·2024-02-12 21:40

第三节课[LangChain]作业

文章目录前言实践搭建向量知识库前言本次作业虽然是第三节课作业，但是在第四次作业之后才完成，所以用的是经过自我认知微调的小助手权重。

早上真好·2024-02-12 21:40

基于大语言模型的AI Agents

基于大语言模型（LLM）的AIAgent利用LLM进行记忆检索、决策推理和行动顺序选择等，把Agent的智能程度提升到了新的高度。LLM驱动的Agent具体是怎么做的呢？什么是AIAgent？

lichunericli·2024-02-12 19:27

LLM的参数微调、训练、推理；LLM应用框架；LLM分布式训练

大模型基础主流的开源大模型有哪些？GPT-3：由OpenAI开发，GPT-3是一个巨大的自回归语言模型，拥有1750亿个参数。它可以生成文本、回答问题、翻译文本等。GPT-Neo：由EleutherAI开发，GPT-Neo是一个开源的、基于GPT架构的语言模型，拥有数十亿到百亿级的参数。GPT-J：也是由EleutherAI开发的，GPT-J是一个拥有60亿参数的开源语言模型。PaLM(Pathw

lichunericli·2024-02-12 19:27

3. ⼤语⾔模型深度学习背景知识

1.LLM⼤语⾔模型⼀般训练过程Step1.预训练阶段Step2.微调阶段⼤模型⾸先在⼤量的⽆标签数据上进⾏训练，预训练的最终⽬的是让模型学习到语⾔的统计规律和⼀般知识。

Andy_shenzl·2024-02-12 18:22

「我在淘天做技术」智能对话新纪元：百万日活对话机器人的 LLM 落地实践

作者：智能小蜜团队一、前言阿里小蜜家族（阿里小蜜、店小蜜、万象），从2015年发展至今，已经成为了覆盖淘天P-C（平台-消费者）、B-C（商家-消费者）、P-B（平台-商家）全咨询体系的智能对话机器人，日均接待量级在百万（阿里小蜜）到千万（店小蜜）范围。作为淘天集团乃至行业内最大体量的对话机器人应用之一，阿里小蜜在对话算法能力上持续探索，在2022年chatgpt爆炸性的诞生之后，我们也加快了拥抱

阿里技术·2024-02-12 15:32

大模型推理优化实践：KV cache 复用与投机采样

作者：米基一、背景RTP-LLM是阿里巴巴大模型预测团队开发的大模型推理加速引擎，作为一个高性能的大模型推理解决方案，它已被广泛应用于阿里内部。

阿里技术·2024-02-12 15:01

大语言模型ChatGLM + P-Tuning微调实践

大语言模型ChatGLM+P-Tuning微调实践文章目录大语言模型ChatGLM+P-Tuning微调实践LLM微调基础本次实践环境说明ChatGLM部署以及激活conda环境安装依赖禁用W&B训练数据集

North_D·2024-02-12 13:59

大语言模型langchain+ChatGLM3-6B+本地知识库实战

大语言模型langchain+ChatGLM3-6B+本地知识库实战文章目录大语言模型langchain+ChatGLM3-6B+本地知识库实战目标微调、本地知识库和Prompt基本概念1、环境准备2、

North_D·2024-02-12 13:29

用code去探索理解Llama架构的简单又实用的方法

可能有时候算法和论文也不是每个读者都爱看，我也会在今后的文章中加点code或者debug模型的内容，也许还有一些好玩的应用demo，会提升这部分在文章类型中的比例今天带着大家通过代码角度看一下Llama,或者说看一下Casual-LLM

周博洋K·2024-02-12 13:54

小周带你正确理解Prompt-engineering,RAG,fine-tuning工程化的地位和意义

所以我来给大家捋一捋，因为这毕竟直接取决于你设计的解决方案是否能真正解决问题如上图所示，OpenAI把对于优化LLM返回结果分为两个方向，一个方向是横坐标系的对LLM模

周博洋K·2024-02-12 13:54

小周带你正确理解Prompt-engineering,RAG,fine-tuning工程化的地位和意义

所以我来给大家捋一捋，因为这毕竟直接取决于你设计的解决方案是否能真正解决问题如上图所示，OpenAI把对于优化LLM返回结果分为两个方向，一个方向是横坐标系的对LLM模

周博洋K·2024-02-12 13:22

书生谱语-全链条开发工具

书生·谱语全链条开发体系包含：数据、模型预训练、模型微调、模型量化部署、模型测评、模型场景应用全链路开发体系github链接通用大模型国内外大语言模型快速发展，涌现了大量的大语言模型以及一批创业公司深度学习模型的发展大模型利用多模态优势

SatVision炼金士·2024-02-12 11:21

20180928晨间日记

我看到了易效能的进步，每次开课都会有一些微调，更加适应社会的变化，跟住科技的脚步。通过这次学习，我调整了自己的目标，争取加入易效能的团队，把自己变得更加积极主动，早日实现线上人生！

张林春·2024-02-12 11:42

匠心精神

为了规整，一件行李的摆放姿势都得微调半天。关车门前，一定会保证所有的行李都码得整整齐齐。即使搬运了数十件沉重行李，他们的每一个动作都严谨如一，引得各国网友纷纷感慨。当行李落

艾欣老师·2024-02-12 10:22

【EAI 019】Eureka: Human-Level Reward Design via Coding LLM

论文标题：Eureka:Human-LevelRewardDesignviaCodingLargeLanguageModels论文作者：YechengJasonMa,WilliamLiang,GuanzhiWang,De-AnHuang,OsbertBastani,DineshJayaraman,YukeZhu,LinxiFan,AnimaAnandkumar作者单位：NVIDIA;UPenn;C

datamonday·2024-02-12 09:08

Nature Machine Intelligence 法国国家科学研究中心评论“使用大语言模型进行研究的危机”

ChatGPT于2022年底发布，将大型语言模型（LLM）推到了聚光灯下。通过使用户能够直接用自然语言查询模型，ChatGPT实现了对这些模型的访问——这是一个受欢迎的发展。

xwz小王子·2024-02-12 08:35

揭秘 LLM 推理：全面解析 LLM 推理性能的关键因素

一、背景介绍自OpenAI一年前发布ChatGPT以来，大型语言模型（LLM）领域经历了前所未有的快速发展。

lichunericli·2024-02-12 08:53

【0809】《孙子兵法》之虚实（16/30）

同样地，自己在向别人表达自己的时候，也会有选择地在某些方面进行微调，但是度一定要把握好，最好让对方不易察觉。对方的虚实都知道，自己的虚实对方都不知道，这绝对就是“先胜后战”的实例，而

9c80a2f86c0f·2024-02-12 06:50

基于NSGA-II的深度迁移学习

深度迁移学习迁移学习是一种机器学习技术，它允许一个预训练的模型被用作起点，在此基础上进行微调以适应新的任务或数据。

代码缝合怪·2024-02-12 03:45

huggingface学习|用dreambooth和lora对stable diffusion模型进行微调

目录用dreambooth对stable-diffusion-v1-5模型进行微调（一）模型下载和环境配置（二）数据集准备（三）模型微调（四）运行微调后的模型用lora对stable-diffusion-v1

丁希希哇·2024-02-12 01:18

LoRA：语言模型微调的计算资源优化策略

编者按：随着数据量和计算能力的增加，大模型的参数量也在不断增加，同时进行大模型微调的成本也变得越来越高。全参数微调需要大量的计算资源和时间，且在进行切换下游任务时代价高昂。

·2024-02-11 20:51

Go内存优化与垃圾收集

Go提供了自动化的内存管理机制，但在某些情况下需要更精细的微调从而避免发生OOM错误。本文介绍了如何通过微调GOGC和GOMEMLIMIT在性能和内存效率之间取得平衡，并尽量避免OOM的产生。

·2024-02-11 18:44

火山引擎ByteHouse：如何为OLAP设计高性能向量检索能力？

·2024-02-11 18:27

推荐频道

LLM微调

L 先生说——如何做好读书笔记

css定位

使用LORA微调RoBERTa

数据库管理-第150期 Oracle Vector DB & AI-02（20240212）

《生成式AI与大模型核心技术开发与应用研修班》的培训通知

vLLM vs Text Generation Interface：大型语言模型服务框架的比较

推理系统学习笔记

Snipaste：一个截图工具可以解决你的笔记焦虑？

LLM大模型常见问题解答（2）

扩展说明: 指令微调 Llama 2

大模型注入领域知识，模型体验和Token重复知识

面向智算服务，构建可观测体系最佳实践

大模型基础知识

大模型微调知识

使用LORA微调RoBERTa

LocalAI 部署(主要针对 mac m2 启动)

AI术语概念解释

深度学习基础

网络安全的今年：量子、生成人工智能以及 LLM 和密码

【冯钇嘉桐】令人期待的运动会

有道开源RAG引擎 QAnything 版本更新啦

书生·浦语大模型第四课作业

这次理解透彻了！用代码从零实现大模型的自注意力、多头注意力。。。

如何使用动态 ABAP 程序生成技术，对 ABAP 系统标准的报表行为进行微调试读版

2022-12-4【日精进第77天】

InternLM大模型实战-4.XTuner大模型低成本微调实战

第四节课[XTuner微调]作业

第三节课[LangChain]作业

基于大语言模型的AI Agents

LLM的参数微调、训练、推理；LLM应用框架；LLM分布式训练

3. ⼤语⾔模型深度学习背景知识

「我在淘天做技术」智能对话新纪元：百万日活对话机器人的 LLM 落地实践

大模型推理优化实践：KV cache 复用与投机采样

大语言模型ChatGLM + P-Tuning微调实践

大语言模型langchain+ChatGLM3-6B+本地知识库实战

用code去探索理解Llama架构的简单又实用的方法

小周带你正确理解Prompt-engineering,RAG,fine-tuning工程化的地位和意义

小周带你正确理解Prompt-engineering,RAG,fine-tuning工程化的地位和意义

书生谱语-全链条开发工具

20180928晨间日记

匠心精神

【EAI 019】Eureka: Human-Level Reward Design via Coding LLM

Nature Machine Intelligence 法国国家科学研究中心评论“使用大语言模型进行研究的危机”

揭秘 LLM 推理：全面解析 LLM 推理性能的关键因素

【0809】《孙子兵法》之虚实（16/30）

基于NSGA-II的深度迁移学习

huggingface学习|用dreambooth和lora对stable diffusion模型进行微调

LoRA：语言模型微调的计算资源优化策略

Go内存优化与垃圾收集

火山引擎ByteHouse：如何为OLAP设计高性能向量检索能力？