LLM微调第6页

CSS：定位

定位1、static定位无定位2、fixed定位相对于窗口得定位3、relative定位相对于自己得正常位置，可以使用leftrighttopbottom进行元素得微调4、absolute定位绝对定位的元素的位置相对于最近的已定位父元素

无敌的黑星星·2024-02-20 10:44

AI系列 - 大语言模型LLM的兴起

目录大语言模型（LLM）起飞AI的影响大模型国外大模型国内大模型LLM的体验大语言模型（LLM）起飞2022年11月，GPT3.5的发布引起了公众的广泛关注。

liyane·2024-02-20 10:17

AI LLM翻译实践

大语言模型（LLM）的语义识别能力使之成为翻译的必用工具。如果我在互联网上看到一篇不错的英文文章，如何翻译呢？

liyane·2024-02-20 10:17

OLMO：Accelerating the Science of Language Models

本文是LLM系列文章，针对《AcceleratingtheScienceofLanguageModels》的翻译。

UnknownBody·2024-02-20 08:41

从代码的层面掌握LLM的路线

原则：从易到难，只用pytorch从第一个项目来熟悉transformer的使用；从第二个项目来掌握对训练数据的使用方法及transformer的decoder的细节；从第三个项目来理解LLM的整个过程

Eloudy·2024-02-20 08:41

ChatGPT和LLM

ChatGPT和LLM（大型语言模型）之间存在密切的关系。首先，LLM是一个更为抽象的概念，它包含了各种自然语言处理任务中使用的各种深度学习模型结构。

小米人er·2024-02-20 08:58

LLM 参数，显存，Tflops? 训练篇(1)

如果你要训练一个模型大概会考虑哪些因素？模型多大？参数占用显存多少，能不能装的下我需要多少算力来支撑本文就针对一个标准的Transfomer模型的套路和大家简单说一下为了后文大家看算式明白，我们先约定一下每个变量代表的意义L:Transfomer有多少层H：代表两个意义，第一个意义是hiddensize的维度，第二个就是token被embedding以后的维度，这两值本来也相等h:小写的h代表多头

周博洋K·2024-02-20 06:59

万字盘点 Android 领域在 2023 年的重要技术：AI, 14, Compose, 鸿蒙...

AICore2022年底横空出世的GPT-3.5引发了全球的大模型LLM狂潮。

TechMerger·2024-02-20 05:28

杂记(十九) 推荐免费使用GPT-4的四种工具

不可否认，由OpenAI带来的GPT-4已是全球最受欢迎的、功能最强大的大语言模型（LLM）之一。大多数人都需要使用ChatGPTPlus的订阅服务去访问GPT-4。

小酒馆燃着灯·2024-02-20 03:01

杂记(九) 本文(4000字) | 推荐免费使用GPT-4的四种工具 |

小酒馆燃着灯·2024-02-20 03:01

【AIGC】大语言模型

大型语言模型，也叫大语言模型、大模型（LargeLanguageModel，LLM；LargeLanguageModels，LLMs）什么是大型语言模型大型语言模型（LLM）是指具有数千亿（甚至更多）参数的语言模型

AIGCExplore·2024-02-20 02:57

Elasticsearch：特定领域的生成式 AI - 预训练、微调和 RAG

作者：来自ElasticSteveDodson有多种策略可以将特定领域的知识添加到大型语言模型(LLM)中，并且作为积极研究领域的一部分，正在研究更多方法。

Elastic 中国社区官方博客·2024-02-20 01:33

使用 RAG 创建 LLM 应用程序

如果您考虑为您的文件或网站制作一个能够回应您的个性化机器人，那么您来对地方了。我可以帮助您使用Langchain和RAG策略来创建这样一个机器人。了解ChatGPT的局限性和LLMsChatGPT和其他大型语言模型（LLMs）经过广泛训练，以理解语言的语义和连贯性。尽管它们具有令人印象深刻的能力，但这些模型也存在一些限制，需要在特定用例中进行仔细考虑。一个重要的挑战是可能出现幻觉，模型可能会生成不

ericliu2017·2024-02-20 01:52

【AIGC】Stable Diffusion的模型微调

为什么要做模型微调模型微调可以在现有模型的基础上，让AI懂得如何更精确生成/生成特定的风格、概念、角色、姿势、对象。StableDiffusion模型的微调方法通常依赖于您要微调的具体任务和数据。

AIGCExplore·2024-02-20 01:42

Sora：通过视频生成模型制造世界模拟器（世界模型）

（可变的视频时长、帧分辨率和长宽比）OpenAI从大型语言模型（LLM）中获得灵感，LLM通过对互联网规模级别数据的训练获得了通用且强大的能

lifallen·2024-02-20 00:14

PyTorch-线性回归

已经进入大模微调的时代，但是学习pytorch，对后续学习rasa框架有一定帮助吧。

一个高效工作的家伙·2024-02-20 00:46

关于预训练模型的一点感悟

最近，YannLeCun在WGS上说：目前的LLM不可能走到AGI，原因很简单，现在训练这些LLM所使用的数据量为10万亿个令牌，也就是130亿个词，如果你计算人类阅读这些数据需要多长时间，一个人每天阅读

铅笔楼·2024-02-19 23:18

【论文精读】SimCLR2

摘要本文提出了一个半监督学习框架，包括三个步骤：无监督或自监督的预训练；有监督微调；使用未标记数据进行蒸馏。

None-D·2024-02-19 22:40

（2024，提示优化，监督微调，强化学习，近端策略优化）用于安全生成文本到图像的通用提示优化器

UniversalPromptOptimizerforSafeText-to-ImageGeneration公和众和号：EDPJ（进Q交流群：922230617或加VX：CV_EDPJ进V交流群）目录0.摘要2.相关工作3.提议的框架4.实验0.摘要文本-图像（Text-to-Image，T2I）模型在基于文本提示生成图像方面表现出色。然而，这些模型对于不安全的输入以生成不安全的内容，如性、骚扰和

EDPJ·2024-02-19 22:37

LLaMA 2 - 你所需要的一切资源

它的微调模型则在超过100万个人工标注数据下完成。这篇博客包含了所有的相关资源，以帮助您快速入

·2024-02-19 21:59

OpenAI Sora真的有自己的物理模型吗？

就像关于LLM中世界模型的争论一样，这个问题既非常有趣，又有些定义不清。当然，Sora在推理过程中向UE5等外部物理引擎调用函数的可能性很小。

极道Jdon·2024-02-19 21:02

LLM(2)之指令提示词(Prompt)基础教学

LLM(2)之指令提示词Author：OnceDayDate：2024年2月15日全系列专栏请查看:LLM实践成长_Once_day的博客-CSDN博客参考文章：中文完整版全9集ChatGPT提示工程师

Once_day·2024-02-19 20:04

阿松上师每日开示（1208）

特别说明：文章内容转自阿松上师微信号的每日开示，仅作尽少部分排版、错字、标点、配图等微调处理。

曾路·2024-02-19 20:29

日更

本来想获得日更365天徽章以后，就不用每日去写心愿，稍微调整一下方向，写一些有的放矢的内容，不是每日碎碎念。从开始的每日苦思冥想，到现在每日随手写一篇文章，难度已经不大。但是觉得想写深度好像

夜幽莲·2024-02-19 19:07

Cohere For AI 推出了 Aya，这是一款覆盖超过 100 种语言的大型语言模型（LLM）

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/想要加入Aya项目，您可以访问Aya项目的官方网站（https://aya.for.ai

新加坡内哥谈技术·2024-02-19 19:28

LLM 记忆体？

兔走龙来，不知不觉，又到了一年一度的保留节目——ZillizMoment。AGI时代的到来，让Zilliz的身上多了很多充满“时代烙印”的标签：未来独角兽、网红赛道公司、向量数据库大佬、大模型的长期记忆体、RAG最强搭档……与此同时，我们也听说了一些有趣的标签：周边质量好、抢不到红包封面、公司产品都是鸟的名字……那么，大家对于Zilliz的印象是不是真的如此标签化呢？为此，我们邀请了一些新老朋友，

·2024-02-19 18:46

每月AI科研动向（2024年1月）

目前的分类包括：LLM研究、Agent、多模态（图像、音视频、其他）、特定领域应用、具身智能。内容较多所以每个相对简略，后续会对必要的专题做更进一步的研究。

陌北有棵树·2024-02-19 16:17

作物模型狂奔 Apsim 脚本并行思路

这里没图，去B站看看整体思路：Python-》R-》Apsimx0、准备工作0.0电脑环境我用的Win10啦，Linux、Mac可能得自己再去微调一下。

F_Dregs·2024-02-19 16:20

作物模型狂奔：WOFOST(PCSE) 数据同化思路

去B吧，这里没图整体思路：PCSE-》敏感性分析-》调参-》同化0、准备工作0.0电脑环境我用的Win10啦，Linux、Mac可能得自己再去微调一下。

F_Dregs·2024-02-19 16:20

如何引导llm为自己写prompt生成剧本

如何使用写prompt让你自己生一个狗血修仙穿越短剧，且短剧有趣生动让人流连忘返好的，我会尝试编写一个狗血修仙穿越短剧的prompt，以激发你的想象力，让你创作出一个既有趣又生动的短剧。以下是我的prompt：标题：《误入仙途：狗血修仙穿越记》背景设定：在一个现代都市，一位名叫李明的普通上班族意外穿越到了一个名为“修仙界”的奇幻世界。在这个世界里，人们修炼仙术，追求长生不老。李明因为意外获得了一本

东方佑·2024-02-19 15:07

真、开源LLM-OLMo

论文：https://arxiv.org/pdf/2402.00838.pdfWeightshttps://huggingface.co/allenai/OLMo-7BCodehttps://github.com/allenai/OLMoDatahttps://huggingface.co/datasets/allenai/dolmaEvaluationhttps://github.com/all

choose_c·2024-02-19 14:42

Benchmarking PIM-attention: A Puncture Experiment on a Real Processing-in-Memory Architecture

大语言模型（LLM）的高吞吐量服务需要一次批处理足够多的请求。然而，现有的推理系统面临着巨大的挑战。

简vae·2024-02-19 14:03

HuggingFists-低代码玩转LLM Agent-思考

在该应用模式下，LLM被当作了Agent的大脑，主要使用其推理、规划及工具调用能力。笔者非常喜欢这种将LLM作为大脑的比喻。

colorknight·2024-02-19 14:53

HuggingFists-低代码玩转LLM-腾讯云RAG(1)

前序在之前的系列文章里，笔者介绍了如何使用阿里的千问LLM、阿里的文本嵌入模型以及Milvus向量库来搭建一个RAG(检索增强生成)的实验。

colorknight·2024-02-19 14:49

Flink部署——细粒度资源管理

对于希望根据对特定场景的了解来微调资源消耗的用户，Flink提供了细粒度的资源管理。本页介绍细粒度资源管理的用法、适用场景及其工作原理。

京河小蚁·2024-02-19 14:14

【论文精读】BERT

摘要以往的预训练语言表示应用于下游任务时的策略有基于特征和微调两种。

None-D·2024-02-19 12:03

【AIGC】Stable Diffusion之模型微调工具

AIGCExplore·2024-02-19 12:56

4张图片就可以微调扩散模型

这时就需要我们进行手动的微调。微调可以根据相对较小的图像集向模型教授新的、独特的主题。我们今天使用DreamBooth在不影响模型原始功能的情况下实现微调过程。

·2024-02-19 12:29

预训练和微调在迁移学习中的作用

在机器学习和深度学习中，"pre-training"（预训练）和"fine-tuning"（微调）是两个常见且重要的概念，它们通常在迁移学习场景中使用，以提高模型在特定任务上的性能。

一条小小yu·2024-02-19 12:42

基于 InternLM 和 LangChain 搭建你的知识库(三)

基于InternLM和LangChain搭建你的知识库大模型开发范式Finetune在大型语言模型中，Finetune（微调）是一种技术，用于调整预训练的模型以提高其在特定任务或数据集上的表现。

骆驼穿针眼·2024-02-19 12:41

书生浦语-模型微调

大语言模型微调指令微调的流程LoRA(旁路分支微调)Xtuner微调框架微调训练作业微调作业需要多训练几个epoch，这里训练了16个epoch

SatVision炼金士·2024-02-19 11:28

NLP_GPT到ChatGPT

GPT运用单向自回归方法生成文本，先预训练大量无标签文本，再在特定任务上进行微调。GPT在多种NLP任务上取得了显著进步。GPT-2：2019年，OpenAI推出了GPT的升级版，拥有更多参数[15亿

you_are_my_sunshine*·2024-02-15 09:39

编码、理解和实现LLM中的自注意力、多头注意力、交叉注意力和因果注意力

原文链接：understanding-and-coding-self-attention2024年1月14日自注意力是LLM的一大核心组件。对大模型及相关应用开发者来说，理解自注意力非常重要。

lichunericli·2024-02-15 09:27

大模型微调大杂烩知识总结

1.前缀微调（Prefix-Tuning）前缀微调是一种针对预训练模型的微调方法，通过在模型输入前添加特定任务相关的连续前缀表示，从而引导模型生成适应特定任务的输出。

lichunericli·2024-02-15 09:56

LLM大模型相关问题汇总---包括问题与答案

一、基础篇1.目前主流的开源模型体系有哪些？-Transformer体系：由Google提出的Transformer模型及其变体，如BERT、GPT等。-PyTorchLightning：一个基于PyTorch的轻量级深度学习框架，用于快速原型设计和实验。-TensorFlowModelGarden：TensorFlow官方提供的一系列预训练模型和模型架构。-HuggingFaceTransfor