llms 第10页

LangChain+LLM实战---LangChain中的6大核心模块

模型（Models）LLMs大型语言模型，将文本字符串作为输入，并返回文本字符串作为输出。聊天模型聊天模型通常由语言模型支持，但它们的API更加结构化。这些模型将聊天消息列表作为输入，并返回聊天消息。

lichunericli·2023-10-30 02:33

LangChain+LLM实战---自定义模拟实现LLM

fromtypingimportAny,List,Mapping,Optionalfromlangchain.callbacks.managerimportCallbackManagerForLLMRunfromlangchain.llms.baseimportLLMimportreclassTfboyLLM

lichunericli·2023-10-30 02:03

HuggingGPT Solving AI Tasks with ChatGPT and its Friends in HuggingFace---论文阅读总结

1、介绍LLMS（Largelanguagemodels）在语言理解、生成、交互和推理方面产生优越的能力，推动了新的研究主题，例如上下文学习、指令学习以及思维链提示。

星冢·2023-10-29 15:10

GLoRE：大型语言模型的逻辑推理能力探究

zenRRan·2023-10-29 12:45

零资源的大语言模型幻觉预防

露葵025·2023-10-28 14:50

为应对输出风险文本的情况，提出一种针对LLMs简单有效的思维链解毒方法

作者：汤泽成、周柯言单位：苏州大学人工智能研究院论文标题：[2308.08295]DetoxifyLanguageModelStep-by-Step(arxiv.org)论文代码：https://github.com/codinnlg/detox-cot研究背景近年来，随着大语言模型（LargeLanguageModel,LLM）在自然语言处理任务上展现出优秀表现，大模型的安全问题应该得到重视。近

大数据AI人工智能培训专家培训讲师叶梓·2023-10-28 00:10

值得收藏！基于LLM的推荐系统全面综述！

https://zhuanlan.zhihu.com/p/634534308大型语言模型（LLMs）已在自然语言处理（NLP）领域崭露头角，并在推荐系统（RS）领域近期受到了极大关注。

WitsMakeMen·2023-10-22 14:28

推特爆火！超越ChatGPT和Llama2，新一代检索增强方法Self-RAG来了原创

作者|ZenMoore前言大型语言模型（LLMs）具有出色的能力，但由于完全依赖其内部的参数化知识，它们经常产生包含事实错误的回答，尤其在长尾知识中。

夕小瑶·2023-10-22 09:13

阿里妈妈Union Lab全量公测，你会用吗？

doudouduo6·2023-10-21 18:11

LLMs之BELLE：BELLE(一款能够帮到每一个人的中文LLM引擎)的简介(基于Alpaca架构+中文优化+考察词表扩充/数据质量/数据语言分布/数据规模的量化分析)、使用方法、案例应用之详细攻略

LLMs之BELLE：BELLE(一款能够帮到每一个人的中文LLM引擎)的简介(基于Alpaca架构+中文优化+考察词表扩充/数据质量/数据语言分布/数据规模的量化分析)、使用方法、案例应用之详细攻略导读

一个处女座的程序猿·2023-10-21 18:02

高性能计算与多模态处理的探索之旅：英伟达GH200性能优化与GPT-4V的算力加速未来

★多模态大模型；GPU算力；LLMS；LLM；LMM；GPT-4V；GH200；图像识别；目标定位；图像描述；视觉问答；视觉对话；英伟达；Nvidia；H100;L40s；A100;H100；A800；

高性能服务器·2023-10-21 04:35

谷歌与OpenAI合作，用Google Search为大模型刷新！

夕小瑶科技说原创编译|奶茶子最近一项由Google、UniversityofMassachusettsAmherst、OpenAI联合发布的研究探讨了大型语言模型（LLMS）面临的一个重要挑战，即它们在适应不断变化的世界时的困难

夕小瑶·2023-10-21 00:46

大模型的“幻觉”如何克服？腾讯AILab等《大型语言模型中的幻觉》，全面阐述检测、解释和减轻幻觉...

虽然大型语言模型（LLMs）在各种下游任务中展示出了卓越的能力，但一个重要的关注点是它们表现出幻觉的倾向：LLMs偶尔会生成与用户输入不符、与先前生成的上下文相矛盾或与已建立的世界知识不一致的内容。

人工智能学家·2023-10-21 00:34

MemGPT: Towards LLMs as Operating Systems

本文是LLM系列文章，针对《MemGPT:TowardsLLMsasOperatingSystems》的翻译。MemGPT：将LLM作为操作系统摘要1引言2MEMORY-GPT(MEMGPT)3实验4相关工作5结论要点和未来方向5.1局限性摘要大型语言模型（LLM）已经彻底改变了人工智能，但受到有限上下文窗口的限制，阻碍了它们在扩展对话和文档分析等任务中的实用性。为了能够在有限的上下文窗口之外使用

UnknownBody·2023-10-20 22:39

LLMs之RAG：利用langchain实现RAG应用五大思路步骤—基于langchain使用LLMs(ChatGPT)构建一个问题回答文档的应用程序实战代码

LLMs之RAG：利用langchain实现RAG应用五大思路步骤—基于langchain使用LLMs(ChatGPT)构建一个问题回答文档的应用程序实战代码目录相关文章

一个处女座的程序猿·2023-10-20 20:10

大模型掌握16000+真实世界API了，清华等机构ToolLLM的工具使用能力不输ChatGPT

相信大家都已经见识到了，开源大型语言模型（LLMs）及其变体（例如LLaMA和Vicuna）在各种任务上取得了显著的进展。然而，尽管LLM很强大，但它们在执行更高级任务方面

数据派THU·2023-10-20 00:31

使用LLM在KG上进行复杂的逻辑推理10.12+10.13

露葵025·2023-10-19 13:40

EdgeMoE：让LLM在边缘设备上推理成为现实

文章链接:EdgeMoE:FastOn-DeviceInferenceofMoE-basedLargeLanguageModels1.基础背景大型语言模型(LLMs)，如GPTs和LLaMa，由于其在广泛的机器学习任务中的卓越能力

恭仔さん·2023-10-18 16:05

如何通过SK集成chatGPT实现DotNet项目工程化？

SemanticKernel是一个SDK，它将OpenAI、AzureOpenAI和HuggingFace等大型语言模型（LLMs）与传统的编程语言如C＃、Python和Jav

token-go·2023-10-18 12:12

LangChain 开发LLM的框架

目录1、简介2、LangChain的主要价值3、模块4、安装4.1python版本安装4.2TypeScript版本安装npm安装yarn安装pnpm安装加载库5、环境设置6、构建一个应用程序7、LLMs8

和你一起去月球·2023-10-18 07:50

AGI热门方向：国内前五！AI智能体TARS-RPA-Agent落地，实在智能打造人手一个智能助理

大型语言模型（LLMs）的出现为智能代理的进一步发展带来了希望。目前，大型语

实在智能RPA·2023-10-18 06:14

大模型LLM相关面试题整理-位置编码-tokenizer-激活函数-layernorm

10LLMs位置编码篇10.1.1什么是位置编码？位置编码是一种用于在序列数据中为每个位置添加位置信息的技术。在自然语言处理中，位置编码通常用于处理文本序列。

zhurui_xiaozhuzaizai·2023-10-18 05:19

大模型LLM相关面试题整理-PEFT

5大模型（LLMs）参数高效微调(PEFT)5.1PEFT基础5.1.1微调方法是啥？如何微调？

zhurui_xiaozhuzaizai·2023-10-18 05:49

大模型LLM相关面试题整理-训练集-训练经验-微调

3大模型（LLMs）微调3.1如果想要在某个模型基础上做全参数微调，究竟需要多少显存？要确定全参数微调所需的显存量，需要考虑以下几个因素：模型的大小：模型的大小是指模型参数的数量。

zhurui_xiaozhuzaizai·2023-10-18 05:44

100问GPT4与大语言模型的关系以及LLMs的重要性

你现在是一个AI专家，语言学家和教师，你目标是让我理解语言模型的概念，理解ChatGPT跟语言模型之间的关系。你的工作是以一种易于理解的方式解释这些概念。这可能包括提供例子，提出问题或将复杂的想法分解成更容易理解的小块。现在我第一个问题是“什么是语言模型？好的，让我们开始！1.什么是语言模型（LanguageModel,简称LM）？语言模型是计算机用来理解和生成人类语言的数学模型。更具体地说，它可

AI架构师易筋·2023-10-17 23:29

如何选择最适合你的LLM优化方法：全面微调、PEFT、提示工程和RAG对比分析

一、前言自从ChatGPT问世以来，全球各地的企业都迫切希望利用大型语言模型（LLMs）来提升他们的产品和运营。

技术狂潮AI·2023-10-17 19:56

Langchain 代理 (Agents) ，赋能超级 LLMs

原文：Langchain代理(Agents)，赋能超级LLMs-知乎大型语言模型（LLMs）非常强大，但它们缺乏“最笨”的计算机程序可以轻松处理的特定能力。

javastart·2023-10-17 14:44

LangChain与大型语言模型(LLMs)应用基础教程:神奇的Agent

原文：LangChain与大型语言模型(LLMs)应用基础教程:神奇的Agent-CSDN博客LangChain是大型语言模型(LLM)的应用框架,LangChain可以直接与OpenAI的text-davinci

javastart·2023-10-17 14:41

Elasticsearch：什么是大语言模型 (LLMs)？

假设你想参加流行的游戏节目Jeopardy（这是一个美国电视游戏节目，参赛者将获得答案并必须猜测问题）。要参加演出，你需要了解任何事情的一切。所以你决定在接下来的三年里每天都花时间阅读互联网上的所有内容。你很快就会意识到这比最初看起来更难，并且需要投入巨大的时间。你还意识到互联网上有大量的信息。其中一些是事实，一些是观点，而大多数则介于两者之间。Jeopardy是基于事实的，因此将大部分时间花在两

Elastic 中国社区官方博客·2023-10-16 11:53

LLMs AWS Sagemaker JumpStart

现在您已经探讨了使用LLM构建应用程序的基础知识，我想向您展示一项名为AmazonSagemakerJumpStart的AWS服务，它可以帮助您快速进入生产并进行大规模操作。以下是您在先前视频中探讨的应用程序堆栈。正如您所看到的，构建一个LLM驱动的应用程序需要多个组件。SagemakerJumpStart是一个模型中心，它允许您快速部署该服务中提供的基础模型，并将它们集成到您自己的应用程序中。J

AI架构师易筋·2023-10-16 08:22

技术动态 | 再看大模型与知识图谱的融合策略：KnowledGPT–面向知识图谱检索进行大模型增强的框架工作...

大型语言模型（LLMs）在自然语言处理领域产生了令人印象深刻的影响，但它们在完整性、及时性、忠实性和适应能力等方面仍存在一些问题。例如：首先，LLM在及时更新和特定领域的专业性方面存在局限性。

开放知识图谱·2023-10-15 12:39

LLMs的终局是通用人工智能AGI总结生成式AI和大语言模型 Generative AI & LLMs

终于学完了生成式AI和大语言模型GenerativeAI&LLMs.LLMs解决了如下问题：对NLP的不能够理解长句子，解决方案自注意力机制TransformersarchitectureAttentionisallyouneed

AI架构师易筋·2023-10-15 08:22

LLM应用架构 LLM application architectures

该层提供了计算、存储和网络，以提供LLMs，并托管应用程序组件。您可以利用您的本地基础设施，或者通过按需和按使用量计费的云服务提供此基础设施。接下来，您将包括您希望

AI架构师易筋·2023-10-14 14:39

数据规模缩小 200 倍！指令微调高效指导大模型学习

夕小瑶科技说原创作者|智商掉了一地、Python最近大型语言模型（LLMs）的指令微调备受研究人员的关注，因为它可以开发LLM遵循指令的潜力，使其更加符合特定的任务需求。

夕小瑶·2023-10-14 14:51

LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-into Attention论文解读

IntroductionLLaMA-AdapterLearnableAdaptionPromptsZero-initAttention实验Introduction作者之处最近大语言模型获得了学术界与工业界广泛的关注，LLMs

HanZee·2023-10-13 08:50

大模型如何重塑推荐？《面向推荐的大型语言模型》综述，全面阐述LLM4Rec进展...

省时查报告-专业、及时、全面的报告库省时查方案-专业、及时、全面的方案库无需，无需注册，ChatGPT4直接使用ChatGPT提词手册，学完工作效率提升百倍大型语言模型（LLMs）已在自然语言处理（NLP

智能推荐系统·2023-10-12 06:37

LLMs 蒸馏, 量化精度, 剪枝模型优化以用于部署 Model optimizations for deployment

现在，您已经了解了如何调整和对齐大型语言模型以适应您的任务，让我们讨论一下将模型集成到应用程序中需要考虑的事项。在这个阶段有许多重要的问题需要问。第一组问题与您的LLM在部署中的功能有关。您需要模型生成完成的速度有多快？您有多少计算预算可用？您是否愿意为改善推理速度或降低存储空间而牺牲模型性能？第二组问题与您的模型可能需要的额外资源有关。您是否打算让您的模型与外部数据或其他应用程序进行交互？如果是

AI架构师易筋·2023-10-12 05:42

A Survey for In-context Learning

ASurveyforIn-contextLearning摘要：随着大语言模型(LLMs)能力的增长，上下文学习(ICL)已经成为一个NLP新的范式，因为LLMs仅基于几个训练样本让内容本身增强。

JL_Jessie·2023-10-11 01:48

LLMs之BELLE：源码解读(sft_train.py文件)源码解读(sft_train.py文件)采用LoRA微调模型—解析命令行参数→参数与日志初始化→初始化模型和标记器→模型优化(LoRA/梯

LLMs之BELLE：源码解读(sft_train.py文件)源码解读(sft_train.py文件)采用LoRA微调模型—解析命令行参数→参数与日志初始化→初始化模型和标记器→模型优化(LoRA/梯度检查点

一个处女座的程序猿·2023-10-10 22:35

LLMs Python解释器程序辅助语言模型（PAL）Program-aided language models (PAL)

正如您在本课程早期看到的，LLM执行算术和其他数学运算的能力是有限的。虽然您可以尝试使用链式思维提示来克服这一问题，但它只能帮助您走得更远。即使模型正确地通过了问题的推理，对于较大的数字或复杂的运算，它仍可能在个别数学操作上出错。这是您早些时候看到的一个示例，其中LLM试图像计算器一样工作，但得到了错误的答案。请记住，这个模型实际上没有进行任何真正的数学运算。它只是尝试预测完成提示的最有可能的标记

AI架构师易筋·2023-10-09 18:59

LLMs 入门实战系列

link【LLMs入门实战系列】【LLMs入门实战系列】交流群(注：人满可添加小编wx：yzyykm666加群！)

luoganttcc·2023-10-08 19:25

《2023 ChatGPT for Robotics:Design Principles and Model Abilities》阅读笔记

1Introduction自然语言处理(NLP)的快速发展导致了大型语言模型(LLMs)的发展，如BERT[2]、GPT-3[3]和Codex[4]，这些模型正在对广泛的应用程序进行革命。

初篱·2023-10-08 15:37

Thinking for Doing：让LLMs能推断他人心理状态来做出适当的行动。

LLMs通常能回答有关心理状态的问题，但往往不能将这些推断用于实际行动。例如，如果一个故事中的角色正在寻找他的背包，而模型知道背包在厨房里，那么模型应该能推断出最好的行动是建议角色去厨房查看。

AI 研习所·2023-10-08 15:30

OpenAI重大更新！为ChatGPT推出语音和图像交互功能

这标志着生成式人工智能运动的一个显著演进，OpenAI将基于语音助手与其强大的大型语言模型（LLMs）融为一体。自从大约九个月前首次推出以来，这款广受欢迎的生成式人工智能助手一直是近年来最成功的

BFT白芙堂·2023-10-07 11:57

LLMs 奖励剥削 RLHF: Reward hacking

让我们回顾一下你到目前为止所学到的内容。RLHF是一个微调过程，用于使LLM与人类偏好保持一致。在这个过程中，您利用奖励模型来评估LLM对提示数据集的完成情况，根据人类偏好指标（如有帮助或无帮助）进行评估。接下来，您使用强化学习算法，即PPO，在基于当前版本的LLM生成的完成情况上，根据奖励对LLM的权重进行更新。您将在多个迭代中使用许多不同的提示和模型权重的更新来执行此周期，直到获得所期望的对齐

AI架构师易筋·2023-10-06 19:24

LLMs 用强化学习进行微调 RLHF: Fine-tuning with reinforcement learning

让我们把一切都整合在一起，看看您将如何在强化学习过程中使用奖励模型来更新LLM的权重，并生成与人对齐的模型。请记住，您希望从已经在您感兴趣的任务上表现良好的模型开始。您将努力使指导发现您的LLM对齐。首先，您将从提示数据集中传递一个提示。在这种情况下，“Adogis…”，传递给指导LLM，然后生成一个完成，这种情况下是"…afurryanimal."一只毛茸茸的动物。接下来，您将将此完成和原始提示

AI架构师易筋·2023-10-06 10:51

RT1 RT2 RTX() 学习

若想要得到一个表现出当前LLMs能力的机器人大模型，收集数以亿计的机器人数据在短期内看起来是不可能的。

qq_478377515·2023-10-06 10:16

ChatGPT基础使用总结

文章目录一、ChatGPT基础概念大型语言模型LLMs---一种能够以类似人类语言的方式“说话”的软件ChatGPT定义---OpenAI研发的一款聊天机器人程序（2022年GPT-3.5，属于大型语言模型

runafterhit·2023-10-06 07:28

LLMs: 近端策略优化PPO Proximal policy optimization

Dr.EhsanKamalinejad，通常简称为EK，是一位机器学习应用科学家。他目前是亚马逊NLP开发中的精英科学家。以前，他共同创办了VisualOne，一家YCombinator计算机视觉初创公司。在此之前，他曾担任苹果的首席机器学习工程师，参与了诸如“回忆”等项目。EK还是加州州立大学东湾分校的数学副教授。EK，感谢您今天加入我们讨论PPO强化学习算法。谢谢您的邀请。PPO代表什么，这些

AI架构师易筋·2023-10-06 03:31

大语言模型(LLMs)综述调研

大语言模型why？->当模型参数超过一定规模时，大模型不仅取得了显著性能提升，并表现出了一些小规模语言模型不具备的特殊能力（emergentabilities）LLM->显著规模的PLMLLM的四个阶段：预训练、调优、使用、评估pre-training:howtopre-trainacapableLLMadaptationtuning:howtoeffectivelyadaptpre-traine

nanobobo·2023-10-05 12:29

推荐频道

llms