闻达语言模型第15页

RAG(检索增强生成)在LLM(大型语言模型)中的应用

RAG(检索增强生成)在LLM(大型语言模型)中的应用I.介绍在当今信息时代，大型语言模型（LLM）的崛起标志着自然语言处理领域的一次重大进步。

一休哥助手·2024-01-27 21:30

实体识别与分类方法综述

目录前言1实体识别简介2基于模板和规则的方法3基于序列标注的方法3.1常见序列标注模型3.2模型参数估计和学习问题3.3常见序列预测模型4.基于深度学习的实体识别方法5基于预训练语言模型的实体识别5.1BERT

cooldream2009·2024-01-27 20:11

大语言模型-任务规划与分解论文

任务规划与分解1、Chain-of-ThoughtPromptingElicitsReasoninginLargeLanguageModelshttps://arxiv.org/abs/2201.11903Chain-of-ThoughtPromptingElicitsReasoninginLargeLanguageModels2、TreeofThoughts:DeliberateProblemS

Travis_del·2024-01-27 19:23

大语言模型分布式训练技术原理

分布式训练技术原理数据并行FSDPFSDP算法是由来自DeepSpeed的ZeroRedundancyOptimizer技术驱动的，但经过修改的设计和实现与PyTorch的其他组件保持一致。FSDP将模型实例分解为更小的单元，然后将每个单元内的所有参数扁平化和分片。分片参数在计算前按需通信和恢复，计算结束后立即丢弃。这种方法确保FSDP每次只需要实现一个单元的参数，这大大降低了峰值内存消耗。(数据

三更科技公社·2024-01-27 19:52

2023年度佳作：AIGC、AGI、GhatGPT、人工智能大语言模型的崛起与挑战

目录前言01《ChatGPT驱动软件开发》内容简介02《ChatGPT原理与实战》内容简介03《神经网络与深度学习》04《AIGC重塑教育》内容简介05《通用人工智能》目录前言2023年是人工智能大语言模型大爆发的一年

鸭鸭渗透·2024-01-27 19:43

用大模型为病人提供医疗咨询，谷歌推出AMIE模型

为了解决这一困境，谷歌的研究人员推出了专门用于医疗咨询的大语言模型AMIE（ArticulateMedicalIntelligenceExplorer）。

RPA中国·2024-01-27 19:09

[晓理紫]每日论文分享(有中文摘要，源码或项目地址)--大模型、扩散模型、视觉导航

分类:大语言模型LLM视觉模型VLM扩散模型视觉导航具身智能，机器人强化学习开放词汇，检测分割[晓理紫]每日论文分享(有中文摘要，源码或项目地址)==LLM==标题:VisualWebArena:EvaluatingMultimodalAgentso

晓理紫·2024-01-27 19:07

[晓理紫]每日论文分享(有中文摘要，源码或项目地址)--机器人、强化学习

分类:大语言模型LLM视觉模型VLM扩散模型视觉导航具身智能，机器人强化学习开放词汇，检测分割[晓理紫]每日论文分享(有中文摘要，源码或项目地址)==humanrobotinteraction==标题:

晓理紫·2024-01-27 19:07

[晓理紫]每日论文分享(有中文摘要，源码或项目地址)--大模型、扩散模型、视觉导航

分类:大语言模型LLM视觉模型VLM扩散模型视觉导航具身智能，机器人强化学习开放词汇，检测分割==LLM==标题:SpeechGPT-Gen:ScalingChain-of-InformationSpeechGeneration

晓理紫·2024-01-27 19:07

[晓理紫]每日论文分享(有中文摘要，源码或项目地址)--机器人、强化学习

专属领域论文订阅VX扫吗关注{晓理紫|小李子}，每日更新论文，如感兴趣，请转发给有需要的同学，谢谢支持如果你感觉对你有帮助可以扫吗关注，每日准时为你推送最新论文分类:大语言模型LLM视觉模型VLM扩散模型视觉导航具身智能

晓理紫·2024-01-27 19:37

[晓理紫]每日论文分享(有中文摘要，源码或项目地址)--机器人相关、强化学习

专属领域论文订阅VX扫吗关注{晓理紫|小李子}，每日更新论文，如感兴趣，请转发给有需要的同学，谢谢支持分类:大语言模型LLM视觉模型VLM扩散模型视觉导航具身智能，机器人强化学习开放词汇，检测分割[晓理紫

晓理紫·2024-01-27 19:36

[晓理紫]每日论文分享(有中文摘要，源码或项目地址)--机器人、强化学习、开放词汇

专属领域论文订阅VX扫吗关注{晓理紫|小李子}，每日更新论文，如感兴趣，请转发给有需要的同学，谢谢支持.非常感谢提供建议分类:大语言模型LLM视觉模型VLM扩散模型视觉导航具身智能，机器人强化学习开放词汇

晓理紫·2024-01-27 19:36

用大模型训练实体机器人，谷歌推出机器人代理模型

谷歌DeepMind的研究人员推出了一款，通过视觉语言模型进行场景理解，并使用大语言模型来发出指令控制实体机器人的模型——AutoRTAutoRT可有效地推理自主权和安全性，并扩大实体机器人学习的数据收集规模

RPA中国·2024-01-27 19:01

Emergent Abilities of Large Language Models 机翻mark

摘要证明通过扩大语言模型可以可靠地提高性能和样本效率在广泛的下游任务。相反，本文讨论了我们称之为大型语言模型的新兴能力的一种不可预测的现象。

Travis_del·2024-01-27 18:38

GPT4.5人工智能即将来临，ChatGPT的正面影响和负面影响(好处和坏处)，利弊分析

近年来，人工智能技术的飞速进步催生了ChatGPT——一种强大的人工智能语言模型。其杰出的生成能力使其能够与人类进行自然、流畅的交流，从而在教育、医疗和娱乐等多个领域展现出巨大的应用潜力。

张飞的猪大数据·2024-01-27 17:34

大语言模型推理优化策略

大模型推理优化策略7.1显存优化PagedAttentionKVcache，其具有以下特点:1.显存占用大，14b级别的模型，每个token需要约0.7M-1M的显存；2.动态变化：KV缓存的大小取决于序列长度，这是高度可变和不可预测的。因此，这对有效管理KVcache挑战较大。该研究发现，由于碎片化和过度保留，现有系统浪费了60%-80%的显存。为了解决这个问题，该研究引入了PagedAtten

三更科技公社·2024-01-27 16:38

Check Your Facts and Try Again: Improving Large Language Models with External Knowledge and Automate

本文介绍了一种名为LLM-AUGMENTER的系统，它能够增强大型语言模型（LLMs）的能力，使其在处理任务型对话和开放领域问答等下游任务时更加准确、可靠。

Travis_del·2024-01-27 16:51

Chain-of-Thought Prompting Elicits Reasoning in Large Language Models导读

通过生成一系列中间推理步骤（即“思维链”）显著提高大型语言模型进行复杂推理的能力这篇论文探讨了如何通过生成一系列中间推理步骤（即“思维链”）显著提高大型语言模型进行复杂推理的能力。

Travis_del·2024-01-27 16:18

The Rise and Potential of Large Language Model Based Agents: A Survey 导读

这篇论文探讨了基于大型语言模型（LLM）的智能代理的发展和潜力。传统的AI算法或训练策略只能提高特定任务的表现，而LLM作为通用且强大的模型，可以为设计适应不同场景的智能代理提供基础。

Travis_del·2024-01-27 14:49

大语言模型-大模型基础文献

大模型基础1、AttentionIsAllYouNeedhttps://arxiv.org/abs/1706.03762attentionisallyouneed2、SequencetoSequenceLearningwithNeuralNetworkshttps://arxiv.org/abs/1409.3215基于深度神经网络（DNN）的序列到序列学习方法3、NeuralMachineTran

Travis_del·2024-01-27 14:19

大语言模型-幻觉

幻觉1、Siren’sSongintheAIOcean:ASurveyonHallucinationinLargeLanguageModelshttps://arxiv.corg/pdf/2309.01219.pdfAI海洋中的女妖之歌2、CheckYourFactsandTryAgain:ImprovingLargeLanguageModelswithExternalKnowledgeandAu

Travis_del·2024-01-27 14:19

三个方面浅析数据对大语言模型的影响

由于大语言模型的训练需要巨大的计算资源，通常不可能多次迭代大语言模型预训练。千亿级参数量的大语言模型每次预训练的计算需要花费数百万元人民币。

快乐非自愿·2024-01-27 14:16

如何使用Hugging Face微调大语言模型（LLMs）

大语言模型（LLMs）在过去一年取得了显著进步。

技术狂潮AI·2024-01-27 14:14

用ChatGPT写申请文书写进常春藤联盟？

该程序使用基于GPT-3.5、GPT-4架构的大型语言模型并以强化学习训练。ChatGPT目前仍以文字

do1twe11·2024-01-27 10:33

BLIP-2: 基于冻结图像编码器和大型语言模型的语言-图像预训练引导

BLIP-2:基于冻结图像编码器和大型语言模型的语言-图像预训练引导项目地址BLIP-2的背景与意义BLIP-2的安装与演示BLIP-2模型库图像到文本生成示例特征提取示例图像-文本匹配示例性能评估与训练引用

OverlordDuke·2024-01-27 09:44

Transformers Tutorial教程3-7

IntroductionTransformers库的一个使用，用这个库就可以很轻松地去使用和训练自己的一个预训练语言模型。

ringthebell·2024-01-27 09:44

LLM之Agent（九）| 通过API集成赋能Autogen Multi-Agent系统

随着大型语言模型的快速发展，构建基于LLM驱动的自治代理（autonomousagents）已经成为一个备受关注的话题。仅在过去一年中，就出现了许多基于这一理念的新技术和框架。

wshzd·2024-01-27 04:55

LLM之RAG理论（八）| 提高RAG性能的9种技术

这年，ChatGPT与许多其他大型语言模型层出不穷，包括开源的和闭源的。与此同时，各个行业对个性化和全面运营的RAG的需求也在飙升，每个客户都渴望拥有自己的量身定制的解决方案。

wshzd·2024-01-27 04:55

复现六：大模型评测教程

复现五LMDeploy的量化和部署-CSDN博客随着人工智能技术的快速发展，大规模预训练自然语言模型成为了研究热点和关注焦点。

cq99312254·2024-01-27 03:55

XTuner复现

blob/main/xtuner/README.mdhttps://github.com/InternLM/tutorial/blob/main/xtuner/README.md1.XTuner简介一个大语言模型微调工具箱

cq99312254·2024-01-27 03:24

降本增效及大模型优化调研总结[小工蚁视频调研]

智谱AIGLM4和InternLM2国产大语言模型更新迭代#小工蚁-小工蚁创始人-小工蚁创始人-哔哩哔哩视频(bilibili.com)Glm4可调研国产首个开源MoE大

河南-殷志强·2024-01-27 02:58

AI新工具(20240125) 孟子GPT大模型开放公众服务；红薯智语-为小红书图片生成爆款文案的智能文案生成功能

孟子GPT大模型开放公众服务澜舟科技的孟子大模型是一款功能强大的生成式可控大语言模型。

go2coding·2024-01-27 02:43

《向量数据库指南》——AI 热潮中的非典型Milvus Cloud向量数据库

在这一年里，大语言模型（LLMs）因其卓越的自然语言处理能力而广受赞誉，极大地拓宽了机器学习应用的场景。开发者们逐渐意识到，有了LLMs，他们可以设计出更智能、更容易互动的应用程序。

LCHub低代码社区·2024-01-26 23:09

自己卷自己？英伟达发布大模型 ChipNeMo，专为芯片设计定制

英伟达发布了一个以自家内部数据为基础训练而成的定制大语言模型——ChipNeMo，可以帮助工程师完成与芯片设计相关的任务。这厢，黄仁勋穿着花背心、拿着手绢出席年会。

HyperAI超神经·2024-01-26 23:22

五大自然语言处理技术里程碑浅析

而自然语言处理的研究与业界发展中具有五大里程碑式的技术：词嵌入，循环神经网络，Transformer，注意力机制，大语言模型。

Syntax_CD·2024-01-26 21:54

在游戏里开公司！基于ERNIE SDK的多智能体游戏应用

大型语言模型与游戏开发相结合，开辟了创新的游戏体验领域，提升了对话、剧情、人机互动等方面的呈现水平，为游戏开发带来了更为广阔的美好前景。在2023年末，开发者在

飞桨PaddlePaddle·2024-01-26 20:41

AI引爆算力需求，思腾推出支持大规模深度学习训练的高性能AI服务器

近日人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4，可10秒钟做出一个网站，60秒做出一个游戏，参加了多种基准考试测试，它的得分高于88%的应试者；随后百度CEO李彦宏宣布正式推出大语言模型

STGPU·2024-01-26 19:58

NeurIPS2023 大语言模型(LLM)方向优质论文汇总！

大型语言模型（LLM）作为人工智能领域的重要分支，在NeurIPS2023大会上，关于LLM的论文也有很多。

AI热心分享家·2024-01-26 18:32

金融科技创新中人工智能的应用：8篇优质论文精选（含2023）

1、BloombergGPT:ALargeLanguageModelforFinance面向金融领域的大型语言模型简述：本文介绍了BloombergGPT，一个基于广泛金融

AI热心分享家·2024-01-26 18:32

Yi-VL模型发布：全球开源顶尖水平，仅次于GPT-4V多模态模型

Yi-VL模型以Yi语言模型为基础，开发了包括Yi-VL-34B和Yi-VL-6B两个版本，这两个版本均在全新的多模态基准测试MMMU中表现出色。

努力犯错·2024-01-26 18:40

腾讯LLaMA Pro大模型：突破大模型微调的知识遗忘难题

引言：大模型微调中的挑战在人工智能的发展过程中，大型语言模型（LLM）的微调（fine-tuning）始终是提升模型在特定任务上性能的关键。然而，微调过程中常面临一个主要挑战：知识遗忘。

努力犯错·2024-01-26 18:40

通义千文大模型API调用示例(python)

API详情通义千问是阿里云自主研发的大语言模型，能够在用户自然语言输入的基础上，通过自然语言理解和语义分析，理解用户意图，在不同领域、任务内为用户提供服务和帮助。

孝钦显皇后给过版权费了·2024-01-26 17:56

生成式语言模型的训练流程

生成式语言模型的训练流程通常包括以下几个步骤：数据收集：首先，需要收集用于训练语言模型的大量文本数据。这些数据可以是从互联网、书籍、文章、对话等来源获取的文本。

SugarPPig·2024-01-26 17:53

TensorRT-LLM在CodeFuse-CodeLlama-34B上的int4量化实践

Codefuse是由蚂蚁集团开发的专门用于支持整个软件开发生命周期的大型代码语言模型（CodeLLMs），涵盖设计、需求、编码、测试、部署、运维等关键阶段。

CodeFuse·2024-01-26 16:52

AGI时代的奠基石：Agent+算力+大模型是构建AI未来的三驾马车吗？

★AIAgent；人工智能体，RPA；大语言模型；prompt；Copilot；AGI；ChatGPT；LLM；AIGC；CoT；Cortex；Genius；MetaGPT；大模型；人工智能；通用人工智能

高性能服务器·2024-01-26 15:02

展望2024: 中国AI算力能否引爆高性能计算和大模型训练的新革命？

★算力；算法；人工智能；高性能计算；高性能；高互联；生成式人工智能；StableDiffusion；ChatGPT；CoPilot；文本创建；图像生成；代码编写；大语言模型；多模态大模型；预训练；边缘计算

高性能服务器·2024-01-26 15:02

【ChatGPT 和文心一言哪个更好用？】

一、智能回复能力ChatGPT：作为一款先进的语言模型，ChatGPT在智能回复方面表现出色。它能够理解用户的问题并提供准

锅巴编程·2024-01-26 13:33

“文心一言”揭秘：智能语言模型的新里程碑

其中，智能语言模型作为AI领域的一大分支，更是引领着自然语言处理（NLP）技术的革新。今天，我要为大家揭秘的，正是这一领域的新里程碑——“文心一言”。

GeekyGuru·2024-01-26 13:02

#AIGC##LLM##RAG# RAG：专补LLMs短板_减少LLM幻觉并多模态/RAG 技术最新进展

通过整合先前知识，它提升了大型语言模型的性能，广泛应用于多模态领域和垂直行业。本文深入探讨了RAG技术的演进历程、技术发展、LLMs问题及其解决方案，为读者提供了对这一前沿技术的全面理解。

向日葵花籽儿·2024-01-26 11:23

深度学习与图像描述生成——看图说话（3）

目录一、整体架构二、学习策略2.1监督学习2.2无监督学习2.3强化学习三、特征映射3.1定义3.2原理3.3关键技术3.4重要案例3.5特别注意下特征空间这一概念四、语言模型4.1定义与原理4.2关键技术

giszz·2024-01-26 11:48

推荐频道

闻达语言模型

RAG(检索增强生成)在LLM(大型语言模型)中的应用

实体识别与分类方法综述

大语言模型-任务规划与分解论文

大语言模型分布式训练技术原理

2023年度佳作：AIGC、AGI、GhatGPT、人工智能大语言模型的崛起与挑战

用大模型为病人提供医疗咨询，谷歌推出AMIE模型

[晓理紫]每日论文分享(有中文摘要，源码或项目地址)--大模型、扩散模型、视觉导航

[晓理紫]每日论文分享(有中文摘要，源码或项目地址)--机器人、强化学习

[晓理紫]每日论文分享(有中文摘要，源码或项目地址)--大模型、扩散模型、视觉导航

[晓理紫]每日论文分享(有中文摘要，源码或项目地址)--机器人、强化学习

[晓理紫]每日论文分享(有中文摘要，源码或项目地址)--机器人相关、强化学习

[晓理紫]每日论文分享(有中文摘要，源码或项目地址)--机器人、强化学习、开放词汇

用大模型训练实体机器人，谷歌推出机器人代理模型

Emergent Abilities of Large Language Models 机翻mark

GPT4.5人工智能即将来临，ChatGPT的正面影响和负面影响(好处和坏处)，利弊分析

大语言模型推理优化策略

Check Your Facts and Try Again: Improving Large Language Models with External Knowledge and Automate

Chain-of-Thought Prompting Elicits Reasoning in Large Language Models导读

The Rise and Potential of Large Language Model Based Agents: A Survey 导读

大语言模型-大模型基础文献

大语言模型-幻觉

三个方面浅析数据对大语言模型的影响

如何使用Hugging Face微调大语言模型（LLMs）

用ChatGPT写申请文书写进常春藤联盟？

BLIP-2: 基于冻结图像编码器和大型语言模型的语言-图像预训练引导

Transformers Tutorial教程3-7

LLM之Agent（九）| 通过API集成赋能Autogen Multi-Agent系统

LLM之RAG理论（八）| 提高RAG性能的9种技术

复现六：大模型评测教程

XTuner复现

降本增效及大模型优化调研总结[小工蚁视频调研]

AI新工具(20240125) 孟子GPT大模型开放公众服务；红薯智语-为小红书图片生成爆款文案的智能文案生成功能

《向量数据库指南》——AI 热潮中的非典型Milvus Cloud向量数据库

自己卷自己？英伟达发布大模型 ChipNeMo，专为芯片设计定制

五大自然语言处理技术里程碑浅析

在游戏里开公司！基于ERNIE SDK的多智能体游戏应用

AI引爆算力需求，思腾推出支持大规模深度学习训练的高性能AI服务器

NeurIPS2023 大语言模型(LLM)方向优质论文汇总！

金融科技创新中人工智能的应用：8篇优质论文精选（含2023）

Yi-VL模型发布：全球开源顶尖水平，仅次于GPT-4V多模态模型

腾讯LLaMA Pro大模型：突破大模型微调的知识遗忘难题

通义千文大模型API调用示例(python)

生成式语言模型的训练流程

TensorRT-LLM在CodeFuse-CodeLlama-34B上的int4量化实践

AGI时代的奠基石：Agent+算力+大模型是构建AI未来的三驾马车吗？

展望2024: 中国AI算力能否引爆高性能计算和大模型训练的新革命？

【ChatGPT 和文心一言哪个更好用？】

“文心一言”揭秘：智能语言模型的新里程碑

#AIGC##LLM##RAG# RAG：专补LLMs短板_减少LLM幻觉并多模态/RAG 技术最新进展

深度学习与图像描述生成——看图说话（3）