E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
闻达语言模型
RAG(检索增强生成)在LLM(大型
语言模型
)中的应用
RAG(检索增强生成)在LLM(大型
语言模型
)中的应用I.介绍在当今信息时代,大型
语言模型
(LLM)的崛起标志着自然语言处理领域的一次重大进步。
一休哥助手
·
2024-01-27 21:30
人工智能
语言模型
人工智能
自然语言处理
实体识别与分类方法综述
目录前言1实体识别简介2基于模板和规则的方法3基于序列标注的方法3.1常见序列标注模型3.2模型参数估计和学习问题3.3常见序列预测模型4.基于深度学习的实体识别方法5基于预训练
语言模型
的实体识别5.1BERT
cooldream2009
·
2024-01-27 20:11
AI技术
NLP知识
知识图谱
分类
数据挖掘
人工智能
大
语言模型
-任务规划与分解论文
任务规划与分解1、Chain-of-ThoughtPromptingElicitsReasoninginLargeLanguageModelshttps://arxiv.org/abs/2201.11903Chain-of-ThoughtPromptingElicitsReasoninginLargeLanguageModels2、TreeofThoughts:DeliberateProblemS
Travis_del
·
2024-01-27 19:23
大语言模型
任务规划与分解
语言模型
人工智能
自然语言处理
大
语言模型
分布式训练技术原理
分布式训练技术原理数据并行FSDPFSDP算法是由来自DeepSpeed的ZeroRedundancyOptimizer技术驱动的,但经过修改的设计和实现与PyTorch的其他组件保持一致。FSDP将模型实例分解为更小的单元,然后将每个单元内的所有参数扁平化和分片。分片参数在计算前按需通信和恢复,计算结束后立即丢弃。这种方法确保FSDP每次只需要实现一个单元的参数,这大大降低了峰值内存消耗。(数据
三更科技公社
·
2024-01-27 19:52
AI前沿与LLM
chatGPT
语言模型
分布式
人工智能
2023年度佳作:AIGC、AGI、GhatGPT、人工智能大
语言模型
的崛起与挑战
目录前言01《ChatGPT驱动软件开发》内容简介02《ChatGPT原理与实战》内容简介03《神经网络与深度学习》04《AIGC重塑教育》内容简介05《通用人工智能》目录前言2023年是人工智能大
语言模型
大爆发的一年
鸭鸭渗透
·
2024-01-27 19:43
人工智能
AIGC
agi
语言模型
自然语言处理
用大模型为病人提供医疗咨询,谷歌推出AMIE模型
为了解决这一困境,谷歌的研究人员推出了专门用于医疗咨询的大
语言模型
AMIE(ArticulateMedicalIntelligenceExplorer)。
RPA中国
·
2024-01-27 19:09
rpa
人工智能
[晓理紫]每日论文分享(有中文摘要,源码或项目地址)--大模型、扩散模型、视觉导航
分类:大
语言模型
LLM视觉模型VLM扩散模型视觉导航具身智能,机器人强化学习开放词汇,检测分割[晓理紫]每日论文分享(有中文摘要,源码或项目地址)==LLM==标题:VisualWebArena:EvaluatingMultimodalAgentso
晓理紫
·
2024-01-27 19:07
每日论文
数据库
人工智能
语言模型
[晓理紫]每日论文分享(有中文摘要,源码或项目地址)--机器人、强化学习
分类:大
语言模型
LLM视觉模型VLM扩散模型视觉导航具身智能,机器人强化学习开放词汇,检测分割[晓理紫]每日论文分享(有中文摘要,源码或项目地址)==humanrobotinteraction==标题:
晓理紫
·
2024-01-27 19:07
每日论文
机器人
机器学习
人工智能
[晓理紫]每日论文分享(有中文摘要,源码或项目地址)--大模型、扩散模型、视觉导航
分类:大
语言模型
LLM视觉模型VLM扩散模型视觉导航具身智能,机器人强化学习开放词汇,检测分割==LLM==标题:SpeechGPT-Gen:ScalingChain-of-InformationSpeechGeneration
晓理紫
·
2024-01-27 19:07
每日论文
机器人
人工智能
深度学习
机器学习
[晓理紫]每日论文分享(有中文摘要,源码或项目地址)--机器人、强化学习
专属领域论文订阅VX扫吗关注{晓理紫|小李子},每日更新论文,如感兴趣,请转发给有需要的同学,谢谢支持如果你感觉对你有帮助可以扫吗关注,每日准时为你推送最新论文分类:大
语言模型
LLM视觉模型VLM扩散模型视觉导航具身智能
晓理紫
·
2024-01-27 19:37
每日论文
机器人
机器学习
深度学习
[晓理紫]每日论文分享(有中文摘要,源码或项目地址)--机器人相关、强化学习
专属领域论文订阅VX扫吗关注{晓理紫|小李子},每日更新论文,如感兴趣,请转发给有需要的同学,谢谢支持分类:大
语言模型
LLM视觉模型VLM扩散模型视觉导航具身智能,机器人强化学习开放词汇,检测分割[晓理紫
晓理紫
·
2024-01-27 19:36
每日论文
机器人
人工智能
机器学习
[晓理紫]每日论文分享(有中文摘要,源码或项目地址)--机器人、强化学习、开放词汇
专属领域论文订阅VX扫吗关注{晓理紫|小李子},每日更新论文,如感兴趣,请转发给有需要的同学,谢谢支持.非常感谢提供建议分类:大
语言模型
LLM视觉模型VLM扩散模型视觉导航具身智能,机器人强化学习开放词汇
晓理紫
·
2024-01-27 19:36
每日论文
机器人
用大模型训练实体机器人,谷歌推出机器人代理模型
谷歌DeepMind的研究人员推出了一款,通过视觉
语言模型
进行场景理解,并使用大
语言模型
来发出指令控制实体机器人的模型——AutoRTAutoRT可有效地推理自主权和安全性,并扩大实体机器人学习的数据收集规模
RPA中国
·
2024-01-27 19:01
机器人
人工智能
机器学习
Emergent Abilities of Large Language Models 机翻mark
摘要证明通过扩大
语言模型
可以可靠地提高性能和样本效率在广泛的下游任务。相反,本文讨论了我们称之为大型
语言模型
的新兴能力的一种不可预测的现象。
Travis_del
·
2024-01-27 18:38
大语言模型
大模型基础
语言模型
人工智能
自然语言处理
GPT4.5人工智能即将来临,ChatGPT的正面影响和负面影响(好处和坏处),利弊分析
近年来,人工智能技术的飞速进步催生了ChatGPT——一种强大的人工智能
语言模型
。其杰出的生成能力使其能够与人类进行自然、流畅的交流,从而在教育、医疗和娱乐等多个领域展现出巨大的应用潜力。
张飞的猪大数据
·
2024-01-27 17:34
日常开发技术总结
chatgpt
人工智能
大
语言模型
推理优化策略
大模型推理优化策略7.1显存优化PagedAttentionKVcache,其具有以下特点:1.显存占用大,14b级别的模型,每个token需要约0.7M-1M的显存;2.动态变化:KV缓存的大小取决于序列长度,这是高度可变和不可预测的。因此,这对有效管理KVcache挑战较大。该研究发现,由于碎片化和过度保留,现有系统浪费了60%-80%的显存。为了解决这个问题,该研究引入了PagedAtten
三更科技公社
·
2024-01-27 16:38
AI前沿与LLM
chatGPT
语言模型
人工智能
自然语言处理
Check Your Facts and Try Again: Improving Large Language Models with External Knowledge and Automate
本文介绍了一种名为LLM-AUGMENTER的系统,它能够增强大型
语言模型
(LLMs)的能力,使其在处理任务型对话和开放领域问答等下游任务时更加准确、可靠。
Travis_del
·
2024-01-27 16:51
幻觉
大语言模型
语言模型
人工智能
自然语言处理
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models导读
通过生成一系列中间推理步骤(即“思维链”)显著提高大型
语言模型
进行复杂推理的能力这篇论文探讨了如何通过生成一系列中间推理步骤(即“思维链”)显著提高大型
语言模型
进行复杂推理的能力。
Travis_del
·
2024-01-27 16:18
大语言模型
任务规划与分解
语言模型
人工智能
自然语言处理
The Rise and Potential of Large Language Model Based Agents: A Survey 导读
这篇论文探讨了基于大型
语言模型
(LLM)的智能代理的发展和潜力。传统的AI算法或训练策略只能提高特定任务的表现,而LLM作为通用且强大的模型,可以为设计适应不同场景的智能代理提供基础。
Travis_del
·
2024-01-27 14:49
大语言模型
ai
agent
语言模型
人工智能
自然语言处理
大
语言模型
-大模型基础文献
大模型基础1、AttentionIsAllYouNeedhttps://arxiv.org/abs/1706.03762attentionisallyouneed2、SequencetoSequenceLearningwithNeuralNetworkshttps://arxiv.org/abs/1409.3215基于深度神经网络(DNN)的序列到序列学习方法3、NeuralMachineTran
Travis_del
·
2024-01-27 14:19
大语言模型
大模型基础
语言模型
人工智能
深度学习
自然语言处理
大
语言模型
-幻觉
幻觉1、Siren’sSongintheAIOcean:ASurveyonHallucinationinLargeLanguageModelshttps://arxiv.corg/pdf/2309.01219.pdfAI海洋中的女妖之歌2、CheckYourFactsandTryAgain:ImprovingLargeLanguageModelswithExternalKnowledgeandAu
Travis_del
·
2024-01-27 14:19
大语言模型
语言模型
人工智能
自然语言处理
三个方面浅析数据对大
语言模型
的影响
由于大
语言模型
的训练需要巨大的计算资源,通常不可能多次迭代大
语言模型
预训练。千亿级参数量的大
语言模型
每次预训练的计算需要花费数百万元人民币。
快乐非自愿
·
2024-01-27 14:16
语言模型
人工智能
深度学习
如何使用Hugging Face微调大
语言模型
(LLMs)
大
语言模型
(LLMs)在过去一年取得了显著进步。
技术狂潮AI
·
2024-01-27 14:14
LLM应用实战
大模型企业实战
AI应用实战
语言模型
人工智能
自然语言处理
大模型微调
Hugging
Face
用ChatGPT写申请文书写进常春藤联盟?
该程序使用基于GPT-3.5、GPT-4架构的大型
语言模型
并以强化学习训练。ChatGPT目前仍以文字
do1twe11
·
2024-01-27 10:33
chatgpt
人工智能
BLIP-2: 基于冻结图像编码器和大型
语言模型
的语言-图像预训练引导
BLIP-2:基于冻结图像编码器和大型
语言模型
的语言-图像预训练引导项目地址BLIP-2的背景与意义BLIP-2的安装与演示BLIP-2模型库图像到文本生成示例特征提取示例图像-文本匹配示例性能评估与训练引用
OverlordDuke
·
2024-01-27 09:44
大语言模型
语言模型
人工智能
计算机视觉
Transformers Tutorial教程3-7
IntroductionTransformers库的一个使用,用这个库就可以很轻松地去使用和训练自己的一个预训练
语言模型
。
ringthebell
·
2024-01-27 09:44
大模型
人工智能
深度学习
LLM之Agent(九)| 通过API集成赋能Autogen Multi-Agent系统
随着大型
语言模型
的快速发展,构建基于LLM驱动的自治代理(autonomousagents)已经成为一个备受关注的话题。仅在过去一年中,就出现了许多基于这一理念的新技术和框架。
wshzd
·
2024-01-27 04:55
Agent
笔记
chatgpt
人工智能
LLM之RAG理论(八)| 提高RAG性能的9种技术
这年,ChatGPT与许多其他大型
语言模型
层出不穷,包括开源的和闭源的。与此同时,各个行业对个性化和全面运营的RAG的需求也在飙升,每个客户都渴望拥有自己的量身定制的解决方案。
wshzd
·
2024-01-27 04:55
RAG
笔记
人工智能
复现六:大模型评测教程
复现五LMDeploy的量化和部署-CSDN博客随着人工智能技术的快速发展,大规模预训练自然
语言模型
成为了研究热点和关注焦点。
cq99312254
·
2024-01-27 03:55
人工智能
语言模型
XTuner复现
blob/main/xtuner/README.mdhttps://github.com/InternLM/tutorial/blob/main/xtuner/README.md1.XTuner简介一个大
语言模型
微调工具箱
cq99312254
·
2024-01-27 03:24
语言模型
算法
降本增效及大模型优化调研总结[小工蚁视频调研]
智谱AIGLM4和InternLM2国产大
语言模型
更新迭代#小工蚁-小工蚁创始人-小工蚁创始人-哔哩哔哩视频(bilibili.com)Glm4可调研国产首个开源MoE大
河南-殷志强
·
2024-01-27 02:58
人工智能
深度学习
语言模型
AI新工具(20240125) 孟子GPT大模型开放公众服务;红薯智语-为小红书图片生成爆款文案的智能文案生成功能
孟子GPT大模型开放公众服务澜舟科技的孟子大模型是一款功能强大的生成式可控大
语言模型
。
go2coding
·
2024-01-27 02:43
AI智能工具
人工智能
gpt
《向量数据库指南》——AI 热潮中的非典型Milvus Cloud向量数据库
在这一年里,大
语言模型
(LLMs)因其卓越的自然语言处理能力而广受赞誉,极大地拓宽了机器学习应用的场景。开发者们逐渐意识到,有了LLMs,他们可以设计出更智能、更容易互动的应用程序。
LCHub低代码社区
·
2024-01-26 23:09
《向量数据库指南》
人工智能
数据库
向量数据库
Milvus
Cloud
Milvus
低代码
自己卷自己?英伟达发布大模型 ChipNeMo,专为芯片设计定制
英伟达发布了一个以自家内部数据为基础训练而成的定制大
语言模型
——ChipNeMo,可以帮助工程师完成与芯片设计相关的任务。这厢,黄仁勋穿着花背心、拿着手绢出席年会。
HyperAI超神经
·
2024-01-26 23:22
人工智能
Al
for
Science
模型
NVIDIA
英伟达
五大自然语言处理技术里程碑浅析
而自然语言处理的研究与业界发展中具有五大里程碑式的技术:词嵌入,循环神经网络,Transformer,注意力机制,大
语言模型
。
Syntax_CD
·
2024-01-26 21:54
实用自然语言处理技术
自然语言处理
人工智能
在游戏里开公司!基于ERNIE SDK的多智能体游戏应用
大型
语言模型
与游戏开发相结合,开辟了创新的游戏体验领域,提升了对话、剧情、人机互动等方面的呈现水平,为游戏开发带来了更为广阔的美好前景。在2023年末,开发者在
飞桨PaddlePaddle
·
2024-01-26 20:41
飞桨国赛
游戏
人工智能
paddlepaddle
AI引爆算力需求,思腾推出支持大规模深度学习训练的高性能AI服务器
近日人工智能研究公司OpenAI公布了其大型
语言模型
的最新版本——GPT-4,可10秒钟做出一个网站,60秒做出一个游戏,参加了多种基准考试测试,它的得分高于88%的应试者;随后百度CEO李彦宏宣布正式推出大
语言模型
STGPU
·
2024-01-26 19:58
人工智能
深度学习
服务器
NeurIPS2023 大
语言模型
(LLM)方向优质论文汇总!
大型
语言模型
(LLM)作为人工智能领域的重要分支,在NeurIPS2023大会上,关于LLM的论文也有很多。
AI热心分享家
·
2024-01-26 18:32
语言模型
人工智能
自然语言处理
金融科技创新中人工智能的应用:8篇优质论文精选(含2023)
1、BloombergGPT:ALargeLanguageModelforFinance面向金融领域的大型
语言模型
简述:本文介绍了BloombergGPT,一个基于广泛金融
AI热心分享家
·
2024-01-26 18:32
金融
科技
人工智能
Yi-VL模型发布:全球开源顶尖水平,仅次于GPT-4V多模态模型
Yi-VL模型以Yi
语言模型
为基础,开发了包括Yi-VL-34B和Yi-VL-6B两个版本,这两个版本均在全新的多模态基准测试MMMU中表现出色。
努力犯错
·
2024-01-26 18:40
人工智能
深度学习
机器学习
语言模型
自然语言处理
腾讯LLaMA Pro大模型:突破大模型微调的知识遗忘难题
引言:大模型微调中的挑战在人工智能的发展过程中,大型
语言模型
(LLM)的微调(fine-tuning)始终是提升模型在特定任务上性能的关键。然而,微调过程中常面临一个主要挑战:知识遗忘。
努力犯错
·
2024-01-26 18:40
llama
人工智能
深度学习
chatgpt
自然语言处理
gpt-3
通义千文大模型API调用示例(python)
API详情通义千问是阿里云自主研发的大
语言模型
,能够在用户自然语言输入的基础上,通过自然语言理解和语义分析,理解用户意图,在不同领域、任务内为用户提供服务和帮助。
孝钦显皇后给过版权费了
·
2024-01-26 17:56
深度学习
python
生成式
语言模型
的训练流程
生成式
语言模型
的训练流程通常包括以下几个步骤:数据收集:首先,需要收集用于训练
语言模型
的大量文本数据。这些数据可以是从互联网、书籍、文章、对话等来源获取的文本。
SugarPPig
·
2024-01-26 17:53
人工智能
语言模型
人工智能
自然语言处理
TensorRT-LLM在CodeFuse-CodeLlama-34B上的int4量化实践
Codefuse是由蚂蚁集团开发的专门用于支持整个软件开发生命周期的大型代码
语言模型
(CodeLLMs),涵盖设计、需求、编码、测试、部署、运维等关键阶段。
CodeFuse
·
2024-01-26 16:52
AIGC
AGI时代的奠基石:Agent+算力+大模型是构建AI未来的三驾马车吗?
★AIAgent;人工智能体,RPA;大
语言模型
;prompt;Copilot;AGI;ChatGPT;LLM;AIGC;CoT;Cortex;Genius;MetaGPT;大模型;人工智能;通用人工智能
高性能服务器
·
2024-01-26 15:02
人工智能
agi
百度
展望2024: 中国AI算力能否引爆高性能计算和大模型训练的新革命?
★算力;算法;人工智能;高性能计算;高性能;高互联;生成式人工智能;StableDiffusion;ChatGPT;CoPilot;文本创建;图像生成;代码编写;大
语言模型
;多模态大模型;预训练;边缘计算
高性能服务器
·
2024-01-26 15:02
人工智能
【ChatGPT 和文心一言哪个更好用?】
一、智能回复能力ChatGPT:作为一款先进的
语言模型
,ChatGPT在智能回复方面表现出色。它能够理解用户的问题并提供准
锅巴编程
·
2024-01-26 13:33
chatgpt
文心一言
人工智能
“文心一言”揭秘:智能
语言模型
的新里程碑
其中,智能
语言模型
作为AI领域的一大分支,更是引领着自然语言处理(NLP)技术的革新。今天,我要为大家揭秘的,正是这一领域的新里程碑——“文心一言”。
GeekyGuru
·
2024-01-26 13:02
文心一言
语言模型
人工智能
#AIGC##LLM##RAG# RAG:专补LLMs短板_减少LLM幻觉并多模态/RAG 技术最新进展
通过整合先前知识,它提升了大型
语言模型
的性能,广泛应用于多模态领域和垂直行业。本文深入探讨了RAG技术的演进历程、技术发展、LLMs问题及其解决方案,为读者提供了对这一前沿技术的全面理解。
向日葵花籽儿
·
2024-01-26 11:23
AIGC
NLP
AIGC
nlp
gpt
全文检索
语言模型
自然语言处理
深度学习与图像描述生成——看图说话(3)
目录一、整体架构二、学习策略2.1监督学习2.2无监督学习2.3强化学习三、特征映射3.1定义3.2原理3.3关键技术3.4重要案例3.5特别注意下特征空间这一概念四、
语言模型
4.1定义与原理4.2关键技术
giszz
·
2024-01-26 11:48
人工智能
深度学习
人工智能
上一页
11
12
13
14
15
16
17
18
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他