E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
llms
LangChain+LLM实战---LangChain中的6大核心模块
模型(Models)
LLMs
大型语言模型,将文本字符串作为输入,并返回文本字符串作为输出。聊天模型聊天模型通常由语言模型支持,但它们的API更加结构化。这些模型将聊天消息列表作为输入,并返回聊天消息。
lichunericli
·
2023-10-30 02:33
LangChain-LLM
人工智能
算法
langchain
LangChain+LLM实战---自定义模拟实现LLM
fromtypingimportAny,List,Mapping,Optionalfromlangchain.callbacks.managerimportCallbackManagerForLLMRunfromlangchain.
llms
.baseimportLLMimportreclassTfboyLLM
lichunericli
·
2023-10-30 02:03
LangChain-LLM
langchain
python
HuggingGPT Solving AI Tasks with ChatGPT and its Friends in HuggingFace---论文阅读总结
1、介绍
LLMS
(Largelanguagemodels)在语言理解、生成、交互和推理方面产生优越的能力,推动了新的研究主题,例如上下文学习、指令学习以及思维链提示。
星冢
·
2023-10-29 15:10
人工智能
chatgpt
论文阅读
GLoRE:大型语言模型的逻辑推理能力探究
最新研究揭示,尽管大语言模型
LLMs
在语言理解上表现出色,但在逻辑推理方面仍有待提高。为此,研究者们推出了GLoRE,一个全新的逻辑推理评估基准,包含12个数据集,覆盖三大任务类型。
zenRRan
·
2023-10-29 12:45
语言模型
人工智能
自然语言处理
零资源的大语言模型幻觉预防
相关工作2.1幻觉检测和纠正方法2.2幻觉检测数据集3方法论3.1概念提取3.2概念猜测3.2.1概念解释3.2.2概念推理3.3聚合3.3.1概念频率分数3.3.2加权聚合4实验5总结摘要大语言模型(
LLMs
露葵025
·
2023-10-28 14:50
论文
语言模型
人工智能
自然语言处理
为应对输出风险文本的情况,提出一种针对
LLMs
简单有效的思维链解毒方法
作者:汤泽成、周柯言单位:苏州大学人工智能研究院论文标题:[2308.08295]DetoxifyLanguageModelStep-by-Step(arxiv.org)论文代码:https://github.com/codinnlg/detox-cot研究背景近年来,随着大语言模型(LargeLanguageModel,LLM)在自然语言处理任务上展现出优秀表现,大模型的安全问题应该得到重视。近
大数据AI人工智能培训专家培训讲师叶梓
·
2023-10-28 00:10
人工智能
chatgpt
自然语言处理
人工智能
值得收藏!基于LLM的推荐系统全面综述!
https://zhuanlan.zhihu.com/p/634534308大型语言模型(
LLMs
)已在自然语言处理(NLP)领域崭露头角,并在推荐系统(RS)领域近期受到了极大关注。
WitsMakeMen
·
2023-10-22 14:28
语言模型
人工智能
推特爆火!超越ChatGPT和Llama2,新一代检索增强方法Self-RAG来了原创
作者|ZenMoore前言大型语言模型(
LLMs
)具有出色的能力,但由于完全依赖其内部的参数化知识,它们经常产生包含事实错误的回答,尤其在长尾知识中。
夕小瑶
·
2023-10-22 09:13
chatgpt
人工智能
阿里妈妈Union Lab全量公测,你会用吗?
UnionLab是一种智能化的选品推荐、推广内容创作工具,它内置了大语言模型(
LLMs
),使得选品、推广更加智能和简单。
doudouduo6
·
2023-10-21 18:11
Union
Lab
LLMs
之BELLE:BELLE(一款能够帮到每一个人的中文LLM引擎)的简介(基于Alpaca架构+中文优化+考察词表扩充/数据质量/数据语言分布/数据规模的量化分析)、使用方法、案例应用之详细攻略
LLMs
之BELLE:BELLE(一款能够帮到每一个人的中文LLM引擎)的简介(基于Alpaca架构+中文优化+考察词表扩充/数据质量/数据语言分布/数据规模的量化分析)、使用方法、案例应用之详细攻略导读
一个处女座的程序猿
·
2023-10-21 18:02
AI/AGI
NLP/LLMs
机器学习
基础大模型
自然语言处理
高性能计算与多模态处理的探索之旅:英伟达GH200性能优化与GPT-4V的算力加速未来
★多模态大模型;GPU算力;
LLMS
;LLM;LMM;GPT-4V;GH200;图像识别;目标定位;图像描述;视觉问答;视觉对话;英伟达;Nvidia;H100;L40s;A100;H100;A800;
高性能服务器
·
2023-10-21 04:35
多模态大模型
谷歌与OpenAI合作,用Google Search为大模型刷新!
夕小瑶科技说原创编译|奶茶子最近一项由Google、UniversityofMassachusettsAmherst、OpenAI联合发布的研究探讨了大型语言模型(
LLMS
)面临的一个重要挑战,即它们在适应不断变化的世界时的困难
夕小瑶
·
2023-10-21 00:46
人工智能
大模型的“幻觉”如何克服?腾讯AILab等《大型语言模型中的幻觉》,全面阐述检测、解释和减轻幻觉...
虽然大型语言模型(
LLMs
)在各种下游任务中展示出了卓越的能力,但一个重要的关注点是它们表现出幻觉的倾向:
LLMs
偶尔会生成与用户输入不符、与先前生成的上下文相矛盾或与已建立的世界知识不一致的内容。
人工智能学家
·
2023-10-21 00:34
语言模型
人工智能
自然语言处理
MemGPT: Towards
LLMs
as Operating Systems
本文是LLM系列文章,针对《MemGPT:TowardsLLMsasOperatingSystems》的翻译。MemGPT:将LLM作为操作系统摘要1引言2MEMORY-GPT(MEMGPT)3实验4相关工作5结论要点和未来方向5.1局限性摘要大型语言模型(LLM)已经彻底改变了人工智能,但受到有限上下文窗口的限制,阻碍了它们在扩展对话和文档分析等任务中的实用性。为了能够在有限的上下文窗口之外使用
UnknownBody
·
2023-10-20 22:39
LLM
人工智能
深度学习
语言模型
LLMs
之RAG:利用langchain实现RAG应用五大思路步骤—基于langchain使用
LLMs
(ChatGPT)构建一个问题回答文档的应用程序实战代码
LLMs
之RAG:利用langchain实现RAG应用五大思路步骤—基于langchain使用
LLMs
(ChatGPT)构建一个问题回答文档的应用程序实战代码目录相关文章
一个处女座的程序猿
·
2023-10-20 20:10
NLP/LLMs
langchain
chatgpt
大模型掌握16000+真实世界API了,清华等机构ToolLLM的工具使用能力不输ChatGPT
相信大家都已经见识到了,开源大型语言模型(
LLMs
)及其变体(例如LLaMA和Vicuna)在各种任务上取得了显著的进展。然而,尽管LLM很强大,但它们在执行更高级任务方面
数据派THU
·
2023-10-20 00:31
chatgpt
使用LLM在KG上进行复杂的逻辑推理10.12+10.13
在KG上进行复杂的逻辑推理摘要介绍相关工作方法问题格式化邻域检索和逻辑链分解链状推理提示实施细节实验结果数据集和基准模型RQ1.逻辑推理的有效性RQ2.链分解的优势RQ3.LLM规模的分析RQ4.增加
LLMs
露葵025
·
2023-10-19 13:40
论文
语言模型
EdgeMoE:让LLM在边缘设备上推理成为现实
文章链接:EdgeMoE:FastOn-DeviceInferenceofMoE-basedLargeLanguageModels1.基础背景大型语言模型(
LLMs
),如GPTs和LLaMa,由于其在广泛的机器学习任务中的卓越能力
恭仔さん
·
2023-10-18 16:05
混合专家模型
算法
论文笔记
论文阅读
如何通过SK集成chatGPT实现DotNet项目工程化?
SemanticKernel是一个SDK,它将OpenAI、AzureOpenAI和HuggingFace等大型语言模型(
LLMs
)与传统的编程语言如C#、Python和Jav
token-go
·
2023-10-18 12:12
chatgpt
LangChain 开发LLM的框架
目录1、简介2、LangChain的主要价值3、模块4、安装4.1python版本安装4.2TypeScript版本安装npm安装yarn安装pnpm安装加载库5、环境设置6、构建一个应用程序7、
LLMs
8
和你一起去月球
·
2023-10-18 07:50
AI
langchain
LLM
gpt
AGI热门方向:国内前五!AI智能体TARS-RPA-Agent落地,实在智能打造人手一个智能助理
大型语言模型(
LLMs
)的出现为智能代理的进一步发展带来了希望。目前,大型语
实在智能RPA
·
2023-10-18 06:14
热门技术
agi
人工智能
rpa
大模型LLM相关面试题整理-位置编码-tokenizer-激活函数-layernorm
10
LLMs
位置编码篇10.1.1什么是位置编码?位置编码是一种用于在序列数据中为每个位置添加位置信息的技术。在自然语言处理中,位置编码通常用于处理文本序列。
zhurui_xiaozhuzaizai
·
2023-10-18 05:19
自然语言处理
easyui
前端
javascript
大模型LLM相关面试题整理-PEFT
5大模型(
LLMs
)参数高效微调(PEFT)5.1PEFT基础5.1.1微调方法是啥?如何微调?
zhurui_xiaozhuzaizai
·
2023-10-18 05:49
自然语言处理
机器学习
深度学习
神经网络
大模型LLM相关面试题整理-训练集-训练经验-微调
3大模型(
LLMs
)微调3.1如果想要在某个模型基础上做全参数微调,究竟需要多少显存?要确定全参数微调所需的显存量,需要考虑以下几个因素:模型的大小:模型的大小是指模型参数的数量。
zhurui_xiaozhuzaizai
·
2023-10-18 05:44
自然语言处理
人工智能
深度学习
机器学习
100问GPT4与大语言模型的关系以及
LLMs
的重要性
你现在是一个AI专家,语言学家和教师,你目标是让我理解语言模型的概念,理解ChatGPT跟语言模型之间的关系。你的工作是以一种易于理解的方式解释这些概念。这可能包括提供例子,提出问题或将复杂的想法分解成更容易理解的小块。现在我第一个问题是“什么是语言模型?好的,让我们开始!1.什么是语言模型(LanguageModel,简称LM)?语言模型是计算机用来理解和生成人类语言的数学模型。更具体地说,它可
AI架构师易筋
·
2023-10-17 23:29
GPT-4
语言模型
chatgpt
人工智能
如何选择最适合你的LLM优化方法:全面微调、PEFT、提示工程和RAG对比分析
一、前言自从ChatGPT问世以来,全球各地的企业都迫切希望利用大型语言模型(
LLMs
)来提升他们的产品和运营。
技术狂潮AI
·
2023-10-17 19:56
LLM应用实战
AI应用实战
人工智能
模型微调
提示工程
RAG
Langchain 代理 (Agents) ,赋能超级
LLMs
原文:Langchain代理(Agents),赋能超级
LLMs
-知乎大型语言模型(
LLMs
)非常强大,但它们缺乏“最笨”的计算机程序可以轻松处理的特定能力。
javastart
·
2023-10-17 14:44
大模型
自然语言
人工智能
langchain
chatgpt
LangChain与大型语言模型(
LLMs
)应用基础教程:神奇的Agent
原文:LangChain与大型语言模型(
LLMs
)应用基础教程:神奇的Agent-CSDN博客LangChain是大型语言模型(LLM)的应用框架,LangChain可以直接与OpenAI的text-davinci
javastart
·
2023-10-17 14:41
langchain
大模型
prompt
人工智能
langchain
Elasticsearch:什么是大语言模型 (
LLMs
)?
假设你想参加流行的游戏节目Jeopardy(这是一个美国电视游戏节目,参赛者将获得答案并必须猜测问题)。要参加演出,你需要了解任何事情的一切。所以你决定在接下来的三年里每天都花时间阅读互联网上的所有内容。你很快就会意识到这比最初看起来更难,并且需要投入巨大的时间。你还意识到互联网上有大量的信息。其中一些是事实,一些是观点,而大多数则介于两者之间。Jeopardy是基于事实的,因此将大部分时间花在两
Elastic 中国社区官方博客
·
2023-10-16 11:53
Elasticsearch
AI
Elastic
语言模型
人工智能
自然语言处理
elasticsearch
大数据
搜索引擎
chatgpt
LLMs
AWS Sagemaker JumpStart
现在您已经探讨了使用LLM构建应用程序的基础知识,我想向您展示一项名为AmazonSagemakerJumpStart的AWS服务,它可以帮助您快速进入生产并进行大规模操作。以下是您在先前视频中探讨的应用程序堆栈。正如您所看到的,构建一个LLM驱动的应用程序需要多个组件。SagemakerJumpStart是一个模型中心,它允许您快速部署该服务中提供的基础模型,并将它们集成到您自己的应用程序中。J
AI架构师易筋
·
2023-10-16 08:22
LLM-Large
Language
Models
aws
云计算
深度学习
chatgpt
机器学习
技术动态 | 再看大模型与知识图谱的融合策略:KnowledGPT–面向知识图谱检索进行大模型增强的框架工作...
大型语言模型(
LLMs
)在自然语言处理领域产生了令人印象深刻的影响,但它们在完整性、及时性、忠实性和适应能力等方面仍存在一些问题。例如:首先,LLM在及时更新和特定领域的专业性方面存在局限性。
开放知识图谱
·
2023-10-15 12:39
知识图谱
人工智能
LLMs
的终局是通用人工智能AGI总结 生成式AI和大语言模型 Generative AI &
LLMs
终于学完了生成式AI和大语言模型GenerativeAI&
LLMs
.
LLMs
解决了如下问题:对NLP的不能够理解长句子,解决方案自注意力机制TransformersarchitectureAttentionisallyouneed
AI架构师易筋
·
2023-10-15 08:22
LLM-Large
Language
Models
人工智能
agi
语言模型
chatgpt
深度学习
LLM应用架构 LLM application architectures
该层提供了计算、存储和网络,以提供
LLMs
,并托管应用程序组件。您可以利用您的本地基础设施,或者通过按需和按使用量计费的云服务提供此基础设施。接下来,您将包括您希望
AI架构师易筋
·
2023-10-14 14:39
LLM-Large
Language
Models
架构
chatgpt
深度学习
人工智能
数据规模缩小 200 倍!指令微调高效指导大模型学习
夕小瑶科技说原创作者|智商掉了一地、Python最近大型语言模型(
LLMs
)的指令微调备受研究人员的关注,因为它可以开发LLM遵循指令的潜力,使其更加符合特定的任务需求。
夕小瑶
·
2023-10-14 14:51
学习
深度学习
机器学习
LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-into Attention论文解读
IntroductionLLaMA-AdapterLearnableAdaptionPromptsZero-initAttention实验Introduction作者之处最近大语言模型获得了学术界与工业界广泛的关注,
LLMs
HanZee
·
2023-10-13 08:50
llama
语言模型
深度学习
大模型如何重塑推荐?《面向推荐的大型语言模型》综述,全面阐述LLM4Rec进展...
省时查报告-专业、及时、全面的报告库省时查方案-专业、及时、全面的方案库无需,无需注册,ChatGPT4直接使用ChatGPT提词手册,学完工作效率提升百倍大型语言模型(
LLMs
)已在自然语言处理(NLP
智能推荐系统
·
2023-10-12 06:37
语言模型
人工智能
自然语言处理
深度学习
机器学习
LLMs
蒸馏, 量化精度, 剪枝 模型优化以用于部署 Model optimizations for deployment
现在,您已经了解了如何调整和对齐大型语言模型以适应您的任务,让我们讨论一下将模型集成到应用程序中需要考虑的事项。在这个阶段有许多重要的问题需要问。第一组问题与您的LLM在部署中的功能有关。您需要模型生成完成的速度有多快?您有多少计算预算可用?您是否愿意为改善推理速度或降低存储空间而牺牲模型性能?第二组问题与您的模型可能需要的额外资源有关。您是否打算让您的模型与外部数据或其他应用程序进行交互?如果是
AI架构师易筋
·
2023-10-12 05:42
LLM-Large
Language
Models
剪枝
算法
机器学习
chatgpt
深度学习
A Survey for In-context Learning
ASurveyforIn-contextLearning摘要:随着大语言模型(
LLMs
)能力的增长,上下文学习(ICL)已经成为一个NLP新的范式,因为
LLMs
仅基于几个训练样本让内容本身增强。
JL_Jessie
·
2023-10-11 01:48
深度学习
人工智能
机器学习
论文阅读
LLMs
之BELLE:源码解读(sft_train.py文件)源码解读(sft_train.py文件)采用LoRA微调模型—解析命令行参数→参数与日志初始化→初始化模型和标记器→模型优化(LoRA/梯
LLMs
之BELLE:源码解读(sft_train.py文件)源码解读(sft_train.py文件)采用LoRA微调模型—解析命令行参数→参数与日志初始化→初始化模型和标记器→模型优化(LoRA/梯度检查点
一个处女座的程序猿
·
2023-10-10 22:35
NLP/LLMs
自然语言处理
BELLE
大模型预训练
LLMs
Python解释器程序辅助语言模型(PAL)Program-aided language models (PAL)
正如您在本课程早期看到的,LLM执行算术和其他数学运算的能力是有限的。虽然您可以尝试使用链式思维提示来克服这一问题,但它只能帮助您走得更远。即使模型正确地通过了问题的推理,对于较大的数字或复杂的运算,它仍可能在个别数学操作上出错。这是您早些时候看到的一个示例,其中LLM试图像计算器一样工作,但得到了错误的答案。请记住,这个模型实际上没有进行任何真正的数学运算。它只是尝试预测完成提示的最有可能的标记
AI架构师易筋
·
2023-10-09 18:59
LLM-Large
Language
Models
python
语言模型
开发语言
chatgpt
深度学习
LLMs
入门实战系列
link【
LLMs
入门实战系列】【
LLMs
入门实战系列】交流群(注:人满可添加小编wx:yzyykm666加群!)
luoganttcc
·
2023-10-08 19:25
大模型
大模型
《2023 ChatGPT for Robotics:Design Principles and Model Abilities》阅读笔记
1Introduction自然语言处理(NLP)的快速发展导致了大型语言模型(
LLMs
)的发展,如BERT[2]、GPT-3[3]和Codex[4],这些模型正在对广泛的应用程序进行革命。
初篱
·
2023-10-08 15:37
chatgpt
笔记
人工智能
Thinking for Doing:让
LLMs
能推断他人心理状态来做出适当的行动。
LLMs
通常能回答有关心理状态的问题,但往往不能将这些推断用于实际行动。例如,如果一个故事中的角色正在寻找他的背包,而模型知道背包在厨房里,那么模型应该能推断出最好的行动是建议角色去厨房查看。
AI 研习所
·
2023-10-08 15:30
AGI
AIGC
大模型训练
AIGC
人工智能
OpenAI重大更新!为ChatGPT推出语音和图像交互功能
这标志着生成式人工智能运动的一个显著演进,OpenAI将基于语音助手与其强大的大型语言模型(
LLMs
)融为一体。自从大约九个月前首次推出以来,这款广受欢迎的生成式人工智能助手一直是近年来最成功的
BFT白芙堂
·
2023-10-07 11:57
chatgpt
LLMs
奖励剥削 RLHF: Reward hacking
让我们回顾一下你到目前为止所学到的内容。RLHF是一个微调过程,用于使LLM与人类偏好保持一致。在这个过程中,您利用奖励模型来评估LLM对提示数据集的完成情况,根据人类偏好指标(如有帮助或无帮助)进行评估。接下来,您使用强化学习算法,即PPO,在基于当前版本的LLM生成的完成情况上,根据奖励对LLM的权重进行更新。您将在多个迭代中使用许多不同的提示和模型权重的更新来执行此周期,直到获得所期望的对齐
AI架构师易筋
·
2023-10-06 19:24
LLM-Large
Language
Models
chatgpt
深度学习
LLMs
用强化学习进行微调 RLHF: Fine-tuning with reinforcement learning
让我们把一切都整合在一起,看看您将如何在强化学习过程中使用奖励模型来更新LLM的权重,并生成与人对齐的模型。请记住,您希望从已经在您感兴趣的任务上表现良好的模型开始。您将努力使指导发现您的LLM对齐。首先,您将从提示数据集中传递一个提示。在这种情况下,“Adogis…”,传递给指导LLM,然后生成一个完成,这种情况下是"…afurryanimal."一只毛茸茸的动物。接下来,您将将此完成和原始提示
AI架构师易筋
·
2023-10-06 10:51
LLM-Large
Language
Models
人工智能
chatgpt
深度学习
RT1 RT2 RTX() 学习
若想要得到一个表现出当前
LLMs
能力的机器人大模型,收集数以亿计的机器人数据在短期内看起来是不可能的。
qq_478377515
·
2023-10-06 10:16
学习
人工智能
ChatGPT基础使用总结
文章目录一、ChatGPT基础概念大型语言模型
LLMs
---一种能够以类似人类语言的方式“说话”的软件ChatGPT定义---OpenAI研发的一款聊天机器人程序(2022年GPT-3.5,属于大型语言模型
runafterhit
·
2023-10-06 07:28
软件工程类
chatgpt
人工智能
LLMs
: 近端策略优化PPO Proximal policy optimization
Dr.EhsanKamalinejad,通常简称为EK,是一位机器学习应用科学家。他目前是亚马逊NLP开发中的精英科学家。以前,他共同创办了VisualOne,一家YCombinator计算机视觉初创公司。在此之前,他曾担任苹果的首席机器学习工程师,参与了诸如“回忆”等项目。EK还是加州州立大学东湾分校的数学副教授。EK,感谢您今天加入我们讨论PPO强化学习算法。谢谢您的邀请。PPO代表什么,这些
AI架构师易筋
·
2023-10-06 03:31
LLM-Large
Language
Models
chatgpt
深度学习
大语言模型(
LLMs
)综述调研
大语言模型why?->当模型参数超过一定规模时,大模型不仅取得了显著性能提升,并表现出了一些小规模语言模型不具备的特殊能力(emergentabilities)LLM->显著规模的PLMLLM的四个阶段:预训练、调优、使用、评估pre-training:howtopre-trainacapableLLMadaptationtuning:howtoeffectivelyadaptpre-traine
nanobobo
·
2023-10-05 12:29
nlp
语言模型
人工智能
自然语言处理
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他