深入探讨Agentic RAG(A-RAG)

原文地址:Agentic RAG: Context-Augmented OpenAI Agents

2024 年 3 月 14 日

原文地址:Deep Dive into Agentic Retrieval Augmented Generation (A-RAG)

2024 年 3 月 4 日

概述

检索增强生成(RAG),它首先将查询输入到 RAG 管道中,该管道执行检索、重新排名、综合并返回响应。

深入探讨Agentic RAG(A-RAG)_第1张图片​​

本文探讨了如何通过增加代理层来提高响应生成代理(RAG)的效率和准确性。文章讨论了从概念到学习再到实施的必要性。文章使用了LlamaIndex实现了代理RAG,该框架具有RAG的最佳抽象,这些原理可以用于在任何其他框架中实现代理RAG。

为什么选择 A-RAG

当我们使用推理来确定要采取哪些行动以及采取这些行动的顺序时,需要人工智能代理。本质上,我们直接使用代理而不是LLM来完成一组需要规划、多步骤推理、工具使用和/或随着时间的推移学习的任务。

Agency : The ability to take action or to choose what action to take

在 RAG 的背景下,我们可以在选择 RAG 管道之前插入代理来增强推理,在 RAG 管道内进行检索或重新排序,最后在发送响应之前进行合成。通过自动执行重要 RAG 用例所需的复杂工作流程和决策,可以在很大程度上改进 RAG。

深入探讨Agentic RAG(A-RAG)_第2张图片​​

A-RAG 如何使用

RAG 上下文中代理的使用模式包括以下内容:

使用现有的 RAG 管道作为代理的工具

使用代理本身作为 RAG 工具

使用代理在查询时使用提供的上下文从 RAG(向量索引)检索工具

使用代理对一组现有工具进行查询规划

使用代理从使用 RAG 从工具池中检索的候选工具中选择一个工具

还可以混合搭配上述使用模式来实现复杂的 RAG 应用程序。

RAG代理可以根据功能进一步分类。它们可用于路由、一次性查询规划、工具使用、推理 + 行动 (ReAct) 以及动态规划和执行。这些范围从简单、低成本和低延迟到复杂、高成本和高延迟。

路由代理

路由代理本质上使用 LLM 来选择要选择的下游 RAG 管道。这是代理推理,因为它使用

你可能感兴趣的:(RAG,人工智能,自然语言处理)