RAG检索增强生成只是起步,真正的智能问答=强化学习+大模型(各类型), 实现智能调度,SELF-RAG(自反思)。

RAG检索增强生成是近期几个大模型应用方向上 最难下笔的一个:

  • 一方面是因为技术方案仍在快速迭代;
  • 另一方面是市场对它的认知还存在一定偏差。

目前市场认为:chatBI(让大模型做数据查询和分析)很有用但是有难度;Agent(让大模型自助规划任务实现用户复杂的需求)虽然很酷炫,但是落地的应用少,不够成熟。

而对于 RAG,企业都很明确它的价值,并且技术实现上,一顿组合拳疯狂输出(文本切割 + 向量数据库 + 大模型)就能解决问题,是企业落地的不二之选。

事实真的是这样吗?这篇主要来记录一下我们在 RAG 方向有限的场景中遇到的问题及思考过程,抛砖引玉。

1.RAG检索增强 快速解读

全称 Retrieval-Augmented Generation,检索增强生成。

举个例子,比如我作为员工,直接问大模型:

提问:『 我们公司几点下班?』

大模型在没有见过我们公司《[员工手册])》的情况下(事实上,企业私有数据一般不会被大模型的参数所覆盖),几乎回答不正确,RAG 的能力在于能够让大模型结合企业[私有数据],完成特定领域的知识问答。RAG 把这类问题拆成两个步骤:

  • 第一:基于用户的提问,到《员工手册》里找到最相关的 N 个内容片段;<

你可能感兴趣的:(人工智能,自然语言处理,智能问答,RAG检索增强生成,大语言模型,self-RAG,语义搜索)