向量检索、检索增强生成(RAG)、大语言模型及相关系统架构——典型面试问题及简要答案

1. 什么是向量检索?它与传统基于关键字的检索相比有什么不同?

答案要点

  • 向量检索是将文本、图像、音频等数据映射为向量,在高维向量空间中基于相似度或距离进行搜索。
  • 与传统基于关键字的检索(如倒排索引)相比,向量检索更关注“语义”或“特征”,能找出语义上相似但未必包含相同关键词的内容。
  • 向量检索非常适合多模态场景(例如“以图搜图”)或自然语言问答(同义词、上下文关联等)。

2. 什么是检索增强生成(RAG)?核心流程是怎样的?

答案要点

  • 检索增强生成(Retrieval-Augmented Generation,RAG)将“外部知识检索”与“生成式模型”结合起来,先检索与问题相关的文档/段落,再将结果作为上下文输入到生成模型进行回答或创作。
  • 核心流程包括:
    1. 对用户查询进行向量化并检索相关文档;
    2. 将检索到的文档与查询拼接(或摘要)成Prompt;
    3. 生成式模型基于Prompt生成最终答案;
    4. &#x

你可能感兴趣的:(算法工程师宝典(面试,学习最新技术必备),语言模型,系统架构,面试)