Follow My Instruction and Spill the Beans: Scalable Data Extraction from Retrieval-Augmented Generat
iclr20255688检索增强生成(Retrieval-AugmentedGeneration,RAG)通过在测试阶段引入外部知识,提升了预训练模型的能力,实现了定制化适应。然而,本文研究发现,在检索上下文增强的语言模型(Retrieval-In-ContextRAGLMs)中存在数据存储泄露的风险。我们展示了攻击者可以利用语言模型的指令遵循能力,通过提示注入(promptinjection)轻