技术狂潮AI

2023检索增强生成技术（RAG）研究进展

一、前言

在过去的一两年里，人工智能领域目睹了检索增强生成技术（RAG）的迅猛发展，这种技术结合了强大的语言模型与信息检索系统，以期在复杂的问题解决和信息处理任务中提供更加精确和深入的答案。正是这种对前沿科技的不懈追求，推动了RAG技术在2023年成为研究的热点。

随着大模型的不断进化，它们在各种任务中的表现已经达到了令人瞩目的水平。然而，无论模型的规模如何增长，它们仍受限于训练数据的质量和范围。RAG技术的出现，正是为了解决这一瓶颈。通过将动态检索过程与生成过程结合，RAG允许模型在生成响应之前，先从一个更广泛、更新的知识源中获取信息。这不仅提升了模型的表现，也极大扩展了其应用范围。

诸如 LangChain 和 LlamaIndex 等工具和框架投入了大量资源来研究和实现RAG技术。它们通过提供高效的检索策略和优化的生成方法，使得RAG不仅在学术界受到青睐，在工业界也逐渐展示出其巨大潜力。尤其是 LlamaIndex 从其官方发布的信息可以了解到2023年其在RAG领域做了不少的研究和探索，且取得了一定的成果。

然而，随着大模型本身的持续进步，一些人开始质疑RAG技术未来的地位。他们认为，如果大模型能够内化足够多的信息并提高内部处理复杂性，那么外部检索可能就不再必要。表面上看这种观点有其合理之处，但它忽视了一个关键因素：知识的动态性。世界在不断变化，信息也在持续更新。RAG技术通过实时检索最新信息保持了模型的时效性和准确性，这是单纯依靠预训练大模型难以实现的。

与传统检索相比，当前 RAG 系统最显著的不同之处在于其组件的灵活性和模块化设计。人们正不断以新颖和创造性的方式将大语言模型与检索结合起来，从而从数据中挖掘出更深层次的洞见。

未来，我们可以预见大模型和RAG技术将会共同进步，并可能融合发展。大模型可能会内置更加高效的检索机制，而RAG技术也会不断优化，使得检索过程更加精准、生成过程更加自然。在某些特定领域，大模型可能会逐渐减少对外部检索的依赖；但在需要处理最新信息或特定领域知识的任务中，RAG仍将是不可或缺的。预计2024年大模型将逐渐会在多模态领域进行深入的研究和突破。

由 Gao 等人撰写的论文《大语言模型的检索增强生成：一项调查》（Retrieval-Augmented Generation for Large Language Models: A Survey）对所有 RAG 研究进行了分类，分为三大类：1) 预训练模型（例如 RETRO），2) 微调加上 RAG（例如 RA-DIT），以及 3) 推理模式中的 RAG（例如 DSP）。这项调查应该算是目前看到的最全面的研究概览 - 它覆盖了超过 100 篇论文、博客文章和项目，贯穿 RAG 流程的每一个环节： ✅ 检索（数据块分割，查询重写，结果重排，嵌入向量微调） ✅ 生成（文本压缩，内容总结，大语言模型微调） ✅ 能够交织检索与生成的能力（路由选择，HyDE 技术，AI 智能体）

二、什么是 RAG？

大语言模型（Large Language Models，LLMs）已经成为我们生活和工作中不可或缺的一部分，它们以惊人的多功能性和智能，转变了我们与信息的互动方式。

然而，尽管拥有令人瞩目的能力，这些模型仍存在缺陷。它们可能产生误导性的“幻觉”（hallucinations），依赖潜在的过时信息，处理特定知识时效率不高，专业领域的深度不够，推理能力也有所欠缺。

在真实世界的应用中，数据需要持续更新以反映最新进展，并且生成的内容必须是透明并可追溯的，这对于管理成本和保护数据隐私至关重要。因此，仅依赖这些“黑盒子”模型是不够的；我们需要更精细的解决方案来满足这些复杂的需求。

在这种背景下，检索增强生成（Retrieval-Augmented Generation，RAG）作为人工智能时代的一项创新趋势，正在受到广泛关注。

RAG 在问答应用中的一个典型例子是（比如向 ChatGPT 询问关于 OpenAI CEO SAM Altman 被解雇和重新聘用的情况。 )

RAG 通过在语言模型生成答案之前，首先从外部数据库检索相关信息，大幅提高了内容的精准度和相关性。

三、RAG 的发展范式

Lewis 在 2020 年提出的 RAG 概念快速演变，经历了研究旅程中的几个不同阶段。起初，研究旨在通过在预训练阶段注入额外知识，来强化语言模型。ChatGPT 的推出极大地促进了对大模型进行深入上下文理解能力的兴趣，并加速了 RAG 在推理阶段的发展。随着研究人员对大语言模型（LLMs）能力的深入挖掘，焦点转向了提升它们的可控性和推理技巧，以满足日益增长的需求。GPT-4 的问世是一个重要里程碑，它采用了一种将 RAG 与微调技术结合的新方法，同时继续优化预训练策略。

RAG 研究发展历程图谱

我们从技术演变的视角，将 RAG 的发展分为以下几个阶段：

3.1、初级 RAG

经典的 RAG 流程，即初级 RAG，主要包括三个步骤：

索引 - 将文档分割成短小的片段，并利用编码器建立一个向量索引。
检索 - 根据问题与这些片段之间的相似度来寻找相关的文档片段。
生成 - 结合检索到的信息，生成回答问题的内容。

3.2、高级 RAG

初级 RAG 在信息检索、内容生成和信息增强方面存在挑战。为此，高级 RAG 应运而生，它在检索前后加入了额外的处理步骤。在检索前，可以采用查询重写、路径选择和扩展等方法来缩小问题与文档片段之间的语义差异。检索后，对文档进行重新排序，以避免在信息处理中出现信息丢失或上下文信息过于冗长的问题。

3.3、模块化 RAG

随着技术的不断进步，RAG 超越了传统的检索-生成框架，发展出了模块化 RAG。这一结构不仅更加灵活自由，还引入了更多定制化的功能模块，例如查询搜索引擎和多答案整合。技术上，它将信息检索与微调、强化学习等技术相结合。从流程上看，RAG 的各个模块被精心设计和调配，形成了多种RAG模式。

但模块化 RAG 并非一蹴而就；它是在前两个范式基础上逐步演化而来的。高级 RAG 可以看作是模块化 RAG 的一个特殊实例，而初级 RAG 则是高级 RAG 的一个简化版本。

三种 RAG 范式的对比分析。

四、怎样进行智能增强处理？

想要打造一个出色的 RAG（检索增强生成）系统，关键在于如何巧妙地进行信息增强。在这个过程中，我们需要深思熟虑以下三个问题：

我们要从海量信息中检索哪些内容？
我们应该在什么时候进行这样的检索？
我们如何有效利用检索到的这些内容？

针对这些问题，我们可以将信息增强分为以下几个阶段：

增强的阶段。我们可以在模型的预训练、微调或是实际应用推理时进行信息检索增强，不同阶段对计算资源的需求各不相同，也影响着外部知识如何与模型参数结合。
增强的来源。信息增强可以来源于多种数据形式。非结构化数据可能是文本段落、短语或单词；而结构化数据则可能是已经建立好索引的文档、数据三元组或是数据子图。除了这些外部来源，我们还可以仅依靠大语言模型（LLMs）本身的能力，从模型自己生成的内容中提取信息。
增强的过程。最初，我们可能只做一次简单的检索，但随着技术的进步，我们开始尝试更为复杂的迭代检索、递归检索和自适应检索方法，让模型根据情况自行决定何时进行检索。

涵盖不同信息增强方面的技术树。

RAG 系统核心组件详细分类

五、RAG 还是微调？

在大语言模型 (LLM) 的优化策略中，除了 RAG，我们还经常听到提示工程 (Prompt Engineering) 和微调 (Fine-tuning, FT)。这些策略各有千秋，根据对外部知识的依赖程度和模型调整的需要，它们在不同的应用场景下各显神通。

使用 RAG 就好比给模型配备了一本定制的教科书，它能够针对特定的问题进行精准的信息查找。而微调则像是让模型变成一个学习者，随着时间逐步吸收和内化知识，这使得模型更擅长于复制特定的结构、风格或格式。通过提升模型已有的知识水平、调整其输出结果以及训练它执行复杂的指令，微调能够提高模型的表现力和工作效率。然而，微调不太擅长融入新知识或快速应对新的使用场景。RAG 和微调并不是对立的，它们可以互相补充，在一起使用时可能会带来最好的效果。

RAG 和微调的比较图表

六、如何评价 RAG 的效果呢？

评估 RAG 的方法多种多样，主要包括三个质量评分：上下文相关性、答案的准确度以及答案的相关性。此外，评估还涉及到四个关键能力：抵抗干扰的能力、拒绝回答不当问题的能力、整合信息的能力、以及在面对假设性情况时保持稳定性的能力。这些评估维度结合了传统的量化指标和专门针对 RAG 特点的评估标准，虽然这些标准还没有统一规定。

在评估框架方面，我们有一些基准测试如 RGB 和 RECALL，还有自动化评估工具如 RAGAS、ARES 和 TruLens，这些工具帮助我们全面地衡量 RAG 模型的性能。

七、发展前景

随着检索增强生成 (Retrieval-Augmented Generation, RAG) 技术的快速发展，我们面临着一系列值得深入探讨的新问题。我们可以从三个方面来展望这些问题：

7.1、现有挑战

为了进一步解决 RAG 目前面临的挑战，我们考虑如下几个方面：

上下文长度：当检索到的内容过多，超出了模型处理的窗口限制，我们该如何应对？如果大语言模型 (Large Language Model, LLMs) 的上下文窗口不再有限制，我们应该如何优化 RAG？
鲁棒性：面对检索到的不正确内容，我们该如何处理？我们如何过滤和验证检索到的内容？我们能如何提升模型对抗错误信息和噪声的能力？
微调协同：如何同时发挥 RAG 和微调 (Fine-tuning, FT) 的效果？它们之间应该如何协调，是串行、交替还是端到端组织？
规模定律：RAG 模型是否遵循规模定律？在什么情况下，RAG 可能会出现逆规模定律的现象？
大语言模型的角色：LLMs 可以用于检索（用生成替代搜索或搜索 LLMs 的记忆）、生成和评估。我们如何进一步挖掘 LLMs 在 RAG 中的潜力？
生产部署：我们如何减少超大规模语料库的检索延时？我们如何确保 LLMs 检索到的内容不被泄露？

7.2、多模态扩展

RAG 的技术和概念正在不断进化，它们将如何扩展到图像、音频、视频或代码等其他数据形式？一方面，这可以增强单一模态内的任务性能；另一方面，它可以通过 RAG 的思想来实现多模态数据的融合。

7.3、RAG 生态系统

RAG 的应用范围已经不再局限于问答系统，其影响力正在向更广泛的领域扩散。目前，包括推荐系统、信息提取和报告生成在内的多种任务已经开始受益于 RAG 技术的应用。

同时，RAG 技术栈也在迅速壮大。市场上不仅有像 Langchain 和 LlamaIndex 这样的知名工具，还涌现出许多更具针对性的 RAG 工具。这些工具有的为特定用例量身定制，满足更具体的场景需求；有的简化了使用流程，进一步降低了使用门槛；还有的在功能上进行了专业化设计，逐步适应生产环境的需求。

八、RAG 论文清单

8.1、增强阶段

8.1.1、预训练

通过检索数万亿 Token (Token) 来改善语言模型

https://arxiv.org/abs/2112.04426

少样本学习借助检索增强型语言模型

https://arxiv.org/pdf/2208.03299.pdf

Toolformer: 语言模型自学使用工具

https://arxiv.org/abs/2302.04761

一切只需复制

https://openreview.net/pdf?id=CROlOA9Nd8C

结合检索增强的编解码器进行上下文学习

https://arxiv.org/abs/2308.07922

我们是否应该通过检索来预训练自回归语言模型？

https://arxiv.org/abs/2304.06762

展示-搜索-预测: 融合检索与语言模型，用于知识密集型自然语言处理

https://arxiv.org/abs/2212.14024

8.1.2、微调

密集通道检索在开放域问答中的应用

https://arxiv.org/abs/2004.04906

UPRISE: 通用提示检索助力零样本评估提升

https://arxiv.org/abs/2303.08518

https://github.com/microsoft/LMOps

问答系统中从阅读器到检索器的知识转移

https://arxiv.org/abs/2012.04584

RA-DIT: 检索增强双指令微调

https://arxiv.org/abs/2310.01352

Self-RAG: 自我反思学习检索、生成及评价

https://arxiv.org/abs/2310.11511

知识图谱增强的语言模型，用于生成知识驱动对话

https://arxiv.org/abs/2305.18846

结构感知预训练语言模型，提高结构化数据的密集检索性

https://aclanthology.org/2023.findings-acl.734.pdf

https://github.com/OpenMatch/SANTA

Replug: 检索增强的黑盒语言模型

https://arxiv.org/pdf/2301.12652.pdf

适应性增强检索器，提升语言模型作为泛用插件的泛化能力

https://arxiv.org/abs/2305.17331

https://github.com/OpenMatch/Augmentation-Adapted-Retriever

8.1.3、推理

通过记忆实现泛化：最近邻居语言模型

https://arxiv.org/abs/1911.00172

展示-搜索-预测: 融合检索与语言模型，用于知识密集型自然语言处理

https://arxiv.org/abs/2212.14024

https://github.com/stanfordnlp/dspy

关键词增强检索: 结合语音接口的信息检索新框架

https://arxiv.org/abs/2310.04205

在多步骤问题解答中交错使用检索与链式思考推理

https://arxiv.org/pdf/2212.10509.pdf

https://github.com/stonybrooknlp/ircot

直接生成：大语言模型 (Large Language Model) 作为出色的上下文生成器

https://arxiv.org/abs/2209.10063

https://github.com/wyu97/GenRead

上下文中使用检索增强的语言模型

https://arxiv.org/abs/2302.00083

8.2、增强来源

8.2.1、非结构化数据

UPRISE: 通用提示检索助力零样本评估提升

https://arxiv.org/abs/2303.08518

https://github.com/microsoft/LMOps

从分类到生成：洞察跨语言检索增强互动式上下文学习 (ICL)

https://arxiv.org/abs/2311.06595

简单复制即可

https://openreview.net/pdf?id=CROlOA9Nd8C

8.2.2、结构化数据

FABULA: 利用检索增强的叙事技术生成情报报告

https://arxiv.org/abs/2310.13848

知识图谱辅助的语言模型：用于生成知识驱动的对话

https://arxiv.org/abs/2305.18846

KnowledGPT: 结合知识库的检索和存储访问来提升大语言模

https://arxiv.org/abs/2308.11761

Graph-ToolFormer: 利用 ChatGPT 增强提示来提升大语言模型的图形推理能力

https://arxiv.org/abs/2304.11116

8.2.3、LLM 生成内容

自我提升：带有记忆功能的检索增强文本生成技术

https://arxiv.org/abs/2305.02437

展示—搜索—预测：结合检索与语言模型技术，面向知识密集型自然语言处理任务

https://arxiv.org/abs/2212.14024

Recitation-augmented 语言模型

https://arxiv.org/pdf/2210.01296.pdf

生成胜于检索：大语言模型作为强大的上下文生成器

https://arxiv.org/abs/2209.10063

自我知识引导的检索增强技术，用于提升大语言模型

https://arxiv.org/abs/2310.05002

8.3、增强过程

8.3.1、一次性检索

面向知识密集型自然语言处理任务的检索增强生成方法

https://proceedings.neurips.cc/paper/2020/hash/6b493230205f780e1bc26945df7481e5-Abstract.html

UPRISE: 通用提示式检索改善零样本评估技术

https://arxiv.org/abs/2303.08518

带参数化知识引导的大语言模型增强技术

https://arxiv.org/abs/2305.04757

学习为大语言模型检索上下文示例的方法

https://arxiv.org/pdf/2307.07164.pdf

使用检索增强的少样本学习语言模型

https://arxiv.org/pdf/2208.03299.pdf

Replug: 检索增强的黑箱式语言模型

https://arxiv.org/pdf/2301.12652.pdf

背诵增强式语言模型

https://arxiv.org/pdf/2210.01296.pdf

8.3.2、迭代检索

展示—搜索—预测：结合检索与语言模型技术，面向知识密集型自然语言处理任务

https://arxiv.org/abs/2212.14024

https://github.com/stanfordnlp/dspy

检索与抽样：结合混合检索增强技术进行文档级事件参数提取

https://aclanthology.org/2023.acl-long.17/

通过迭代检索与生成的协同作用来增强大语言模型的检索能力

https://arxiv.org/abs/2305.15294

检索-生成协同作用下的大语言模型增强方法

https://arxiv.org/abs/2310.05149

8.3.3、递归式检索

结合思维链条推理与信息检索，解答知识密集型多步骤问题

https://arxiv.org/abs/2212.10509

https://github.com/stonybrooknlp/ircot

采用检索增强型大语言模型 (LLM) 解开含糊问题的迷雾

https://arxiv.org/abs/2310.14696

8.3.4、自适应检索

主动式检索增强生成技术

https://arxiv.org/abs/2305.06983

https://github.com/jzbjyb/FLARE

自我RAG：自省中学习检索、生成及评判的艺术

https://arxiv.org/abs/2310.11511

结合检索功能的编解码器语言模型上下文学习方法

https://arxiv.org/abs/2308.07922

九、References

[1]. Retrieval-Augmented Generation for Large Language Models: A Survey”Gao, Yunfan, et al. 2023

https://arxiv.org/pdf/2312.10997.pdf

具身智能：从理论到实践的跨越
具身智能（EmbodiedAI）的概念起源与发展是一个跨越半个多世纪的学术探索历程，其核心思想在不同学科的交叉碰撞中逐渐成型。以下从理论源头、技术奠基、术语演进三个维度展开解析，揭示这一概念的学术脉络与产业价值：一、理论源头：从图灵的哲学构想到认知科学的具身化转向1.图灵的"感官机器"设想（1950年）在人工智能奠基性论文《计算机器与智能》中，图灵提出了两种智能发展路径：抽象计算路径：如国际象棋等
聊聊artemis的SlowConsumerReaperRunnable go4it
序本文主要研究一下artemis的SlowConsumerReaperRunnableSlowConsumerPolicyactivemq-artemis-2.11.0/artemis-server/src/main/java/org/apache/activemq/artemis/core/settings/impl/SlowConsumerPolicy.javapublicenumSlowCo
PyCharm高效入门指南：从零开始掌握Python开发利器软考和人工智能学堂 Python开发经验强化学习 PyCharm
引言PyCharm是JetBrains公司推出的一款强大的Python集成开发环境(IDE)，被全球数百万Python开发者所青睐。无论你是Python初学者还是经验丰富的开发者，掌握PyCharm都能显著提升你的开发效率。本文将带你从零开始，全面了解PyCharm的核心功能和使用技巧。1.PyCharm的安装与配置1.1下载与安装首先访问JetBrains官网下载PyCharm。PyCharm有
2023-05-09 论文小天才
2023年社会科学、人文艺术与文化国际会议（SSHAC2023)大会简介2023年社会科学、人文、艺术和文化国际会议（SSHAC2023）将在四川省成都市举行。会议旨在为从事“社会科学”和“人文艺术”研究的专家学者提供一个平台，分享科研成果和前沿技术，了解学术发展趋势，拓宽研究思路，加强学术研究和讨论，促进学术成果产业化合作。大会邀请了来自国内外高校和研究机构的专家、学者、企业家等相关人员。热忱欢
深圳市十大无创亲子鉴定中心大全(附2024年9月汇总鉴定) 中量亲鉴生物
深圳哪里可以做无创亲子鉴定？在深圳市盐田区盐梅路的国权基因可以做无创亲子鉴定咨询。为了帮助市民更好地了解和选择深圳的无创亲子鉴定机构，我们提供2024年最新的深圳无创亲子鉴定中心名录。本文将详细介绍这些鉴定中心的地址、工作时间、业务范围，以及选择适合自己的鉴定机构等信息，以助您在需要时能轻松找到合适的无创亲子鉴定服务。1、深圳市第二人民医院（福田区）地址：深圳市福田区笋岗西路2、北京中医药大学深圳
家庭服务具身智能机器人体系架构
硬件方面：差速移动机器人+六轴协作机械臂，软件方面选择ROS系统：底盘控制move_group，机械臂操纵MoveIt，大模型方面采用VLM+LLM：（1）视觉语言模型（VLM），用来实现环境理解与指令解析，候选模型为LLaVA和Qwen-VL。微调VLM需要2~4周，工作量主要是准备环境数据和标注期望输出。（2）大语言模型（LLM），用来实现任务分解与技能调用，候选工具有LangChain（任务
M3088NL是一款网络滤波器/变压器支持100M和1000M网络环境，适用于高速网络传输场景M3088 Shang13113048791 网络边缘计算图像处理信号处理
M3088NL是一款网络滤波器/变压器，主要特点如下：兼容性支持100M和1000M网络环境，适用于高速网络传输场景。‌封装形式采用SOP/SOIC封装，便于电路集成。‌应用场景常用于网络电话、开关电源等需要稳定电流的设备，符合IEEE802.3af标准。‌性能参数‌•电流能力‌：350mA•‌传输方式‌：需1:1的传输和收发器配合使用‌•‌安全标准‌：符合ROHS环保标准•标准‌：符合IEEE8
JAVA学习-行为抽象和Lambda.Lambda表达式守护者170 java学习 java 学习开发语言
行为抽象和Lambda表达式是Java8引入的新特性，用于简化代码和提高代码的可读性。一、概述、特点、使用方法以及与其他比较和高级应用的说明：1.行为抽象：它是指将一段代码抽象为一种功能或行为，以便在需要时可以传递给其他方法或对象。行为抽象通常通过接口来定义，其中接口包含一个或多个抽象方法来表示不同的功能。2.Lambda表达式：Lambda表达式是一种简洁的语法，用于实现行为抽象。它可以替代匿名
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言在AI大模型百花齐放的时代，很多人都对新兴技术充满了热情，都想尝试一下。然而，实际上要入门AI技术的门槛非常高。除了需要高端设备，还需要面临复杂的部署和安装过程，这让很多人望而却步。在这样的背景下，Ollama的出现为广大开发者和爱好者提供了一条便捷的道路，极大地降低了应用机器学习的门槛。Ollama的优势在于其极致的简化。通过这个平台，用户可以轻松下载、运行和管理各种机器学习模型，而无需
android tabLayout 切换fragment fragment生命周期 mmsx Android 常用开发技术 android tab TabLayout fragment
1、TabLayout与Fragment结合使用的常见方式通常会使用FragmentPagerAdapter或FragmentStatePagerAdapter与ViewPager配合，再将TabLayout与ViewPager关联，实现通过TabLayout切换Fragment。以下是布局文件示例activity_main.xml：
【MoodVine】DeepSeek聊天持久化（2）：Spring AI + Redis实现对话记忆管理一只鱼吖【西瓜和晚霞】MoodVine spring redis java
在上一篇文章中，我们介绍了如何引入SpringAI，本文将深入探讨如何实现聊天记录的持久化存储。一、初始方案：内存存储的局限性在项目初期，我们使用简单的内存存储实现聊天记录管理：创建ChatController@RestController@RequestMapping("/chat")publicclassChatController{privatefinalOllamaChatModeloll
互相学习似水年华平
今晚受群内班主任的邀请，和大家分享我的学习心得。在晚上的分享会上，我听到了分享姐妹在讲述她们的故事，我不禁感叹，姐妹们的生活都是非常自律、人生有着清晰的目标。主播100课程班姐妹分享她每天早上如何练声，以及练声小技巧。蜕变100课程班姐妹分享她如何通过学习，制定人生的小目标、大目标以及终级目标。形象管理课程姐妹分享如何通过合理搭配穿衣打扮来提升自己的自信心。我和大家分享的是通过学习情商课，让我知道
C练题笔记之：牛客-HJ012.字符串反转
题目：描述接受一个只包含小写字母的字符串，然后输出该字符串反转后的字符串。（字符串长度不超过1000）输入描述：输入一行，为一个只包含小写字母的字符串。输出描述：输出该字符串反转后的字符串。示例1输入：abcd复制输出：dcba结果：解题思路：获取字符串，用双指针，一头一尾开始交换，直至到中间。代码：#include#includeintmain(){charstr[1024]={};scanf(
十大广告赚钱平台APP排行榜：一天收益50元天花板软件曝光清风导师
十大广告赚钱平台APP排行榜，实测2024年看广告一天50元收益是真的还是骗局?最近小编发现很多赚钱副业项目开始返璞归真，简单说就是随着管理的越来越严格，现在一些新模式或者特别火爆的玩法会比较低调，反而是老玩法旧瓶装新酒优化升级了许多，比如广告赚钱类型，很多人过去印象并不好，不过现在甚至有些软件可以做到日赚50+的利润，确实是另外眼前一亮。广告赚钱日赚50+是真的吗?实事求是的评级，在过去几年广告
阿里云大模型ACP认证模拟考试（五）
考试重要提示：答题开始即开始计时，中途不可暂停，如超时则自动提交。本次考试共计100道题目，试卷总分100分，通过考试的成绩为80分及以上。请务必在120分钟内完成交卷，由于考试过程不可暂停，请您提前规划好个人时间，若未能在规定时间内交卷，本次考试成绩将判定无效。在开始答题前，系统会进行严格的身份验证流程。届时，请您准备好身份证，拍摄并上传身份证的人像面照片，同时按照系统的指引，开启摄像头完成面部
牛客 - 倒置字符串(java)
题目解题思路解题代码题链接题目解题思路解题代码importjava.util.*;publicclassMain{//定义翻转字符数组的方法publicstaticvoidreverse(char[]arr,intstart,intend){while(start
安全居住判断五个要点。独孤派
【找房子前考虑居住环境是否安全~】五点因素判断一个居住环境是否安全,需考虑这五点因素很多人在外打拼就面临租房的问题,租房要考虑的最重要的一点就是安全。要获得一个安全的居住环境,从选房开始就要仔细把关。判断一个居住环境是否安全,就要考虑到这五点因素。一、当地新闻输入该小区路段名、小区、片区名等,看看是否有发生过违法犯罪的新闻,甚至交通事故新闻也要留意,因为有的路段晚上通行的大货车、运渣车较多,或路灯
牛客网 - 倒置字符串 Boomni_Sun C /C++牛客网题集倒置字符串牛客网 C
题目链接：点击打开链接题目大意：将一句话的单词进行倒置，标点不倒置。比如Ilikebeijing.经过函数后变为：beijing.likeI解题思路：略。AC代码#include#include#definemem(a,b)memset(a,b,sizeofa);#defineINF0x3f3f3f3fusingnamespacestd;typedeflonglongll;intmain(){ve
可转债投资之——小盘可转债大秀大长腿蛙声叫叫一家亲
“感觉许久没提可转债了，这段时间确实没啥好说的，可转债价格跟随正股不断下跌，可转债等权指数从3月初冲高后持续回落，这几天稍微企稳。最近有个特别值得一提的现象，就是许多小规模转债，特别是次新小规模转债，轮番轰炸暴涨，天天秀着20cm、30cm的大长腿，看着让人眼馋。先说说蛙哥最近的可转债持仓情况，截至发文前，今年可转债亏损3.78%，仓位上升到80.68%。整体趋势是亏损仍在缓慢小幅加大，仓位却在上
牛客-游游的水果大礼包小张0.0 OJ算法题题目心得动态规划算法
1.题目描述2.题目链接游游的水果大礼包_牛客题霸_牛客网3.代码解答publicclassMain{publicstaticvoidmain(String[]args){Scannerin=newScanner(System.in);longn=in.nextInt();longm=in.nextInt();longa=in.nextInt();longb=in.nextInt();longre
【大模型记忆实战Demo】基于SpringAIAlibaba通过内存和Redis两种方式实现多轮记忆对话 Sao_E redis 数据库缓存 ai 语言模型
文章目录多轮对话记忆管理——基于Memory的对话记忆基于内存存储历史对话基于Redis存储历史对话多轮对话记忆管理——基于Memory的对话记忆SpringAIAlibaba共实现了三种方式：基于内存的方式基于jdbc（数据库）的方式基于redis的方式下文主要演示基于内存和redis的方式基于内存存储历史对话代码首先定义大模型的角色，一个旅游规划师设置增强拦截器接着接口传入prompt和cha
牛客-倒置字符串小张0.0 OJ算法题题目心得算法 leetcode 动态规划
1.题目描述2.题目链接倒置字符串_牛客题霸_牛客网3.代码解答importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannerscanner=newScanner(System.in);Strings=scanner.nextLine();//按空格分割单词（处理多个连续空格的情况，split("
返利app排行榜？淘宝优惠券返利app哪个好桃朵APP
顶级互联网营销大牛东方微信号：26688专注互联网副业20年。强！（联系我可以开营销号）也就是桃朵APP（直接应用市场搜索：桃朵邀请码：123456）也就是乖淘APP（直接应用市场搜索：乖淘邀请码：123456）桃朵APP&乖淘APP创始人-东方微信号：（26688）专注网络引流20年。带过百万团队，徒弟年入百万者有30人。独立开发桃朵APP：对接首席，佣金全网最高，团队收入最高，模式最好，有引流
中原焦点团队分享网初31期李丽坚持第26天 2021.11.6 遇见_afaf
创造成功经验——让孩子重获信心1.相信一个小小的改变会带来大变化，达到滴水穿石的效果。就像平时我们所说的多米诺骨牌效应一样，我们要关注的就是孩子那一点点的成功经验，让他不断的增加体验，就会有大的变化。2.“再保证”指的是我们对孩子表达：不管发生什么事，我都会爱你这个人，也许你的行为需要修正，但我不会因为你的行为不喜欢你。让孩子感受到不管发生什么事儿，父母永远都爱他，不管发生什么事儿，父母永远都会陪
179.我们的情绪为何总被他人左右韩峰财商觉醒
《我的情绪为何总被他人左右》作者阿尔伯特埃利斯是20世纪美国著名的心理学家理性情绪行为疗法之父。他在美国心理学界的十大应用心理学家排行榜上排名第二，超过了弗洛伊德，他在心理学方面的研究成果被小布什、克林顿、希拉里等一些美国政要倍为推崇。这些内容能帮助我们解决生活中、工作中的心理和情绪问题，能够帮助很多人走出那种情绪困扰。财务自由之路的主题里为什么讲开心理学的内容呢？实际上很多人在追求财务自由的路上
10分钟搞定 MinIO 单节点多磁盘部署！打造稳定高可用对象存储【二】
MinIO是一个**高性能、开源的对象存储系统**，主要用于存储非结构化数据（如图片、视频、文档、备份等），与AmazonS3完全兼容。它被广泛用于云原生应用、大数据分析、AI模型存储、容器平台（如Kubernetes）等场景。MinIO支持多种部署模式，其中：单节点单磁盘（Single-NodeSingle-Drive）模式适用于开发测试、小规模应用或资源受限的场景。它的部署简单，不依赖集群、分
淘宝客服招聘在家兼职?十大适合孕妇的小生意日常购物小技巧
淘宝客服招聘在家兼职?十大适合孕妇的小生意随着互联网的普及，越来越多的孕妇选择在家创业，既能照顾宝宝，又能实现经济收入。本文为您推荐十大适合孕妇的小生意，让您在家轻松赚钱。一、淘宝客服兼职淘宝客服兼职是孕妇在家创业的不错选择。只需具备一定的沟通能力和责任心，就能在家为客户提供优质的售后服务。此外，淘宝客服兼职时间灵活，可以根据孕妇的身体状况和宝宝作息进行调整。至于我为何用这款氧券app，当然是氧券
【Anaconda】Conda 虚拟环境打包迁移教程 Kaydeon conda python 人工智能 pytorch
Conda虚拟环境打包迁移教程本文介绍如何使用conda-pack将Conda虚拟环境打包，并在另一台电脑上快速迁移、部署。0.安装conda-packconda-pack并非Conda默认自带工具，首次使用前必须手动安装。以下两种安装方式任选其一即可：✅方法A：使用Conda安装condainstall-cconda-forgeconda-pack✅方法B：使用pip安装pipinstallco
使用Meteor构建实时仪表板的完整指南杏花朵朵 Meteor 实时仪表板 Vue组件路由设置集合集成
背景简介随着现代Web应用对实时性和响应性的要求不断提高，开发人员需要使用强大的框架来构建能够满足这些需求的应用程序。Meteor作为一个全栈JavaScript框架，提供了一种快速开发实时Web应用的方法。本文将通过构建一个实时仪表板项目，详细探讨Meteor的特点和使用方法。Meteor简介Meteor是一个全栈JavaScript框架，用于构建Web应用程序。它的主要元素包括Web客户端、基
刀神传说：第87章梁秀篇（1）刀神传说
两个月后。“此身合是诗人未？细雨骑驴入剑门。”剑门关天下奇险，双翼插天，群峰环立，真是“剑阁峥嵘而崔嵬，一夫当关，万夫莫开。”出剑门。梁秀、阮闲、刘零、山滔四人走在古柏夹道上。刘零开口道：“山老爷，刀神李流水据说武功天下第一，我不服！”山滔眼神茫然，抚着稀稀疏疏的白须，有气无力道：“为啥不服？”刘零大声道：“江湖中卧虎藏龙，学武之人千千万万，难道他都比试过？”阮闲附和：“真人不露相，露相不真人。我
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(

2023检索增强生成技术（RAG）研究进展

一、前言

二、什么是 RAG？

三、RAG 的发展范式

3.1、初级 RAG

3.2、高级 RAG

3.3、模块化 RAG

四、怎样进行智能增强处理？

五、RAG 还是微调？

六、如何评价 RAG 的效果呢？

七、发展前景

7.1、现有挑战

7.2、多模态扩展

7.3、RAG 生态系统

八、RAG 论文清单

8.1、增强阶段

8.1.1、预训练

8.1.2、微调

8.1.3、推理

8.2、增强来源

8.2.1、非结构化数据

8.2.2、结构化数据

8.2.3、LLM 生成内容

8.3、增强过程

8.3.1、一次性检索

8.3.2、迭代检索

8.3.3、递归式检索

8.3.4、自适应检索

九、References

你可能感兴趣的:(LLM应用实战,大模型企业实战,AI应用实战,人工智能,深度学习,算法,企业知识库,RAG检索增强)