技术狂潮AI

RAG检索增强技术在知识库智能检索场景下的应用实践

如果你对这篇文章感兴趣，而且你想要了解更多关于AI领域的实战技巧，可以关注「技术狂潮AI」公众号。在这里，你可以看到最新最热的AIGC领域的干货文章和案例实战教程。

一、知识检索增强的基本概述

1.1、知识检索增强技术提出的背景

1.1.1、LLM的缺陷

知识检索增强技术的提出背景主要源于当前基于LLM（大规模语言模型）的知识检索存在诸多缺陷。首先，LLM往往存在幻觉现象，即在生成结果时可能出现与事实不符的情况，影响了信息的准确性与可靠性。其次，由于知识库的更新频率较低，导致所获取的信息往往已经过时，无法满足实际应用的需求。此外，LLM在处理参数化知识时效率较低，无法快速准确地响应用户的查询。另外，当前的LLM缺乏对专业领域的深度知识，难以满足领域精准问答的需求，并且推理能力相对较弱，无法进行复杂推理与分析。

1.1.2、实际应用的需求

与此同时，实际应用对知识检索提出了新的需求。首先，实际应用需要领域精准问答，即针对特定领域的问题能够给出准确、精细的答案。其次，随着数据更新速度的加快，知识检索系统需要能够及时更新数据，保持信息的时效性与准确性。此外，生成内容需要可解释可溯源，用户需要了解信息生成的过程与依据，以提高用户对信息的信任度。同时，成本可控也是实际应用对知识检索系统的要求之一，系统需要在保证性能的前提下尽可能降低成本。最后，数据隐私保护也是当前社会关注的焦点之一，知识检索系统需要保障用户数据的隐私安全，符合相关法律法规的要求。

知识检索增强技术的提出是为了解决当前基于LLM的知识检索存在的种种问题，并满足实际应用对知识检索系统的新需求。

1.2、RAG 检索增强生成

LLM（Language Model for Retrieval）是一种基于大规模文档检索的语言模型，通过检索相关信息并生成回答来完成问题回答或文本生成的任务。

与传统的大模型训练相比，RAG（Retrieval-Augmented Generation）方法则不需要重新训练整个大模型，而是通过外挂知识库来完成特定任务。

这种方法尤其适合于知识密集型的任务，能够更高效地利用已有的知识库来生成回答或文本。通过RAG模型，我们可以更加灵活地应对不同领域的问题，提高问题回答或文本生成的效率和准确性。

同时，RAG模型也为我们提供了一种全新的思路，能够更好地结合信息检索和文本生成的能力，为各种应用场景提供更加智能、高效的解决方案。随着人工智能技术的不断发展，RAG模型有望在各个领域发挥越来越重要的作用，成为推动智能化应用发展的重要技术手段之一。

1.3、外挂知识库 vs 知识参数化

在大模型的优化方式中，外挂知识库和知识参数化是两种不同的增强策略。外挂知识库指的是在模型外部构建一个知识库，当模型需要特定知识时，可以直接从这个库中检索信息。这种方式适合于知识更新频繁且对时效性要求较高的场景，能够快速反映最新的数据变化。而知识参数化则是将知识直接内嵌到模型的参数中，通过训练使模型学会这些知识。这种方式使得知识与模型紧密结合，响应更快，但更新知识需要重新训练模型，适用于知识相对稳定的场景。

大模型优化方式：

1）、提示工程（Prompt Engineering）：通过设计合理的提示（Prompt），可以引导模型更好地理解任务需求和上下文信息，从而提高模型的输出质量。提示工程要求对模型的预测方式有深入了解，以便设计出能够有效激发模型潜能的提示。

2）、检索增强（Retrieval Augmentation）：在模型运行时动态地从外部知识库中检索信息，并将其与模型当前处理的内容结合起来，以增强模型的知识理解和回答能力。这种方式适用于需要利用大量动态变化的外部信息来支持决策和回答的场景。

3）、指令微调（Instruction Fine-tuning）：通过对模型进行额外的微调，使其更好地理解特定的指令或命令。这通常需要大量的标注数据来指导模型学习如何响应特定的指令。

1.4、RAG vs Fine-tuning

RAG（Retrieval-Augmented Generation）检索增强生成是一种结合信息检索和文本生成的技术，旨在提高自然语言处理任务的性能。它可以从一个大型知识库中检索与输入相关的信息，并将这些信息作为上下文和问题一起输入给模型进行处理。通过这种方式，RAG可以帮助模型生成更加准确、相关和丰富的回答。简单说，RAG就是先检索后生成，让模型“有据可依”。

而Fine-tuning则是一种更常见的优化方法，它通过在特定任务上对预训练好的模型进行额外训练，使其在该任务上表现更好。Fine-tuning通常需要较少的数据和计算资源，并且可以使模型更加精确地适应特定任务的需求。

1.5、知识检索增强的使用场景

知识检索增强技术（RAG）适用于以下场景：

• 数据长尾分布：当数据分布呈现长尾形态时，RAG能够通过检索覆盖到稀有或少见案例，提升模型在这些长尾数据上的表现。

• 知识更新频繁：对于那些知识点经常更新或变化的领域，如新闻、科技等，RAG可以通过实时检索来确保提供最新信息。

• 回答需要验证追溯：在需要提供可验证来源的应用场景中，RAG允许用户追溯答案来源，增加了回答的可信度。

• 领域专业化知识：对于一些需要深度领域知识支持的场景，如医疗、法律咨询等，RAG可以提供丰富且专业的背景信息来支持决策。

• 数据隐私保护：在处理敏感数据时，RAG可以设计为不直接访问原始数据，而是通过检索已经脱敏或处理过的信息，以保护用户隐私。

二、知识检索增强技术的主要范式与发展历程

2.1、RAG 的典型范式（Native RAG）

RAG，即Retrieval-Augmented Generation，是一种结合了检索和生成的方法，主要用于知识问答等任务。Naive RAG是RAG的一种典型范式，其主要步骤包括构建数据索引、检索和生成。

2.1.1、步骤1：构建数据索引：

在构建数据索引的过程中，首先需要将大量文档分割成均匀的小块，这些小块被称为“文本块”，每个文本块包含了一段原始文本信息。这种分割方式可以根据实际需求进行调整，例如可以根据段落、句子或者其他自定义的规则进行分割。这样做的目的是为了提高检索的精确度，因为小块的文本更容易与具体的查询进行匹配。然后，利用编码模型为每个文本块生成Embedding。这个编码模型可以是预训练的语言模型，例如BERT、GPT等。这个过程类似于对文本内容进行指纹化，使其能够在向量空间中被有效地识别和检索。最后，将这些Embedding存储到专门设计的向量数据库中，如FAISS或Chroma，以便于后续快速检索。

2.1.2、步骤2：检索

在检索阶段，模型接收到用户的查询（Query），然后利用编码模型将查询转换为向量形式，并在向量数据库中进行相似度比较，找出与查询最相关的K个文本块。这个过程是基于向量空间中的距离度量，比如余弦相似度，确保检索出来的文本块与用户问题在语义上尽可能接近。

2.1.3、步骤3：生成

在生成阶段，原始查询和检索得到的文本块结合起来作为输入，送入语言模型中。这里的语言模型可以是GPT系列或其他能够生成自然语言文本的模型。模型综合考虑输入的查询和相关文本块内容，生成一个连贯且信息充实的回答。这一步骤是整个RAG系统的核心，它将检索到的信息与用户需求结合起来，产生有用的输出。

RAG的优点在于，它可以利用大量的外部知识，适合处理知识更新频繁、回答需要验证追溯、领域专业化知识以及数据隐私保护等场景。同时，RAG的结果通常可以追溯到特定的数据源，提供了较高的可解释性和可溯源性。

2.2、RAG 的典型范式（Dynamic/Advanced RAG）

在Dynamic或Advanced RAG中，系统不仅仅是简单地进行检索和生成，而是通过多个优化步骤来提升整体性能和回答质量。

1、索引优化：在这一步骤中，可以采用滑动窗口技术对文本块进行更智能的分割，以捕获更多上下文信息；细粒度分割可以帮助模型更精确地定位到相关信息；而元数据的使用则能够提供额外的信息维度，辅助模型更好地理解和检索内容。

2、前检索模块：在正式检索之前，前检索模块可以进行多种预处理操作。比如通过检索路由确定最适合当前查询的检索策略；摘要和重写可以优化查询表达，使其更加清晰；置信度判断则帮助系统预估答案的可靠性。

3、后检索模块：在完成初步检索后，后检索模块进一步提升结果质量。重排序根据各种标准对检索结果进行排序，确保最相关的信息被优先考虑；而对检索内容进行过滤则可以去除不相关或质量不高的信息，保证最终输入到生成模块的内容是最优质的。

2.3、模块化RAG（Modularized RAG）

模块化RAG是对传统RAG（Retrieval-Augmented Generation）模型的扩展和改进，它通过引入不同的模块来增强模型的功能和灵活性。每个模块负责执行特定的任务，通过模块间的协作，可以更有效地处理复杂的信息检索和内容生成任务。

原生RAG模式首先对输入的问题进行阅读理解，然后根据理解的结果检索相关文档或信息，最后基于检索到的内容生成回答。这种模式适用于标准的问答任务，特别是当问题需要结合特定数据或知识源来回答时。

DSP模式在2022年提出，它引入了Demonstrate（演示）模块，该模块通过示例来引导搜索和预测过程。在这种模式下，系统首先展示相关的信息或案例，然后进行信息搜索，接着预测可能的回答方向或内容，最后生成具体的回答。DSP模式强调了示例在信息检索和回答生成中的作用。

在Rewrite-Retrieve-Read模式中，系统首先对用户的查询进行重写，以更准确地表达问题的意图。随后进行信息检索，并对检索到的内容进行阅读理解。这一模式强调了对原始查询进行优化处理的重要性，以提高检索效率和回答质量。

Rewrite-then-read模式是在2023年被提出，它先执行Retrieve（检索）步骤获取相关信息，然后通过Read（阅读理解）对信息进行深入分析，最后通过Generate（生成）步骤输出回答。与之前的模式相比，这一模式更加注重在生成回答之前对信息进行全面和深入的理解。

2.4、RAG 的三大灵魂拷问

2.4.1、检索什么？

检索内容的选择直接影响到检索结果的质量和后续生成任务的效果。检索的粒度可以从最小的词元（Token）扩展到词组、句子、段落，甚至是结构化的实体和知识图谱。粒度越小，检索出的信息可能越精确，但可能丢失上下文；粒度越大，可能获取更丰富的上下文信息，但准确度和相关性可能降低。知识图谱提供了丰富的结构化信息，但检索效率和质量很大程度上依赖于知识图谱本身的质量和覆盖度。

2.4.2、什么时候检索？

检索时机的选择关系到模型在处理不同任务时的灵活性和效率。单次检索可能更快，但可能无法覆盖所有相关信息；每个Token或每N个Token进行检索可能提高相关性，但会大幅增加计算成本；自适应检索则试图在效率和效果之间找到一个平衡点。选择合适的检索策略对于优化模型性能至关重要。

2.4.3 怎么使用检索的结果？

检索结果可以在不同的模型层级中使用：输入层、中间层或输出层。在输入层使用检索结果通常实现较为简单，但可能限制了模型处理更多知识块的能力；在中间层使用可以增加模型处理信息的深度，但会增加模型复杂性；在输出层使用则能够确保生成内容与检索信息高度相关，但可能牺牲一定的推理速度。

2.4.4、其他问题

在什么阶段增强？

RAG模型可以在不同阶段进行增强：预训练阶段、微调阶段以及推理阶段。预训练可以帮助模型学习到丰富的语言表示和知识，微调阶段可以根据特定任务调整模型参数，推理阶段则是实际应用中动态整合知识的过程。

检索器如何选择

不同的检索器有着不同的特点和适用场景。BERT、RoBERTa等模型擅长处理自然语言文本，而基于图的嵌入（如BGE）则适合处理结构化数据。选择合适的检索器对于提高检索质量和效率具有重要意义。

生成器如何选择

生成器负责根据检索到的内容产生自然语言文本。GPT、Llama、T5等不同的生成模型有着不同的设计和优化目标，选择合适的生成器可以根据任务需求进行。

2.5、RAG 的关键问题——检索什么？

在选择检索粒度时，较粗的粒度如段落或文档级别的检索能够召回更多的信息，有助于提高覆盖率，尤其是在回答需要广泛知识的问题时。然而，这种方法也会带来大量不相关或冗余的信息，导致精确度降低。这就需要后续的处理过程能够有效筛选和集中于有用信息，减少对无关信息的处理，以提高整体效率和输出质量。

对于长尾问题或跨领域问题，大粒度检索能够提供更广泛的信息范围，从而增加找到答案的可能性。这种方法在处理少见或特殊问题时尤其有效。然而，这也意味着需要更多的存储空间来保存检索到的大量数据，并且可能需要更强大的计算资源来处理这些数据。

利用知识图谱（KG）进行检索可以提供丰富的语义和结构化信息，这对于理解复杂问题和生成详细回答非常有帮助。但是，知识图谱的构建和维护成本较高，且检索效率通常低于简单文本的检索。此外，检索质量极大依赖于知识图谱本身的质量和完整性。

2.6、RAG 的关键问题——如何使用检索内容

在推理过程中，集成检索到的信息到生成模型的不同层级中

2.6.1、输入/数据层

在输入层集成检索内容是最直接的方法。它可以通过扩展输入序列来实现，例如将检索到的文本直接拼接到问题之后。这种方法实现简单，但由于输入长度的限制，它不能支持大量知识块的检索。此外，由于模型通常在这一层进行较少的处理，所以优化空间相对有限。

2.6.2、模型/中间层

在模型中间层集成检索内容可以让模型在生成回答前对信息进行更深入的处理。这可以通过将检索结果作为额外的上下文输入给Transformer模型等结构来实现。这种方法允许模型利用更多的知识块进行决策，但同时也增加了模型的复杂度，并且需要额外的训练来优化这些中间层。

2.6.3、输出/预测层

在输出层集成检索内容意味着模型在生成每个Token时都会考虑检索到的信息。这可以确保生成内容与检索结果高度相关，但由于每次生成都需要重新考虑检索内容，因此会大幅降低效率。这种方法适用于对输出质量要求极高的场景。

2.7、RAG 的关键问题——什么时候检索

2.7.1、在推理中仅进行一次检索

仅在推理开始时进行一次检索，可以快速提供信息给模型，但是如果问题的上下文在生成过程中发生变化，这些初期检索到的信息可能不再相关。因此，这种方法虽然效率高，但可能会牺牲答案的相关性和准确度。

2.7.2、自适应地进行检索

自适应检索试图根据生成过程中的需要动态决定何时进行检索。这种方法旨在平衡效率和信息质量之间的矛盾，但它依赖于复杂的决策机制来确定最佳的检索时机，可能无法总是达到最优解。

2.7.3、每生成N个Tokens去检索一次

这种策略通过在生成过程中定期进行检索来确保信息的新鲜度和相关性。尽管这样可以在生成过程中不断更新上下文信息，但它也会导致效率降低，并且可能引入不必要的冗余信息，增加了后续处理的难度。

2.8、RAG 发展历程总览

从预训练阶段开始，RAG及其后续发展的模型如Realm、Retro等，都在不断地探索如何更有效地结合检索与生成。这些模型通过结合大规模语料库预训练和特定任务微调，来提升模型对知识的理解和利用能力。

在微调阶段，模型通过特定任务数据进行微调，以更好地适应特定应用场景。例如，AAR、REPLUG等技术通过微调来增强模型在特定任务上的表现，使其能够更准确地处理复杂问题。

在实际应用中，推理阶段的效率和准确度至关重要。KNN-LLM、RETOMATION等技术通过优化推理过程来提高模型的实际运行效率和输出质量。这些技术努力在保持高质量输出的同时，减少计算资源消耗和响应时间。

三、知识检索增强的关键技术与效果评估

3.1、检索内容优化

3.1.1 索引优化

Small-2-Big策略是指在较小的文本单元（例如句子）上创建索引，然后在大语言模型生成过程中逐步扩大搜索窗口的范围。这种方法允许模型在保持文本上下文连贯性的同时，动态调整检索焦点的粒度，从而提高了检索的灵活性和准确性。

滑动窗口技术通过在整个文本上滑动固定大小的窗口来创建索引，可以有效避免在检索时产生的语义割裂问题。这种方法确保了即使是跨越多个窗口的信息也能被连续地捕获和利用。

摘要方法则是先对较大的文档进行摘要，然后在检索时先找到相关的摘要，再从与摘要对应的完整文档中检索具体的文本块。这种策略可以减少检索时需要处理的数据量，同时依然能够定位到详细的信息。

3.1.2 添加元数据

在检索系统中添加元数据，如示例、页码、时间、类型和文档标题等，可以帮助模型更好地理解文档内容和结构，从而提高检索的准确率和相关性。元数据作为检索过程中的重要参考信息，能够提供更多维度的线索，辅助模型进行更精确的信息定位。

3.1.3 元数据筛选/扩充

伪元数据生成是指通过为查询生成一个假设性的文档来增强检索能力，并通过这个过程生成能够回答查询的具体文本块。这种方法可以提升模型对于查询意图的理解，从而提高检索结果的质量。

元数据过滤器则涉及对文档进行分离和标记，在查询期间进行语义及元数据双重筛选。这不仅仅是基于内容本身的匹配，还包括了对文档属性的考量，使得检索结果更加精细和准确。

3.2、结构化语料

分层组织检索语料库是一种高效处理结构化信息的方式。通过将检索内容按摘要、文档等层级组织，可以先通过摘要快速定位到最相关的文档节点，然后再探索与该节点相关联的其他信息。这种方法不仅提高了检索效率，还能够通过关联探索发现更丰富的背景信息。

对于嵌入了对象（如表格、图形）的文档，可以先检索到引用这些对象的实体，再进一步查询这些对象背后的详细信息。例如，在一个涉及财务报表的查询中，模型可以首先定位到提及特定财务指标的段落，随后再深入到具体的表格数据中去提取精确数值。这样的结构化检索方式能够使得复杂信息的获取变得更加直观和高效。

3.3、Embedding优化

3.3.1 选择更合适的Embedding模型

在RAG系统中，选择合适的嵌入向量（Embedding）模型至关重要。目前市场上有多家知名的嵌入向量提供商，例如OpenAI、Cohere、M3E、llmrails、BAAI和voyage ai等，它们各有特点。选择时应考虑其嵌入向量的语义表达能力、覆盖的语种、实时性能以及成本效益等因素。不同供应商的技术和服务可能更适合特定的应用场景或需求，因此，应根据自身业务特点和需求进行选择。

3.3.2 微调Embedding模型

为了提高检索的精确度和相关性，可以对Embedding模型进行微调，使其更好地适应特定的领域检索库和下游任务。微调可以在模型训练时注入领域特定的知识，增强模型对特定术语和概念的理解能力。此外，可以利用Adapter模块来实现嵌入向量模型与检索库之间的更好对齐，这样可以在不改变整个模型结构的前提下，调整模型以适应特定任务的需求。

3.4、流程优化

3.4.1 迭代

迭代检索是指在RAG系统中不断循环地进行检索，以获取更细致、更深入的知识。技术如ITER（Iterative Retrieval）和Step-Back Prompting能够使系统在每次迭代中根据前一次的结果调整检索策略，逐步深入到问题的核心，从而获取更加精确和全面的信息。

3.4.2 自适应

自适应检索是指让大型语言模型（LLM）动态地判断何时以及在什么范围内进行检索。技术如FLARE（Flexible Retrieval）和Self-RAG允许模型根据当前的任务和已有的信息来决定是否需要进行额外的检索，以及检索的深度和广度。这种自适应机制可以提高检索的效率和效果，因为它允许模型更加智能地决策，而不是盲目地遵循固定的检索流程。

3.5、如何评估RAG的效果

RAG模型的效果评估可以通过多种方式进行，包括独立评估和端到端评估两种主要方式。在独立评估中，可以通过检索评估和生成评估来对模型的效果进行量化分析。检索评估主要关注检索系统检索到的文本块与查询的相关性和质量，通过指标如MRR、Precision、NDCG等来量化检索结果的相关性和有用性。而生成评估则通过对外部知识库分块，使用大型语言模型生成问题，来检验模型生成问题的能力以及所生成问题与文本块的匹配度。另外，端到端评估中的无标签评估指标主要用于评估生成内容的质量，有标签评估则着重于评估生成答案的事实正确性。此外，人工/GPT评估结合了人类评判者的主观判断和GPT模型的自动评分，以获得更为全面的评估结果。

在评价体系方面，RAGAS主要包括生成、检索、正确率、检索准确率、答案相关性和检索召回率等指标，用于评价模型对问题回答的质量、检索内容与问题的相关度、生成答案的事实准确性以及系统检索到解决问题所需的所有相关信息的能力。而RGB评价体系则主要包括信息整合、噪声鲁棒性、反事实鲁棒性和否定拒绝等指标，用于评估系统在整合多个信息源时的能力、对错误或无关信息的抵抗能力、对假设性或虚构信息处理的稳健性以及拒绝错误或不相关答案的能力。

综上所述，RAG模型的效果评估需要综合考虑独立评估和端到端评估两种方式，并结合不同的评价体系来全面评估模型的效果。通过量化指标和综合评价体系的应用，可以更全面地了解RAG模型在生成答案质量、信息检索相关度、准确性和鲁棒性等方面的表现，为模型的进一步优化提供重要参考。

四、知识检索增强技术栈与行业实践浅析

4.1、RAG 技术栈选择

目前比较成熟的技术栈主要有 LangChain、LlamaIndex、FlowiseAI、AutoGen，他们各自的特点具体如下： 1）LangChain：LangChain拥有模块化和全面功能上优点，可以灵活地将其组装以适应多样化的应用需求。然而，其行为的不一致性和对API细节的隐藏，可能导致模型预测的困难和对系统的控制理解不足，因此在灵活性上存在一定的局限。 2）LlamaIndex：LlamaIndex专注于提供高效的知识检索，通过优化索引 and 检索算法，保证了检索的速度和精度。但其需要与其他系统配合使用的特性，可能使得在定制化服务上存在一定程度的局限性。 3）FlowiseAI：FlowiseAI的强项在于易用性和流程可视化，为用户提供了快速上手的可能。然而，由于其功能的相对单一，对于需要复杂场景支持的应用，可能需要寻求其他更强大的解决方案。 4）AutoGen：AutoGen的强项在于适配多智能体场景，处理多参与者的复杂对话情境。但在多轮对话处理上，其较低的效率可能会形成应用瓶颈。总的来说，这四种技术栈LangChain、LlamaIndex、FlowiseAI、AutoGen都有各自的优势和局限性。LangChain的模块化设计和全面的功能使其在处理多样化应用时充满灵活性，但其行为的不一致性和API细节的隐藏可能给模型预测以及系统控制带来困扰。LlamaIndex专注于提供高效的知识检索，优化了索引和检索算法，保证了检索速度和准确性，不过，其依赖于其他系统的特性可能会在提供定制化服务时造成一定的局限。FlowiseAI以其易用性和流程可视化著称，使得用户可以快速上手，然而，其在处理复杂场景支持的应用上可能需要额外的解决方案。AutoGen适应了多智能体场景，擅长处理复杂对话情境，但其在多轮对话处理上的低效率可能导致应用瓶颈。因此，在选择技术栈时，需要根据具体的应用场景以及你的需求来决定哪一个技术栈最适合。

4.2、RAG 行业应用实践

RAG的技术实践在各个行业中都取得了成功，尤其在传统行业的智能化升级和AI 工具链的提推上。展示了RAG在为知识检索和问答系统提供强大支撑的实践，为用户提供更好的使用体验，进一步推动了AI在各个领域的应用深度和广度。

在知识管理领域：知识管理系统利用RAG技术建立大规模知识库，用户可以通过自然语言查询要寻找的信息，系统则能生成准确的响应，或者提供相似案例或主题的其他资料。这项技术的实际效果是在提高信息查询的准确性和效率。
在客户服务领域：许多公司利用RAG技术建设自动化的客服系统。用户可以通过自然语言向这样的系统提问或者寻求帮助，系统则会给出相应的答案或解决方案。这大大节省了人工客服的成本同时提高了服务质量和效率。
在法律咨询领域：RAG技术也被用于建设法律咨询机器人。无论是公民的法律问题，还是企业法务处理问题，用户都可以通过咨询机器人获得自动化的法律咨询服务，它能提供相关法规信息，类似案例推荐以及合理的处理建议。
在新闻和媒体领域：RAG技术可以为新闻并媒体业提供个性化内容推荐。用户可以查询自己感兴趣的主题，系统会自动生成与主题相关的，个性化的新闻或文章。
在教育领域：RAG技术可以支持智能教育平台进行题目推荐和学习资源推荐。根据每个学生的学习进度和水平，系统会自动推荐相应的学习资源，如课本、参考书、教学视频等，以提高学习效果和效率。

这是RAG技术在各行业中一些代表性的应用实例，希望这可以帮助您更好地了解RAG技术的实际效益和应用前景。

五、挑战

RAG模型面临着诸多技术挑战和发展展望。首先，在技术方面，RAG模型的Scaling Law规律需要进一步研究，以实现模型规模的有效控制和优化。另外，随着数据量的增加，提升检索大规模数据的效率也是一个重要挑战，可能需要开发更高效的算法或利用特定硬件加速来解决。同时，在处理长上下文信息时，遗忘缓解成为一个关键问题，设计机制来缓解遗忘，保持信息的连贯性和完整性至关重要。此外，随着多模态数据的应用增加，如何将非文本数据整合进RAG框架，实现跨模态的信息检索和生成也是未来的重要趋势。

在范式方面，模块化设计将成为主流，需要研究各个模块之间高效、稳定的配合和集成。同时，如何组织和管理这些模块，以及优化它们之间的交互和数据流动也需要更加精细化的方法和标准。评测体系也需要与时俱进完善，开发新的评价指标和评测方法以更准确地衡量系统在实际应用中的效能。

在生态方面，工具链技术栈将进一步完善，并形成更加成熟和稳定的生态环境。一站式平台将继续优化升级，以满足用户日益增长的需求。随着技术的成熟和市场的认可，预计将有越来越多企业采用RAG系统来提升自身业务能力，推动企业级应用出现井喷式增长，并带动整个行业向前发展。

六、总结

本文我们主要探讨了知识检索增强（Retrieval-Augmented Generation, RAG）技术的关键评估方法和行业应用，以及几种现有的技术栈选择及其优缺点。

首先，关于RAG的效果评估，我们提到了两种主要的评估方式：独立评估和端到端评估。独立评估包括检索评估和生成评估，重点在于分别量化检索结果的质量和生成问题的能力。端到端评估则结合了无标签和有标签的评估指标，以及人工或GPT模型的评估方法，以获得更全面的效果评价。

在评价体系方面，RAGAS指标体系被提出，它包括了生成答案的质量、检索内容与问题的相关度、生成答案的事实正确性、检索准确率、答案相关性和检索召回率等多个维度。

其次，我们讨论了四种RAG现有技术栈选择及其特点：

LangChain以其模块化和功能全面性为优点，但行为不一致性和API复杂性是其缺点。
LlamaIndex专注于知识检索，但需要与其他系统组合使用，并且定制化程度较低。
FlowiseAI用户上手简单，流程可视化，但功能较为单一，不适合复杂应用场景。
AutoGen适合多智能体场景，但效率较低，通常需要多轮对话。

最后，在RAG行业实践方面，RAG技术成为了在各行业中创新性应用的重要工具，尤其在知识管理、客户服务、法律咨询、新闻媒体和教育领域等方面取得了显著的成果。无论是提高信息查询的效率和准确性，提供自动化的客服解答，助力法律咨询，推动个性化内容推荐，还是优化教育资源的推荐，RAG技术都显示出了强大的用武之地。这些成功的应用实例展现了RAG技术的实际效益和广阔的应用前景，将其作为一个有效的策略，也为相应行业的进步和智能化发展提供了强大的支持。

总之，RAG技术在企业中的应用日益广泛，它通过增强语言模型的知识检索能力，为用户提供了更加精确、高效的信息服务。随着技术的不断发展和优化，RAG有望在更多行业中发挥重要作用。

如果你对这篇文章感兴趣，而且你想要了解更多关于AI领域的实战技巧，可以关注「技术狂潮AI」公众号。在这里，你可以看到最新最热的AIGC领域的干货文章和案例实战教程。

你可能感兴趣的:(大模型企业实战,LLM应用实战,AI应用实战,人工智能,企业知识库,RAG)

guava loadingCache代码示例 IM 胡鹏飞 Java 工具类介绍
publicclassTest2{publicstaticvoidmain(String[]args)throwsException{LoadingCachecache=CacheBuilder.newBuilder()//设置并发级别为8，并发级别是指可以同时写缓存的线程数.concurrencyLevel(8)//设置缓存容器的初始容量为10.initialCapacity(10)//设置缓存
系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
驱动程序为什么要做 WHQL 认证? GDCA SSL证书网络协议网络
驱动程序进行WHQL（WindowsHardwareQualityLabs）认证的核心价值在于解决兼容性、安全性和市场准入三大关键问题，具体必要性如下：️‌一、规避系统拦截，保障驱动可用性‌消除安装警告‌未认证的驱动在安装时会触发Windows的‌红色安全警告‌（如“无法验证发布者”），甚至被系统强制拦截。通过WHQL认证的驱动获得微软数字签名，用户可无阻安装‌。满足系统强制要求‌Windows1
求是网：“内卷式”竞争的突出表现和主要危害有哪些？加百力财经研究科技知识人工智能大数据
"内卷式"竞争主要表现为：企业层面的低价竞争、同质化竞争和营销"逐底竞争"；地方政府层面的违规优惠政策、盲目重复建设和设置市场壁垒。危害体现在三个层面：微观上导致"劣币驱逐良币"，损害消费者利益；中观上破坏行业生态，挤压产业链利润空间；宏观上扭曲资源配置，抑制创新活力。什么是“内卷式”竞争？概括其一般特征，是指经济主体为了维持市场地位或争夺有限市场，不断投入大量精力和资源，却没有带来整体收益增长的
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
基于开源AI智能名片链动2+1模式与S2B2C商城小程序的渠道选择策略研究说私域人工智能小程序
摘要：在数字化商业环境下，品牌与产品的渠道选择对其市场推广和运营成功至关重要。本文聚焦于如何依据自身品牌和产品特性，结合开源AI智能名片链动2+1模式与S2B2C商城小程序，运用科学的渠道选择方法，慎重挑选1-2个适宜平台，集中资源发力并取得成绩后再拓展其他渠道。通过理论分析与案例研究，探讨该策略的有效性和可行性，为企业渠道布局提供参考。关键词：渠道选择；开源AI智能名片；链动2+1模式；S2B2
深入解析 TCP 连接状态与进程挂起、恢复与关闭誰能久伴不乏 tcp/ip 网络服务器
文章目录深入解析TCP连接状态与进程挂起、恢复与关闭一、TCP连接的各种状态1.**`LISTEN`**（监听）2.**`SYN_SENT`**（SYN已发送）3.**`SYN_RECEIVED`**（SYN已接收）4.**`ESTABLISHED`**（已建立）5.**`FIN_WAIT_1`**（关闭等待1）6.**`FIN_WAIT_2`**（关闭等待2）7.**`CLOSE_WAIT`**
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比