wshzd

LLM之RAG实战（二十四）| LlamaIndex高级检索（三）：句子窗口检索

这是本系列关于高级检索技术的第三篇文章，之前的两篇分别介绍构建基本的RAG和父文档检索技术，本文我们将深入研究句子窗口检索技术。我将介绍如何设置它，并使用TruEval来测量其性能，并将其性能与我们在前几篇文章中介绍的其他技术进行比较。

一、语句窗口检索介绍

在句子窗口检索中，我们对文档的片段进行检索，然后返回检索到的相关句子的多个句子，然后根据该相关句子及其上下的句子窗口生成LLM的合成。如下图所示：

上面的图片，相关的句子是红色的，然后中间的相关句子以及句子上面和下面窗口句子一起传递给LLM以执行其响应（RAG的生成部分）。我们可以控制相关句子周围的句子窗口的大小。那么我们为什么要这么做呢？

基于嵌入的检索最适合使用较小的句子。因此，基本上使用基于句子的检索，我们将用于搜索相关块的块与传递给LLM进行合成的最终文档解耦。让我们实现一个句子窗口检索器。

二、加载文档

我们需要执行的第一步是加载文档。我们将再次使用我们在过去其他文章中使用的工会演讲数据。以下是我们加载文档代码：

from llama_index import (    SimpleDirectoryReader,)# load documentdocuments = SimpleDirectoryReader(    input_dir="../dataFiles/").load_data(show_progress=True)print(len(documents))

运行这段代码，下面是输出的屏幕截图：

从上面的图片中，我们可以看到我们只有一个单独的页面或文档，因为文档的长度是1。如果您使用一个文档，如具有多个页面的PDF文件，将所有页面合并到一个文档中有助于准确地将文档拆分为块或LlamaIndex中所称的“节点”。

以下是如何将多个文档（页面）合并为一个文档：

from llama_index import (    SimpleDirectoryReader,    Document)# load documentdocuments = SimpleDirectoryReader(    input_dir="../dataFiles/").load_data(show_progress=True)# merge pages into onedocument = Document(text="\n\n".join([doc.text for doc in documents]))print(document)

在我们的案例中，这不是必要的，但为了了解情况或使用多页PDF文档的人。

三、语句窗口检索器设置

首先，考虑如何设置一个将文档分解为多个句子的SentenceWindowNodeParser，然后在窗口大小范围内为每个句子增加或添加周围的句子，以创建更大的上下文。这可能让人难以理解。下面，我使用一个例子来解释一下：

from llama_index.node_parser import SentenceWindowNodeParser# create the sentence window node parsernode_parser = SentenceWindowNodeParser.from_defaults(    window_size=2,    window_metadata_key="window",    original_text_metadata_key="original_text",)# Toy example to play around withtext = "I love programming. Python is my most favorite language. I love LLMs. I love LlamaIndex."# Get nodesnodes = node_parser.get_nodes_from_documents([Document(text=text)])# Print out individual nodesprint([x.text for x in nodes])# Print out the window around the second nodeprint(nodes[1].metadata["window"])

以下是Jupyter笔记本的代码输出：

你可以看到原句子（“Python is my most favorite language”）两侧的窗口为2，前面一句话，后面一句话。下面的解释来自LlamaIndex官方文档：

By default, the sentence window is 5 sentences on either side of the original sentence.

In this case, chunk size settings are not used, in favor of following the window settings.

四、建立索引

让我们继续构建索引，我们需要两件事，第一件是LLM，我们将使用OpenAI gpt-3.5-turbo，然后我们需要一个服务上下文来指定嵌入模型、LLM和节点解析器（我们在上面创建的句子窗口）。

对于嵌入模型，我将使用LlamaIndex中提供的OpenAIEmbedding模型，您可以使用任何其他想要使用的嵌入模型。

# creating OpenAI gpt-3.5-turbo LLM and OpenAIEmbedding modelllm = OpenAI(model="gpt-3.5-turbo", temperature=0.1)embed_model = OpenAIEmbedding()# creating the service contextsentence_context = ServiceContext.from_defaults(    llm=llm,    embed_model=embed_model,    node_parser=node_parser,)

由于我们将node_parser作为PensioneWindowNodeParser传入，因此它将在后台执行操作：获取每个句子，用它周围的句子对其进行扩充，并创建嵌入，将其存储在矢量存储中。看看下面的图片，为下面图片中的每个文本创建嵌入（一个例子）。其中红色文本是原始句子，其周围的白色文本是增强文本。将为它们创建一个嵌入，并对每个句子重复此操作，每次使用不同的窗口。

我们还需要设置一个向量存储索引并使其持久化，这意味着创建的嵌入将存储在向量存储中，以避免每次运行应用程序时创建新嵌入的重复和成本。为此，我们必须检查存储的索引是否存在于内存中；如果没有，我们创建另一个并加载现有的。

import osfrom llama_index import (    SimpleDirectoryReader,    Document,    StorageContext,    load_index_from_storage)from llama_index.node_parser import SentenceWindowNodeParserfrom llama_index.llms import OpenAIfrom llama_index.embeddings import OpenAIEmbeddingfrom llama_index import ServiceContextfrom llama_index import VectorStoreIndexfrom decouple import config# set env variablesos.environ["OPENAI_API_KEY"] = config("OPENAI_API_KEY")# load documentdocuments = SimpleDirectoryReader(    input_dir="../dataFiles/").load_data(show_progress=True)# merge pages into onedocument = Document(text="\n\n".join([doc.text for doc in documents]))node_parser = SentenceWindowNodeParser.from_defaults(    window_size=3,    window_metadata_key="window",    original_text_metadata_key="original_text",)# creating OpenAI gpt-3.5-turbo LLM and OpenAIEmbedding modelllm = OpenAI(model="gpt-3.5-turbo", temperature=0.1)embed_model = OpenAIEmbedding()# creating the service contextsentence_context = ServiceContext.from_defaults(    llm=llm,    embed_model=embed_model,    node_parser=node_parser,)if not os.path.exists("./storage"):    # creating the vector store index    index = VectorStoreIndex.from_documents(        [document], service_context=sentence_context    )    # make vector store persistant    index.storage_context.persist(persist_dir="./storage")else:    # load vector store indexed if they exist    index = load_index_from_storage(        StorageContext.from_defaults(persist_dir="./storage"),        service_context=sentence_context    )

运行此代码并确保其正常工作而不会出现错误。这将在Python文件夹所在的项目目录中创建一个新文件夹，此文件夹应命名为storage。

五、创建元数据替换后处理器

MetaDataReplacementPostProcessor在我们执行了相关区块的检索后开始使用，它将用位于句子窗口内的实际周围文本替换检索到的节点周围的元数据。基本上，元数据替换后处理器会产生这样的结果：

其中红色文本是相关的和检索到的文本。白色文本是位于元数据替换后处理器放置的上下文窗口中的周围文本。为进一步澄清一些事情，可以看看下面的代码：

你可以从上面的图片中看到，在第44单元中，我们检索到了原始句子“Python is my most favorite language”。在单元格45和46中，我们应用了元数据后处理器，以及如何将周围的完整句子扩充到原始句子中。

六、添加Reranker

顾名思义，重新排序器所做的基本上是根据句子的相关性来重新排序。我们将使用BAAI/bge-reranker-base来执行重新排序，这个模型可以在Huggingface上找到。

那么，为什么我们需要重排序呢？看看这张图片：

单元格48的图像不太清楚，因为这是该单元格中的代码：

from llama_index import QueryBundlefrom llama_index.schema import TextNode, NodeWithScorequery = QueryBundle("I love Python programming")scored_nodes = [    NodeWithScore(node=TextNode(text="Programming can be boring, bugs all day"), score=0.6),    NodeWithScore(node=TextNode(text="Python is my most favorite programming language"), score=0.4),]

你可以看到原始的查询是“I love Python Programming”，我们有两个分数节点，我们手动分配了分数：分数分别为0.6和0.4。通过人工判断，您可以判断出第二句与用户查询更相关，但手动分配的分数更高。通过重新排序，该模型可以通过基本上更改排名分数来帮助解决这一问题。根据你的人类判断，在根据查询输入重新排序后，你认为哪一个句子的排名会更高？第二句对吗？

是的，第二句比第二句更相关，因此应该有更高的分数。你可以看到这就是重新排序模型所做的事情（参考上面的Jupyter笔记本图片）。

通常我们使用重新排序将查询与现有节点进行匹配，以找到最相关的节点。

以下是将元数据替换后处理器和重新排序添加到管道的代码：

import osfrom llama_index import (    SimpleDirectoryReader,    Document,    StorageContext,    load_index_from_storage)from llama_index.node_parser import SentenceWindowNodeParserfrom llama_index.llms import OpenAIfrom llama_index.embeddings import OpenAIEmbeddingfrom llama_index import ServiceContextfrom llama_index import VectorStoreIndexfrom llama_index.indices.postprocessor import MetadataReplacementPostProcessorfrom llama_index.indices.postprocessor import SentenceTransformerRerankfrom decouple import config# set env variablesos.environ["OPENAI_API_KEY"] = config("OPENAI_API_KEY")# load documentdocuments = SimpleDirectoryReader(    input_dir="../dataFiles/").load_data(show_progress=True)# merge pages into onedocument = Document(text="\n\n".join([doc.text for doc in documents]))node_parser = SentenceWindowNodeParser.from_defaults(    window_size=3,    window_metadata_key="window",    original_text_metadata_key="original_text",)# creating OpenAI gpt-3.5-turbo LLM and OpenAIEmbedding modelllm = OpenAI(model="gpt-3.5-turbo", temperature=0.1)embed_model = OpenAIEmbedding()# creating the service contextsentence_context = ServiceContext.from_defaults(    llm=llm,    embed_model=embed_model,    node_parser=node_parser,)if not os.path.exists("./storage"):    # creating the vector store index    index = VectorStoreIndex.from_documents(        [document], service_context=sentence_context    )    # make vector store persistant    index.storage_context.persist(persist_dir="./storage")else:    # load vector store indexed if they exist    index = load_index_from_storage(        StorageContext.from_defaults(persist_dir="./storage"),        service_context=sentence_context    )# add meta data replacement post processorpostproc = MetadataReplacementPostProcessor(    target_metadata_key="window")# link: https://huggingface.co/BAAI/bge-reranker-basererank = SentenceTransformerRerank(    top_n=2, model="BAAI/bge-reranker-base")

运行此代码会导致一些与丢失的库相关的错误。请确保继续安装所需的所有丢失的库

你可以从图片中看到，我们需要安装pip install torch sentence-transformers。一旦你安装了它，你还需要再次运行代码，这一次一些库将自动安装，根据你的网速，可能需要一些时间才能完成。这是我正在进行的下载。

下载完成后，我们可以添加查询引擎并对其进行测试，以下是最终代码：

import osfrom llama_index import (    SimpleDirectoryReader,    Document,    StorageContext,    load_index_from_storage)from llama_index.node_parser import SentenceWindowNodeParserfrom llama_index.llms import OpenAIfrom llama_index.embeddings import OpenAIEmbeddingfrom llama_index import ServiceContextfrom llama_index import VectorStoreIndexfrom llama_index.indices.postprocessor import MetadataReplacementPostProcessorfrom llama_index.indices.postprocessor import SentenceTransformerRerankfrom decouple import config# set env variablesos.environ["OPENAI_API_KEY"] = config("OPENAI_API_KEY")# load documentdocuments = SimpleDirectoryReader(    input_dir="../dataFiles/").load_data(show_progress=True)# merge pages into onedocument = Document(text="\n\n".join([doc.text for doc in documents]))node_parser = SentenceWindowNodeParser.from_defaults(    window_size=3,    window_metadata_key="window",    original_text_metadata_key="original_text",)# creating OpenAI gpt-3.5-turbo LLM and OpenAIEmbedding modelllm = OpenAI(model="gpt-3.5-turbo", temperature=0.1)embed_model = OpenAIEmbedding()# creating the service contextsentence_context = ServiceContext.from_defaults(    llm=llm,    embed_model=embed_model,    node_parser=node_parser,)if not os.path.exists("./storage"):    # creating the vector store index    index = VectorStoreIndex.from_documents(        [document], service_context=sentence_context    )    # make vector store persistant    index.storage_context.persist(persist_dir="./storage")else:    # load vector store indexed if they exist    index = load_index_from_storage(        StorageContext.from_defaults(persist_dir="./storage"),        service_context=sentence_context    )# add meta data replacement post processorpostproc = MetadataReplacementPostProcessor(    target_metadata_key="window")# link: https://huggingface.co/BAAI/bge-reranker-basererank = SentenceTransformerRerank(    top_n=2, model="BAAI/bge-reranker-base")# query enginesentence_window_engine = index.as_query_engine(    similarity_top_k=5, node_postprocessors=[postproc, rerank])# test it outresponse = sentence_window_engine.query(    "What did the president say about covid-19?")print(response)

您现在可以构建一个句子窗口检索器，这是一种先进的RAG技术。现在让我们继续评估模型，使用的最佳句子窗口大小是多少？它如何影响相关性和基础性？语句窗口如何影响成本？相对于基本的RAG管道和父文档检索技术，句子窗口是如何执行的？让我们开始寻找这些问题的答案

七、RAG评估

在评估阶段，有几个问题很想找到答案：

句子窗口大小最佳是多少？
在句子窗口大小和groundedness或responses（幻觉）之间进行权衡。
句子窗口大小与response相关性的关系
上下文相关性与groundedness的关系
成本与语句窗口大小的关系

7.1 句子窗口大小和groundedness或responses（幻觉）之间进行权衡

随着句子窗口的增加，groundedness也会随之增加。这是因为LLM有更多的上下文作为其响应的基础，而不是幻觉或训练数据。那我为什么说句子窗口大小与groundedness成正比呢？让我解释一下。

当句子窗口很小时，LLM将生成的响应将具有较低的groundedness，因为上下文没有向LLM提供足够的信息——因此，它开始使用从训练数据中获得的现有知识，我们称之为幻觉。

相反，如果窗口大小太大，则由于LLM被提供了大量信息作为其最终响应的基础，因此，它最终会偏离所提供的信息，因为它太大，无法用其中的所有这些信息组成响应。

看看这个图表，它只是我上面解释的一个草图，它不是基于任何数据。

7.2 句子窗口大小与response相关性的关系

随着句子窗口大小的增加，生成的回答的相关性也会有所增加。为什么？

上下文越多，答案就越相关？在过多的背景下，LLM可能会分心，也可能不会分心，依靠自己的训练数据并开始产生幻觉。太少的背景，LLM开始产生幻觉，相关性下降，groundedness也随之下降。在某些情况下，相关性可能很高，但groundedness会下降。只是也许训练数据有一些信息可以用来回答用户特定的问题，只是也许。

依赖性的增加也意味着groundedness的增加，直到某一点，相关性将开始相对于上下文窗口（句子窗口）的数量变平或下降。

7.3 成本与语句窗口大小的关系

随着语句窗口大小的增加，价格也会增加，因为越来越多的token被用来发出请求并得到回复。语句窗口越大，token越多，成本就越高。

让我们实际测试一下。为此，我将把迄今为止我们所拥有的代码转换为一组函数，我们可以调用这些函数并传入不同的参数进行测试和微调。让我们将代码转换为两个主要函数，一个用于创建索引，另一个用于查询引擎。以下是我们完成此操作后的代码：

import osfrom llama_index import (    SimpleDirectoryReader,    Document,    StorageContext,    load_index_from_storage)from llama_index.node_parser import SentenceWindowNodeParserfrom llama_index.llms import OpenAIfrom llama_index.embeddings import OpenAIEmbeddingfrom llama_index import ServiceContextfrom llama_index import VectorStoreIndexfrom llama_index.indices.postprocessor import MetadataReplacementPostProcessorfrom llama_index.indices.postprocessor import SentenceTransformerRerankfrom decouple import config# set env variablesos.environ["OPENAI_API_KEY"] = config("OPENAI_API_KEY")# load documentdocuments = SimpleDirectoryReader(    input_dir="../dataFiles/").load_data(show_progress=True)# merge pages into onedocument = Document(text="\n\n".join([doc.text for doc in documents]))def create_indexes(    documents: Document,    index_save_dir: str,    window_size: int = 4,    llm_model: str = "gpt-3.5-turbo",    temperature: float = 0.1):    node_parser = SentenceWindowNodeParser.from_defaults(        window_size=window_size,        window_metadata_key="window",        original_text_metadata_key="original_text",    )    # creating OpenAI gpt-3.5-turbo LLM and OpenAIEmbedding model    llm = OpenAI(model=llm_model, temperature=temperature)    embed_model = OpenAIEmbedding()    # creating the service context    sentence_context = ServiceContext.from_defaults(        llm=llm,        embed_model=embed_model,        node_parser=node_parser,    )    if not os.path.exists(index_save_dir):        # creating the vector store index        index = VectorStoreIndex.from_documents(            [document], service_context=sentence_context        )        # make vector store persistant        index.storage_context.persist(persist_dir=index_save_dir)    else:        # load vector store indexed if they exist        index = load_index_from_storage(            StorageContext.from_defaults(persist_dir=index_save_dir),            service_context=sentence_context        )    return indexdef create_query_engine(    sentence_index: VectorStoreIndex,    similarity_top_k: int = 6,    rerank_top_n: int = 5,    rerank_model: str = "BAAI/bge-reranker-base",):    # add meta data replacement post processor    postproc = MetadataReplacementPostProcessor(        target_metadata_key="window"    )    # link: https://huggingface.co/BAAI/bge-reranker-base    rerank = SentenceTransformerRerank(        top_n=rerank_top_n,        model=rerank_model    )    sentence_window_engine = sentence_index.as_query_engine(        similarity_top_k=similarity_top_k,        node_postprocessors=[postproc, rerank]    )    return sentence_window_engine# create indexindex = create_indexes(    documents=documents,    index_save_dir="./storage",    window_size=3,    llm_model="gpt-3.5-turbo",    temperature=0.1)# create query enginesentence_window_engine = create_query_engine(    sentence_index=index,    similarity_top_k=5,    rerank_top_n=2,)response = sentence_window_engine.query(    "What did the president say about covid-19?")print(response)

既然我们有了这个，让我们继续进行评估。我们需要评估的第一件事是收集问题，在这里我们可以使用以下问题列表：

What measures did the speaker announce to support Ukraine in the conflict mentioned?
How does the speaker propose to address the challenges faced by the United States in the face of global conflicts, specifically mentioning Russia’s actions?
What is the speaker’s plan to combat inflation and its impact on American families?
How does the speaker suggest the United States will support the Ukrainian people beyond just military assistance?
What is the significance of the speaker’s reference to the NATO alliance in the context of recent global events?
Can you detail the economic sanctions mentioned by the speaker that are being enforced against Russia?
What actions have been taken by the U.S. Department of Justice in response to the crimes of Russian oligarchs as mentioned in the speech?
How does the speaker describe the American response to COVID-19 and the current state of the pandemic in the country?
What are the four common-sense steps the speaker mentions for moving forward safely in the context of COVID-19?
How does the speaker address the economic issues such as job creation, infrastructure, and the manufacturing sector in the United States?

将这些问题复制粘贴到名为eval_questions.txt的文本文件中

我们将阅读这些问题，并使用for循环将其传递给TruLens以获得评估。如果你在这一系列文章中关注了很长时间，请进入ParentDocumentRetrieval文件夹，复制到default.sqlite数据库，并将其移动到SentenceWindowRetrieval文件夹中，该数据库中有我们迄今为止所做的所有现有技术的记录，这将使我们能够跟踪实验。

如果您还没有跟上，请忽略在数据库上复制的步骤。你也可以从[1]下载数据库。下载数据库后，您可以这样引用它：

tru = Tru(database_file="/default.sqlite")

7.4 设置TruLens

让我们开始设置TruLens进行评估，如果你愿意，你可以在另一个文件中这样做，这是最好的方法。但在这种情况下，为了保持简单，我将所有内容都放在同一个文件main.py文件中。

7.4.1 句子窗口大小3

以下是要评估句子窗口大小3的代码：

import osfrom typing import Listfrom llama_index import (    SimpleDirectoryReader,    Document,    StorageContext,    load_index_from_storage)from llama_index.node_parser import SentenceWindowNodeParserfrom llama_index.llms import OpenAIfrom llama_index.embeddings import OpenAIEmbeddingfrom llama_index import ServiceContextfrom llama_index import VectorStoreIndexfrom llama_index.indices.postprocessor import MetadataReplacementPostProcessorfrom llama_index.indices.postprocessor import SentenceTransformerRerankfrom llama_index.llms import OpenAI# for loading environment variablesfrom decouple import configfrom trulens_eval import Feedback, Tru, TruLlamafrom trulens_eval.feedback import Groundednessfrom trulens_eval.feedback.provider.openai import OpenAI as OpenAITruLensimport numpy as np# set env variablesos.environ["OPENAI_API_KEY"] = config("OPENAI_API_KEY")# load documentdocuments = SimpleDirectoryReader(    input_dir="../dataFiles/").load_data(show_progress=True)# merge pages into onedocument = Document(text="\n\n".join([doc.text for doc in documents]))def create_indexes(    documents: Document,    index_save_dir: str,    window_size: int = 4,    llm_model: str = "gpt-3.5-turbo",    temperature: float = 0.1):    node_parser = SentenceWindowNodeParser.from_defaults(        window_size=window_size,        window_metadata_key="window",        original_text_metadata_key="original_text",    )    # creating OpenAI gpt-3.5-turbo LLM and OpenAIEmbedding model    llm = OpenAI(model=llm_model, temperature=temperature)    embed_model = OpenAIEmbedding()    # creating the service context    sentence_context = ServiceContext.from_defaults(        llm=llm,        embed_model=embed_model,        node_parser=node_parser,    )    if not os.path.exists(index_save_dir):        # creating the vector store index        index = VectorStoreIndex.from_documents(            [document], service_context=sentence_context        )        # make vector store persistant        index.storage_context.persist(persist_dir=index_save_dir)    else:        # load vector store indexed if they exist        index = load_index_from_storage(            StorageContext.from_defaults(persist_dir=index_save_dir),            service_context=sentence_context        )    return indexdef create_query_engine(    sentence_index: VectorStoreIndex,    similarity_top_k: int = 6,    rerank_top_n: int = 5,    rerank_model: str = "BAAI/bge-reranker-base",):    # add meta data replacement post processor    postproc = MetadataReplacementPostProcessor(        target_metadata_key="window"    )    # link: https://huggingface.co/BAAI/bge-reranker-base    rerank = SentenceTransformerRerank(        top_n=rerank_top_n,        model=rerank_model    )    sentence_window_engine = sentence_index.as_query_engine(        similarity_top_k=similarity_top_k,        node_postprocessors=[postproc, rerank]    )    return sentence_window_engine# create indexindex = create_indexes(    documents=documents,    index_save_dir="./storage",    window_size=3,    llm_model="gpt-3.5-turbo",    temperature=0.1)# create query enginesentence_window_engine = create_query_engine(    sentence_index=index,    similarity_top_k=5,    rerank_top_n=2,)# RAG pipeline evalstru = Tru()openai = OpenAITruLens()grounded = Groundedness(groundedness_provider=OpenAITruLens())# Define a groundedness feedback functionf_groundedness = Feedback(grounded.groundedness_measure_with_cot_reasons).on(    TruLlama.select_source_nodes().node.text).on_output().aggregate(grounded.grounded_statements_aggregator)# Question/answer relevance between overall question and answer.f_qa_relevance = Feedback(openai.relevance).on_input_output()# Question/statement relevance between question and each context chunk.f_qs_relevance = Feedback(openai.qs_relevance).on_input().on(    TruLlama.select_source_nodes().node.text).aggregate(np.mean)tru_query_engine_recorder = TruLlama(sentence_window_engine,                                     app_id='sentence_window_size_3',                                     feedbacks=[f_groundedness, f_qa_relevance, f_qs_relevance])eval_questions = []with open("./eval_questions.txt", "r") as eval_qn:    for qn in eval_qn:        qn_stripped = qn.strip()        eval_questions.append(qn_stripped)def run_eval(eval_questions: List[str]):    for qn in eval_questions:        # eval using context window        with tru_query_engine_recorder as recording:            sentence_window_engine.query(qn)run_eval(eval_questions=eval_questions)# run dashboardtru.run_dashboard()

7.4.2 句子窗口大小6

我们如何将窗口大小更改为6。注意，我已将TruLlama中的app_id更改为sentence_window_size_6。我还将save_dir更改为sentence_window_size_6_index。

import osfrom typing import Listfrom llama_index import (    SimpleDirectoryReader,    Document,    StorageContext,    load_index_from_storage)from llama_index.node_parser import SentenceWindowNodeParserfrom llama_index.llms import OpenAIfrom llama_index.embeddings import OpenAIEmbeddingfrom llama_index import ServiceContextfrom llama_index import VectorStoreIndexfrom llama_index.indices.postprocessor import MetadataReplacementPostProcessorfrom llama_index.indices.postprocessor import SentenceTransformerRerankfrom llama_index.llms import OpenAI# for loading environment variablesfrom decouple import configfrom trulens_eval import Feedback, Tru, TruLlamafrom trulens_eval.feedback import Groundednessfrom trulens_eval.feedback.provider.openai import OpenAI as OpenAITruLensimport numpy as np# set env variablesos.environ["OPENAI_API_KEY"] = config("OPENAI_API_KEY")# load documentdocuments = SimpleDirectoryReader(    input_dir="../dataFiles/").load_data(show_progress=True)# merge pages into onedocument = Document(text="\n\n".join([doc.text for doc in documents]))def create_indexes(    documents: Document,    index_save_dir: str,    window_size: int = 4,    llm_model: str = "gpt-3.5-turbo",    temperature: float = 0.1):    node_parser = SentenceWindowNodeParser.from_defaults(        window_size=window_size,        window_metadata_key="window",        original_text_metadata_key="original_text",    )    # creating OpenAI gpt-3.5-turbo LLM and OpenAIEmbedding model    llm = OpenAI(model=llm_model, temperature=temperature)    embed_model = OpenAIEmbedding()    # creating the service context    sentence_context = ServiceContext.from_defaults(        llm=llm,        embed_model=embed_model,        node_parser=node_parser,    )    if not os.path.exists(index_save_dir):        # creating the vector store index        index = VectorStoreIndex.from_documents(            [document], service_context=sentence_context        )        # make vector store persistant        index.storage_context.persist(persist_dir=index_save_dir)    else:        # load vector store indexed if they exist        index = load_index_from_storage(            StorageContext.from_defaults(persist_dir=index_save_dir),            service_context=sentence_context        )    return indexdef create_query_engine(    sentence_index: VectorStoreIndex,    similarity_top_k: int = 6,    rerank_top_n: int = 5,    rerank_model: str = "BAAI/bge-reranker-base",):    # add meta data replacement post processor    postproc = MetadataReplacementPostProcessor(        target_metadata_key="window"    )    # link: https://huggingface.co/BAAI/bge-reranker-base    rerank = SentenceTransformerRerank(        top_n=rerank_top_n,        model=rerank_model    )    sentence_window_engine = sentence_index.as_query_engine(        similarity_top_k=similarity_top_k,        node_postprocessors=[postproc, rerank]    )    return sentence_window_engine# create indexindex = create_indexes(    documents=documents,    index_save_dir="./sentence_window_size_6_index",    window_size=3,    llm_model="gpt-3.5-turbo",    temperature=0.1)# create query enginesentence_window_engine = create_query_engine(    sentence_index=index,    similarity_top_k=5,    rerank_top_n=2,)# RAG pipeline evalstru = Tru()openai = OpenAITruLens()grounded = Groundedness(groundedness_provider=OpenAITruLens())# Define a groundedness feedback functionf_groundedness = Feedback(grounded.groundedness_measure_with_cot_reasons).on(    TruLlama.select_source_nodes().node.text).on_output().aggregate(grounded.grounded_statements_aggregator)# Question/answer relevance between overall question and answer.f_qa_relevance = Feedback(openai.relevance).on_input_output()# Question/statement relevance between question and each context chunk.f_qs_relevance = Feedback(openai.qs_relevance).on_input().on(    TruLlama.select_source_nodes().node.text).aggregate(np.mean)tru_query_engine_recorder = TruLlama(sentence_window_engine,                                     app_id='sentence_window_size_6',                                     feedbacks=[f_groundedness, f_qa_relevance, f_qs_relevance])eval_questions = []with open("./eval_questions.txt", "r") as eval_qn:    for qn in eval_qn:        qn_stripped = qn.strip()        eval_questions.append(qn_stripped)def run_eval(eval_questions: List[str]):    for qn in eval_questions:        # eval using context window        with tru_query_engine_recorder as recording:            sentence_window_engine.query(qn)run_eval(eval_questions=eval_questions)# run dashboardtru.run_dashboard()

正如我们上面讨论的那样，你可以注意到上下文大小、相关性和groundedness的趋势，如果数据清晰明了，我不想为你做任何解释。我要求您拥有更多的上下文窗口大小、不同的嵌入模型，甚至使用不同的LLM一起来处理这一问题，并找到最适合您的RAG管道用例的方法。

同样，回到构建的其他管道，尝试使用一组问题（运行测试需要10个问题），因为目前，其他管道，如基本RAG和父文档检索，都只使用了一个问题。将它们与我们在本案中构建的句子窗口管道进行比较是不公平的。

上述挑战可以[2]找到相关代码。以下是一些结果的屏幕截图：

使用句子窗口检索，我们使用的tokens更少，几乎是原来的1/4倍，相关成本更低。更好的是，我们的答案相关性、上下文相关性和groundedness都很好。

参考文献：

[1] https://github.com/Princekrampah/AdvancedRAGTechniques_LlamaIndex

[2] https://github.com/Princekrampah/AdvancedRAGTechniques_LlamaIndex

[3] https://ai.gopubby.com/advance-retrieval-techniques-in-rag-part-03-sentence-window-retrieval-9f246cffa07b

你可能感兴趣的:(RAG,笔记,人工智能)

C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
入门html这篇文章就够了 ξ流ぁ星ぷ132 html 前端
HTML笔记文章目录HTML笔记html介绍什么是htmlhtml的作用HTML标签介绍常用标签标签and标签and标签u标签del删除线br标签用于换行pre标签，预处理标签span标签div标签sub标签andsup标签hr标签h1,h2...h6标签：HTML5中的语义标签：特殊字符img标签a标签第一种用法：超链接第二种用法：锚点video标签表格标签：form标签input标签selec
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）基于历史对话重新生成Query？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain RAG
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Q
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）其他Query优化相关策略？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？一
vue3面试题(个人笔记) 武昌库里写JAVA 面试题汇总与解析课程设计 spring boot vue.js java 学习
vue3比vue2有什么优势？性能更好，打包体积更小，更好的ts支持，更好的代码组织，更好的逻辑抽离，更多的新功能。描述Vue3生命周期CompositionAPI的生命周期：onMounted()onUpdated()onUnmounted()onBeforeMount()onBeforeUpdate()onBeforeUnmount()onErrorCaptured()onRenderTrac
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
Python学习笔记5|条件语句和循环语句 iamecho9 Python从0到1学习笔记 python 学习笔记
一、条件语句条件语句用于根据不同的条件执行不同的代码块。1、if语句基本语法：if布尔型语句1:代码块#语句1为True时执行的代码示例：age=int(input("请输入你的年龄:"))ifage>=18:print("你已成年")2、if-else语句如果if条件不成立，则执行else代码块：if布尔型语句1:代码块#语句1为True时执行的代码else:代码块#语句1为False时执行的代
swagger【个人笔记】撰卢笔记 java
文章目录swagger导入mave坐标在配置类(WebMvcConfiguration)中加入knife4j相关配置设置静态资源映射，主要是让拦截器放行swagger常用注解@Api(tags="\[描述这个类的作用]")@ApiModel(description="\[描述这个类的作用]")@ApiModelProPerty("描述这个类的作用")@ApiOperation("\[描述方法的作用
【个人笔记】负载均衡撰卢笔记负载均衡运维
文章目录nginx反向代理的好处负载均衡负载均很的配置方式均衡负载的方式nginx反向代理的好处提高访问速度进行负载均衡保证后端服务安全负载均衡负载均衡，就是把大量的请求按照我们指定的方式均衡的分配给集群中的每台服务器负载均很的配置方式upstreamwebservers{server192.168.100.128:8080server192.168.100.129:8080}server{lis
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
使用 DeepSeek R1 和 Ollama 开发 RAG 系统使用 DeepSeek R1 和 Ollama 构建强大的 RAG 系统。了解开发智能 AI 解决方案的设置过程、最佳实践和技巧。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介DeepSeekR1和Ollama提供了用于构建检索增强生成(RAG)系统的强大工具。本指南介绍了使用这些技术开发RAG应用程序的设置、实施和最佳实践。为什么RAG系统会改变游戏规则检索增强生成(RAG)系统结合了搜索和生成AI的优点，可实现精确且准确的情境感知响应。借助DeepSeekR1和Ollama等工具，创建RAG系统不再令人生畏。无论您是构建聊天机器人、知识助手还是AI驱动的搜索引擎
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
AnythingLLM教程系列之 12 AnythingLLM 上的 Ollama 与 MySQL+PostgreSQL 知识大胖 NVIDIA GPU和大语言模型开发教程 mysql postgresql 数据库 anythingllm ollama
简介一款全栈应用程序，可让您将任何文档、资源或内容转换为上下文，任何LLM都可以在聊天期间将其用作参考。此应用程序允许您选择要使用的LLM或矢量数据库，并支持多用户管理和权限。本文将介绍如何在AnythingLLM上将Ollama与MySQL+PostgreSQL连接起来。系列文章如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI应用程序，可以执行RAG、A
AnythingLLM教程系列之 09 AnythingLLM 支持自定义音频转录提供程序知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 anythingllm llm
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
AnythingLLM教程系列之 04 AnythingLLM 允许您以正确的格式导出聊天日志，以构建 GPT-3.5 和 OpenAI 上其他可用模型的微调模型（教程含安装步骤）知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 ai anythinllm llama
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
2025年的RAG技术发展趋势与演进码农Q！云计算人工智能 ai agi 自然语言处理语言模型
本文将分享作为大模型应用创业者的经历与观察，讨论RAG技术和市场环境在2024年的变化。一、RAG技术的演进RAG（检索增强生成）由“检索”和“大模型生成”两部分组成，而检索之前的索引创建（如chunking、embedding等）是核心基础。我们早在2021年便通过Java技术栈实现了RAG的“RA”部分。2023年中，RAG概念突然走红，并迅速在企业应用中显示出更强的实用性。1.主流架构的变化
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
5G标准学习笔记14 - CSI--RS概述刘孬孬沉迷学习 5G 学习笔记信息与通信
5G标准学习笔记14-CSI–RS概述大家好~，这里是刘孬孬，今天带着大家一起学习一下5GNR中一个非常非常重要的参考信号------------------CSI-RS信号，CSI-RS不是持续发送，UE只能在网络明确配置了CSI-RS的情况下才能使用其进行信道测量。前言对于CSI-RS，肯定还离不开前面所说的CSI（channelstateinformation），前面也讲过CSI对于MIMO
5G标准学习笔记06-基于AI/ML波束管理刘孬孬沉迷学习 5G 学习笔记
5G标准学习笔记06-基于AI/ML波束管理前言前面对于孬孬学习了波束管理的概述，下面要进一步来看一下传统波束管理和现在3GPP中推动的AL/ML波束管理之前的区别联系。一、传统波束管理方法流程传统BM流程主要包括以下步骤：波束扫描（BeamSweeping）：gNB通过顺序发送多个窄波束（SSB或CSI-RS），覆盖整个服务区域，UE测量每个波束的信号质量（如L1-RSRP或L1-SINR）。波
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的