Elastic 中国社区官方博客

使用 Elasticsearch、OpenAI 和 LangChain 进行语义搜索

在本教程中，我将引导您使用 Elasticsearch、OpenAI、LangChain 和 FastAPI 构建语义搜索服务。

LangChain 是这个领域的新酷孩子。它是一个旨在帮助你与大型语言模型 (LLM) 交互的库。 LangChain 简化了与 LLMs 相关的许多日常任务，例如从文档中提取文本或在向量数据库中对它们建立索引。如果你现在正在与 LLMs 一起工作，LangChain 可以节省你的工作时间。

然而，它的一个缺点是，尽管它的文档很广泛，但可能比较分散，对于新手来说很难理解。此外，大多数在线内容都集中在最新一代的向量数据库上。由于许多组织仍在使用 Elasticsearch 这样经过实战考验的技术，我决定使用它编写一个教程。

我将 LangChain 和 Elasticsearch 结合到了最常见的 LLM 应用之一：语义搜索。在本教程中，我将引导你使用 Elasticsearch、OpenAI、LangChain 和 FastAPI 构建语义搜索服务。你将创建一个应用程序，让用户可以提出有关马可·奥勒留《沉思录》的问题，并通过从书中提取最相关的内容为他们提供简洁的答案。

让我们深入了解吧！

前提条件

你应该熟悉这些主题才能充分利用本教程：

Elasticsearch：语义搜索、知识图和向量数据库概述
Elasticsearch：关于在 Python 中使用 Elasticsearch 你需要知道的一切 - 8.x

此外，你必须安装 Docker 并在 OpenAI 上创建一个帐户。

设计语义搜索服务

你将构建一个包含三个组件的服务：

索引器：这将创建索引，生成嵌入和元数据（在本例中为书籍的来源和标题），并将它们添加到向量数据库中。
矢量数据库：这是一个用于存储和检索生成的嵌入的数据库。
搜索应用程序：这是一个后端服务，它使用用户的搜索词，从中生成嵌入，然后在矢量数据库中查找最相似的嵌入。

这是该架构的示意图：

接下来，你将设置本地环境。

设置你的本地环境

请按照以下步骤设置您的本地环境：

1）安装 Python 3.10。
2）安装 Poetry。它是可选的，但强烈推荐。

sudo pip install poetry

3) 克隆项目的存储库：

git clone https://github.com/liu-xiao-guo/semantic-search-elasticsearch-openai-langchain

4）从项目的根文件夹中，安装依赖项：

使用 Poetry：在项目同目录下创建虚拟环境并安装依赖：

poetry config virtualenvs.in-project true
poetry install

使用 venv 和 pip：创建虚拟环境并安装 requirements.txt 中列出的依赖项：

python3.10 -m venv .venv && source .venv/bin/activate
pip install -r requirements.txt

5）打开 src/.env-example，添加你的 OpenAI 密钥，并将文件另存为 .env。

(.venv) $ pwd
/Users/liuxg/python/semantic-search-elasticsearch-openai-langchain/src
(.venv) $ ls -al
total 32
drwxr-xr-x   7 liuxg  staff  224 Sep 17 17:27 .
drwxr-xr-x  13 liuxg  staff  416 Sep 17 21:23 ..
-rw-r--r--   1 liuxg  staff   41 Sep 17 17:27 .env-example
-rw-r--r--   1 liuxg  staff  870 Sep 17 17:27 app.py
-rw-r--r--   1 liuxg  staff  384 Sep 17 17:27 config.py
drwxr-xr-x   3 liuxg  staff   96 Sep 17 17:27 data
-rw-r--r--   1 liuxg  staff  840 Sep 17 17:27 indexer.py
(.venv) $ mv .env-example .env
(.venv) $ vi .env

到目前为止，你将设置一个包含所需库和存储库的本地副本的虚拟环境。你的项目结构应该如下所示：

.
├── LICENSE
├── README.md
├── docker-compose.yml
├── .env
├── poetry.lock
├── pyproject.toml
├── requirements.txt
└── src
    ├── app.py
    ├── config.py
    ├── .env
    ├── .env-example     
    ├── data
    │   └── Marcus_Aurelius_Antoninus_-_His_Meditations_concerning_himselfe
    └── indexer.py

请注意：在上面的文件结构中，有两个 .env 文件。根目录下的 .env 文件是为 docker-compose.yml 文件所使用，而 src 目录里的文件是为应用所示使用。我们可以在根目录里的 .env 文件中定义想要的 Elastic Stack 版本号。

这些是项目中最相关的文件和目录：

poetry.lock 和 pyproject.toml：这些文件包含项目的规范和依赖项，被 Poetry 用来创建虚拟环境。
requirements.txt：该文件包含项目所需的 Python 包列表。
docker-compose.yml：此文件包含用于在本地运行 Elasticsearch 集群及 Kibana。
src/app.py：该文件包含搜索应用程序的代码。
src/config.py：此文件包含项目配置规范，例如 OpenAI 的 API 密钥（从 .env 文件读取）、数据路径和索引名称。
src/data/：该目录包含最初从维基文库下载的 Meditations 。你将使用它作为本教程的文本语料库。
src/indexer.py：此文件包含用于创建索引并将文档插入 Elasticsearch 的代码。
.env-example：此文件通常用于环境变量。在本例中，你可以使用它将 OpenAI 的 API 密钥传递给您的应用程序。
.venv/：该目录包含项目的虚拟环境。

全做完了！我们继续向下进行吧。

启动本地 Elasticsearch 集群

在我们进入代码之前，你应该启动一个本地 Elasticsearch 集群。打开一个新终端，导航到项目的根文件夹，然后运行：

docker-compose up

在上面的部署中，出于方便，我们使用了没有带安全的 Elastic Stack 的安装以方便进行开发。具体的安装步骤，请参阅另外一篇文章 “Elasticsearch：如何在 Docker 上运行 Elasticsearch 8.x 进行本地开发”。如果一切顺利，我们可以使用如下的命令来进行查看:

docker ps

$ docker ps
CONTAINER ID   IMAGE                 COMMAND                  CREATED         STATUS         PORTS                              NAMES
a2866c0356a2   kibana:8.9.2          "/bin/tini -- /usr/l…"   4 minutes ago   Up 4 minutes   0.0.0.0:5601->5601/tcp             kibana
b504079c59ea   elasticsearch:8.9.2   "/bin/tini -- /usr/l…"   4 minutes ago   Up 4 minutes   0.0.0.0:9200->9200/tcp, 9300/tcp   elasticsearch

我们可以在浏览器中针对 Elasticsearch 进行访问：

我们还可以在 localhost:5601 上访问 Kibana：

拆分书籍并为其建立索引

在此步骤中，你将执行两件事：

通过将书中的文本拆分为 1,000 个 token 的块来处理该文本。
对你在 Elasticsearch 集群中生成的文本块（从现在开始称为文档）建立索引。

看一下 src/indexer.py：

from langchain.document_loaders import BSHTMLLoader
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.vectorstores import ElasticVectorSearch

from config import Paths, openai_api_key


def main():
    loader = BSHTMLLoader(str(Paths.book))
    data = loader.load()

    text_splitter = RecursiveCharacterTextSplitter.from_tiktoken_encoder(
        chunk_size=1000, chunk_overlap=0
    )
    documents = text_splitter.split_documents(data)

    embeddings = OpenAIEmbeddings(openai_api_key=openai_api_key)
    db = ElasticVectorSearch.from_documents(
        documents,
        embeddings,
        elasticsearch_url="http://localhost:9200",
        index_name="elastic-index",
    )
    print(db.client.info())


if __name__ == "__main__":
    main()

此代码采用 Meditations（书），将其拆分为 1,000 个 token 的文本块，然后在 Elasticsearch 集群中为这些块建立索引。以下是详细的细分：

第 1 行到第 4 行从 langchain 导入所需的组件：
- BSHTMLLoader：此 Loader 使用 BeautifulSoup4 来解析文档。
- OpenAIembeddings：该组件是 OpenAI 嵌入的包装器。它可以帮助你生成文档和查询的嵌入。
- RecursiveCharacterTextSplitter：此实用程序函数通过尝试按旨在保持语义相似内容邻近的顺序尝试各种字符来分割输入文本。用于分割的字符按以下顺序排列为：“\n\n”、“\n”、“ ”、“”。
- ElasticSearchVector：这是 Elasticsearch 客户端的包装器，可简化与集群的交互。
第 6 行从 config.py 导入相关配置
第 11 行和第 12 行使用 BSHTMLLoader 提取书籍的文本。
第 13 至 16 行初始化文本拆分器，并将文本拆分为不超过 1,000 个标记的块。在这种情况下，你可以使用 tiktoken 来计算 token，但你也可以使用不同长度的函数，例如计算字符数而不是 token 或不同的 token 化函数。
第 18 至 25 行初始化嵌入函数，创建新索引，并对文本拆分器生成的文档建立索引。在 elasticsearch_url 中，你指定应用程序在本地运行的端口，在index_name 中指定你将使用的索引的名称。最后，打印 Elasticsearch 客户端信息。

要运行此脚本，请打开终端，激活虚拟环境，然后从项目的 src 文件夹中运行以下命令：

# ../src/
export export OPENAI_API_KEY=your_open_ai_token
python indexer.py

注意：你如果使用 OpenAI 来进行矢量化，那么你需要在你的账号中有充分的钱来支付这种费用，否则你可能得到如下的错误信息：

Retrying langchain.embeddings.openai.embed_with_retry.._embed_with_retry in 4.0 seconds as it raised RateLimitError: You exceeded your current quota, please check your plan and billing details..

如果一切顺利，你应该得到与此类似的输出：

{'name': '0e1113eb2915', 'cluster_name': 'docker-cluster', 'cluster_uuid': 'og6mFMqwQtaJiv_3E_q2YQ', 'version': {'number': '8.9.2', 'build_flavor': 'default', 'build_type': 'docker', 'build_hash': '09520b59b6bc1057340b55750186466ea715e30e', 'build_date': '2023-03-27T16:31:09.816451435Z', 'build_snapshot': False, 'lucene_version': '9.5.0', 'minimum_wire_compatibility_version': '7.17.0', 'minimum_index_compatibility_version': '7.0.0'}, 'tagline': 'You Know, for Search'}

接下来，让我们创建一个简单的 FastAPI 应用程序，以与你的集群进行交互。

创建搜索应用程序

在此步骤中，你将创建一个简单的应用程序来与 Meditations 交互。你将连接到 Elasticsearch 集群，始化检索提问/应答 Chain，并创建一个 /ask 端点以允许用户与应用程序交互。

看一下 src/app.py 的代码：

from fastapi import FastAPI
from langchain.chains import RetrievalQA
from langchain.chat_models import ChatOpenAI
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.vectorstores import ElasticVectorSearch

from config import openai_api_key

embedding = OpenAIEmbeddings(openai_api_key=openai_api_key)

db = ElasticVectorSearch(
    elasticsearch_url="http://localhost:9200",
    index_name="elastic-index",
    embedding=embedding,
)
qa = RetrievalQA.from_chain_type(
    llm=ChatOpenAI(temperature=0),
    chain_type="stuff",
    retriever=db.as_retriever(),
)

app = FastAPI()


@app.get("/")
def index():
    return {
        "message": "Make a post request to /ask to ask questions about Meditations by Marcus Aurelius"
    }


@app.post("/ask")
def ask(query: str):
    response = qa.run(query)
    return {
        "response": response,
    }

此代码允许用户提出有关马库斯·奥勒留《沉思录》的问题，并向用户提供答案。让我向你展示它是如何工作的：

第 1 至 5 行导入所需的库：
- FastAPI：此类初始化应用程序。
- RetrievalQA：这是一个允许你询问有关向量数据库中文档的问题的 Chain。它根据你的问题找到最相关的文档并从中生成答案。
- ChatOpenAI：这是 OpenAI 聊天模型的包装。
- OpenAIembeddings 和 ElasticVectorSearch：这些是上一节中讨论的相同包装器。
第 7 行导入 OpenAI 密钥。
第 9 至 15 行使用 OpenAI 嵌入初始化 Elasticsearch 集群。
第 16 至 20 行使用以下参数初始化 RetrievalQA Chain：
- llm：指定用于运行链中定义的提示的 LLM。
- chain_type：定义如何从向量数据库检索和处理文档。通过指定内容，将检索文档并将其传递到链以按原样回答问题。或者，你可以在回答问题之前使用 map_reduce 或 map_rerank 进行额外处理，但这些方法使用更多的 API 调用。有关更多信息，请参阅 langchain 文档。
- retrieve：指定链用于检索文档的向量数据库。
第 22 至 36 行初始化 FastAPI 应用程序并定义两个端点。 / 端点为用户提供有关如何使用应用程序的信息。 /ask 端点接受用户的问题（查询参数）并使用先前初始化的链返回答案。

最后，你可以从终端运行该应用程序（使用你的虚拟环境）：

uvicorn app:app --reload

然后，访问 http://127.0.0.1:8000/docs，并通过询问有关这本书的问题来测试 /ask：

如果一切顺利，你应该得到这样的结果：

就是这样！您现在已经启动并运行了自己的基于 Elasticsearch、OpenAI、Langchain 和 FastAPI 的语义搜索服务。

结论

干得好！在本教程中，你学习了如何使用 Elasticsearch、OpenAI 和 Langchain 构建语义搜索引擎。

特别是，你已经了解到：

如何构建语义搜索服务。
如何使用 LangChain 对文档进行拆分和索引。
如何使用 Elasticsearch 作为向量数据库与 LangChain 一起使用。
如何使用检索问答链通过向量数据库回答问题。
产品化此类应用程序时应考虑什么。

希望您觉得本教程有用。如果你有任何疑问，请参入讨论！

Linux 配置主机名及映射 letian@ java jvm spring
一Linux主机名的配置在学习Linux中，起初安装Linux,在安装过程中我们可以自定义主机名，但一旦安装过后，是否就不能修改主机名，需要重新安装呢，答案是否定的，我们可以输入vi/etc/hostname进入文件修改默认的主机名，默认的主机名为localhost.localdomain我们只需要将其改成默认的名字然后保存，当然保存后命令行前还显示之前的主机名，需要重启才能生效。二Linux域名
定义一个dto对象_正确理解DTO、值对象和POCO
今天推荐的文章比较技术化也比较简单，但是对于一些初学者而言，可能也是容易搞混的概念：就是如何理解DTO、值对象和POCO之间的区别。所谓DTO就是数据传输对象(DataTransferObject)，POCO就是简单CLR对象(PlainOldCLRObject)，概念来源于Java中的POJO；不过值对象(ValueObject)并非.NET中的值类型(ValueType)的实例对象，而是领域驱
java dto对象_DTO与值对象和POJO比较
本文想澄清DTO与ValueObject与POCO的区别，其中DTO代表数据传输对象，而POCO是PlainOldCLRObject，在Java环境中也称为POJO。对ValueObject做一个注释：C＃中有一个类似的概念，即ValueType。它只是对象如何存储在内存中的实现细节，我不打算触及它。这里将讨论的是DDD概念中的值对象ValueObject。DTO，ValueObject和POCO
实体对象辨析(POCO、Entity、Model、DTO、BO、DO、PO) weixin_33981932 runtime 数据库 java
为什么80%的码农都做不了架构师？>>>POCO(PlainOldCLRObject)源自JavaEE编程领域的POJO概念(2000年由MartinFowler提出)和POTS(PlainOldTelephoneService)概念。POCO被应用于面向.NET框架的CLR(CommonLanguageRuntime,公共语言运行时)。但是POCO本身不依赖于外部框架，它是PLAIN的。POCO
【面试系列】C++ 高频面试题野老杂谈全网最全IT公司面试宝典 c++面试编程语言
欢迎来到我的博客，很高兴能够在这里和您见面！欢迎订阅相关专栏：⭐️全网最全IT互联网公司面试宝典：收集整理全网各大IT互联网公司技术、项目、HR面试真题.⭐️AIGC时代的创新与未来：详细讲解AIGC的概念、核心技术、应用领域等内容。⭐️全流程数据技术实战指南：全面讲解从数据采集到数据可视化的整个过程，掌握构建现代化数据平台和数据仓库的核心技术和方法。文章目录C++初级面试题及其详细解答1.解释C
十分钟聊明白DDD领域驱动设计 roykingw java java 架构 DDD 领域驱动
文章目录一、什么是领域？二、领域如何驱动设计？三、如何发挥DDD的价值最后十分钟聊明白DDD领域驱动设计--楼兰关于DDD，大部分朋友应该都听说过。全称DomainDrivenDesign，翻译过来就是领域驱动设计。这个神秘的架构思想，虽然远没有SpringBoot这类框架这么名声在外，但是却经常时不时冒出来，牵动一下大家的神经。美团、阿里每年的技术年会都会有关于DDD的经验分享，而另一方面，又有
Mybatis常见运行报错（持续更新...）
报错一：Causedby:org.yaml.snakeyaml.error.YAMLException:java.nio.charset.MalformedInputException:Inputlength=1解决办法：setting->Editor->FileEncodings,编码方式都选择UTF-8报错二：Cause:java.sql.SQLIntegrityConstraintViola
融云入选「创业邦·2025 中国企业全球化新势力 100 强·引领型」资讯
7月3日-4日，由创业邦主办的“2025DEMOWORLD企业开放式创新创投大会”在上海松江举行。作为全球领先的智能通信云服务商，融云凭借卓越的全球化实践和在“通信+AI”领域的创新探索，成功入选大会重磅发布的“2025中国企业全球化新势力100强·引领型”榜单。本次榜单评选采用内部调研回访+专家评委评审的模式，邀请来自峰瑞资本、嘉御资本、创世伙伴创投等头部机构的10位专家评委，根据专家评委的综合
【架构-DDD】使用领域驱动设计-互联网未来架构设计之道（一） Fun肆编程 DDD 架构系统架构 java 云计算微服务
文章已收录至https://lichong.work，转载请注明原文链接。ps：欢迎关注公众号“Fun肆编程”或添加我的私人微信交流经验简介互联网后微服务时代，软件质量是一个非常让人头疼的问题，而DDD（Domain-DrivenDesign）被认为是系统老化问题的新希望。众多互联网大厂都在积极推行DDD的落地实践。而对IT程序员，尤其对于高级职位，DDD成了一个越来越重要的技能加分项。但是DDD
SUNDAE-一种称为“光谱剪枝”的技术来优化和压缩3DGS模型 huarzail 3DGS 剪枝 3d 算法
清华大学人工智能产业研究院、伦敦帝国理工学院、北京航空航天大学、北京理工大学、中国科学院大学、香港中文大学（深圳）、中国电信人工智能研究院（TeleAI）EVOL实验室的研究人员联合推出了一种新的3D场景表示方法-SUNDAE，它通过一种称为“光谱剪枝”的技术来优化和压缩3D高斯溅射（3DGaussianSplatting，简称3DGS）模型，同时使用神经网络补偿来保持渲染质量。项目主页：SUND
FLUX.1 Kontext全景图：下一代AI图像编辑的家族革命与技术图谱 Liudef06小白 AIGC 人工智能 AIGC
FLUX.1Kontext全景图：下一代AI图像编辑的家族革命与技术图谱120亿参数流式变换器驱动，3秒完成像素级编辑，StableDiffusion原班团队打造的AI图像新范式正在重塑创意工作流。2025年夏，BlackForestLabs（黑森林实验室）向全球创意产业投下一枚技术炸弹——FLUX.1Kontext图像编辑模型家族正式亮相。这个由StableDiffusion核心创始团队打造的A
PromptX 架构深度解析：从 DPML 协议看 AI 工程的未来范式步子哥智能涌现人工智能架构
核心理念：人类用自然语言描述需求，AI提供专业级服务-这不是科幻，而是PromptX正在实现的现实引言：小小协议文件背后的宏大愿景当我们打开PromptX项目中的dpml.protocol.md文件时，看到的不仅仅是一个技术规范，而是对AI交互未来的深刻思考。这个看似简单的协议文件，承载着整个PromptX生态系统的核心设计哲学，堪称AI工程领域的"宪法"。今天，让我们从这个协议文件开始，深度解析
Docker容器如何实现分布式微服务：从0到1的深度解析 cda2024 docker 分布式微服务
在当今云计算和大数据时代，企业面临的最大挑战之一是如何快速、稳定地部署和管理复杂的软件应用。传统的单体架构已难以满足现代互联网应用的需求，而分布式微服务架构成为了解决这一难题的关键。但问题随之而来：如何高效地构建和管理分布式微服务？Docker容器技术的出现为这个问题带来了新的曙光。它不仅简化了应用程序的打包和部署过程，还为微服务架构提供了强大的支持。本文将深入探讨Docker容器如何实现分布式微
2025年7月-9月广深地区学术会议征稿邀稿 | 2025年7-9月广州学术会议、深圳学术会议参会投稿 | 广深参会 EI 检索会议推荐 | 期待在广东与您相见，共襄学术盛举！
会议名称【点击会议名称查看详情】会议时间会议地点第四届能源与电力系统国际学术会议(ICEEPS2025)2025年7月17-19日广州第七届电子与通信，网络与计算机技术国际学术会议（ECNCT2025）2025年7月18-20日广州2025年人工智能与基础模型国际学术会议（AIFM2025）2025年7月18-20日广州第六届经济管理与大数据应用国际学术会议(ICEMBDA2025)2025年7月
JavaScript 异步函数优化：提升性能和可读性喵手前端 javascript 开发语言 ecmascript
全文目录：开篇语**前言****1.使用`async/await`替代回调函数****示例：回调地狱vs`async/await`****回调地狱示例：****使用`async/await`改写：****优化要点：****2.使用`Promise.all`和`Promise.race`提高并发性能****`Promise.all`示例：****`Promise.race`示例：****优化要点：*
Python爬企查查网站数据的爬虫代码如何写？ cda2024 python 爬虫开发语言
在大数据时代，数据的获取与分析变得尤为重要。企业信息查询平台“企查查”作为国内领先的企业信用信息查询工具，提供了丰富的企业数据资源。对于数据科学家和工程师而言，能够从这些平台高效地抓取数据，无疑是一项重要的技能。本文将详细介绍如何使用Python编写爬虫代码，从企查查网站抓取企业数据，并探讨其中的技术难点和解决方案。为什么选择Python？Python是一门广泛应用于数据科学和网络爬虫开发的语言，
魔都AI医疗哪家强？全景揭秘科技创新与未来钱景！
引言上海作为中国科技创新的先锋城市，正在AI医疗领域崭露头角。根据2024年12月的数据，上海拥有34家专注于AI药物研发的公司，占全国预临床研究的60%和临床试验的47%。这些公司利用深度学习、大语言模型（LLM）和计算机视觉等技术，革新药物发现、医疗影像分析和数据治理，推动医疗行业的智能化转型。从全球首个人工智能医院“AgentHospital”到AI驱动的诊断系统，上海的AI医疗生态正在重塑
获取文件的所在路径(windows和linux都适用) 爱吃土豆的马铃薯ㅤㅤㅤㅤㅤㅤㅤㅤㅤ windows linux 运维
使用类路径资源方式（已测试-推荐）：//将javaSettings.cfg放在src/main/resources/config目录下StringconfigPath=IatCapacity.class.getResource("/config/javaSettings.cfg").getPath();getParam(configPath);使用相对路径：//相对于项目根目录Stringconf
黑洞加速器官方android安卓版本,www.a0qmherg.com
DomainName:A0QMHERG.COMRegistryDomainID:2477874593_DOMAIN_COM-VRSNRegistrarWHOISServer:whois.namesilo.comRegistrarURL:http://www.namesilo.comUpdatedDate:2020-01-09T05:00:47ZCreationDate:2020-01-09T04:
FastAPI 使 Python 开发的 API 更具扩展性 Python编程之道 Python人工智能与大数据 Python编程之道 fastapi python 开发语言 ai
FastAPI使Python开发的API更具扩展性关键词：FastAPI、Python、API开发、扩展性、异步编程摘要：本文围绕FastAPI如何使Python开发的API更具扩展性展开。首先介绍了FastAPI的背景知识，包括其目的、适用读者、文档结构等。接着阐述了FastAPI的核心概念、架构原理，并通过Mermaid流程图进行展示。详细讲解了核心算法原理和具体操作步骤，结合Python源代
Kubernetes日志运维痛点及日志系统架构设计（Promtail+Loki+Grafana）
Kubernetes日志运维痛点及日志系统架构设计（Promtail+Loki+Grafana）运维痛点日志采集的可靠性与复杂性pod生命周期短、易销毁容器重启或Pod被销毁后，日志会丢失（除非已持久化或集中采集）。需要侧重于实时采集和转发，而不能依赖节点本地日志。多样化的日志来源与格式应用日志、系统日志、Kubernetes组件日志（如kubelet、kube-apiserver）、中间件日志（
如何利用AWS Lambda作为Serverless数据库进行大数据处理 AI天才研究院 AI人工智能与大数据自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术Serverless数据库一直是构建数据分析应用的主要选择之一。它能帮助客户节省运行服务所需的服务器成本、快速弹性扩展和自动伸缩能力，并且能提升整体性能，有效减少运维和开发资源投入。但是，在实际生产环境中，它们也面临着很多技术上的挑战，比如如何让Serverless数据库服务可以像传统数据库一样，做到高并发处理、实时计算等。而AWSLambda为Serverless数据
云原生时代的日志管理：ELK、Loki、Fluentd 如何选型？
一、引言在微服务和Kubernetes普及的今天，传统的日志管理方式已经难以应对高并发、分布式架构带来的挑战。随着容器化应用数量激增，日志数据量呈指数级增长，如何高效地收集、存储、查询和分析日志，成为每个团队必须面对的问题。在这样的背景下，ELK（Elasticsearch+Logstash+Kibana）、Loki和Fluentd成为当前主流的日志解决方案。它们各有特色，适用于不同规模和技术栈的
JavaScript条件语句啥时候都困系列 JavaScript javascript
if-else类型第一关：if-else类型functionmainJs(a){a=parseInt(a);//请在此处编写代码/**********Begin**********/if(a<60){return"unpass";}else{return"pass";}/**********End**********/}switch类型第一关：switch类型functionmainJs(a){a
大数据领域数据产品的零售行业应用创新模式大数据洞察大数据与AI人工智能大数据零售单例模式 ai
大数据领域数据产品的零售行业应用创新模式关键词：大数据、零售行业、数据产品、应用创新、客户洞察、智能决策、数字化转型摘要：本文深入探讨了大数据技术在零售行业中的应用创新模式。我们将从零售行业数字化转型的背景出发，分析大数据产品如何重塑零售价值链，包括客户洞察、供应链优化、精准营销和智能决策等方面。文章将详细介绍相关技术原理、算法实现和实际应用案例，为零售企业提供可操作的大数据应用框架和创新思路。1
AI 正在深度重构软件开发的底层逻辑和全生命周期，从技术演进、流程重构和未来趋势三个维度进行系统性分析
AI正在深度重构软件开发的底层逻辑和全生命周期，从需求分析到运维维护的每个环节都产生了范式级变革。以下从技术演进、流程重构和未来趋势三个维度进行系统性分析：一、AI重构软件开发全栈的技术图谱需求工程智能化NLP驱动的需求解析：GPT-4架构实现用户访谈转录自动转化为UML用例图，准确率达89%（微软2023内部数据）情感计算应用：基于BERT的意图识别模型可捕捉用户需求中的隐性情绪，需求变更预测准
个人总结 - LangChain4j应用（1）艾露z AI java langchain ai 人工智能
个人总结-LangChain4j应用（1）github：Releases·langchain4j/langchain4j·GitHub官方文档：Introduction|LangChain4j简要介绍：LangChain4j是一个旨在简化大语言模型（LLMs）与Java应用程序集成的框架。ChatandLanguageModels：LanguageModel：最简单的聊天模型，简单的接收字符串，不
怎么用快鲸AISEO实战全攻略提升百度排名？
智能SEO实战策略智能搜索引擎优化的核心在于利用先进技术手段实现策略的动态调整与优化。快鲸AISEO正是这类工具的代表，它能够深度分析搜索引擎的规则变化与用户搜索意图的演变。通过该平台，网站运营者可以高效地执行百度搜索排名优化任务，其智能算法能实时识别并推荐高潜力关键词，同时指导内容结构的优化方向，确保内容既符合搜索算法偏好，又能精准匹配用户需求。这种动态调整能力显著提升了优化的效率与精准度。实践
开源 AI 联网搜索工具：Open-WebSearch MCP 全新升级，支持多引擎 + 流式响应！ Aasee. 开源人工智能 javascript mcp
开源AI联网搜索工具：Open-WebSearchMCP全新升级，支持多引擎+流式响应！「让你的AI插件真正能联网」——不需要APIKey，搜索结果可控、开箱即用！大家好，我最近开源了一个AI插件开发工具——Open-WebSearchMCP。这个项目旨在解决AI在实际应用中无法联网或联网费用高昂的问题，特别适合在Claude、LangChain、RAG方案中添加“实时搜索”能力。项目亮点一览✅多
利用 Python 脚本批量查找并删除指定 IP 的 AWS Lightsail 实例忘记安全带 Python网络自动化运维 tcp/ip aws 网络云计算自动化服务器 python
在AWSLightsail管理中，随着实例数量的增多，我们常常会遇到这样一个问题：“我知道某个公网IP地址，但不知道它关联的是哪台实例。”或者：“我有一批老旧的实例只知道IP，需要一键定位并选择删除。”如果你逐台在AWS控制台中点开每台实例、查看其IP，效率低下且极易出错。本文将介绍如何通过Python脚本，批量查找绑定特定IP的实例，并可交互式地选择是否删除。该脚本支持自动遍历多个区域、并发执行
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d