公众号-芋道源码

图解 Elasticsearch 原理

点击上方“芋道源码”，选择“置顶公众号”

技术文章第一时间送达！

源码精品专栏

精尽 Dubbo 原理与源码 69 篇
精尽 Netty 原理与源码 61 篇
中文详细注释的开源项目
Java 并发源码合集
RocketMQ 源码合集
Sharding-JDBC 源码解析合集
Spring MVC 和 Security 源码合集
MyCAT 源码解析合集

来源：http://t.cn/RGOXDdG

摘要
版本
内容
- 图解ElasticSearch
- 图解Lucene
- 搜索发生时
- 缓存的故事
- 在Shard中搜索
- 如何Scale
- 一个真实的请求
参考

摘要

先自上而下，后自底向上的介绍ElasticSearch的底层工作原理，试图回答以下问题：

为什么我的搜索 *foo-bar* 无法匹配 *foo-bar* ？
为什么增加更多的文件会压缩索引（Index）？
为什么ElasticSearch占用很多内存？

版本

elasticsearch版本: elasticsearch-2.2.0

内容

图解ElasticSearch

云上的集群

图解 Elasticsearch 原理_第1张图片

img

集群里的盒子

云里面的每个白色正方形的盒子代表一个节点——Node。

图解 Elasticsearch 原理_第2张图片

img

节点之间

在一个或者多个节点直接，多个绿色小方块组合在一起形成一个ElasticSearch的索引。

图解 Elasticsearch 原理_第3张图片

img

索引里的小方块

在一个索引下，分布在多个节点里的绿色小方块称为分片——Shard。

图解 Elasticsearch 原理_第4张图片

img

Shard＝Lucene Index

一个ElasticSearch的Shard本质上是一个Lucene Index。

图解 Elasticsearch 原理_第5张图片

img

Lucene是一个Full Text 搜索库（也有很多其他形式的搜索库），ElasticSearch是建立在Lucene之上的。接下来的故事要说的大部分内容实际上是ElasticSearch如何基于Lucene工作的。

图解Lucene

Mini索引——segment

在Lucene里面有很多小的segment，我们可以把它们看成Lucene内部的mini-index。

图解 Elasticsearch 原理_第6张图片

img

Segment内部

有着许多数据结构

Inverted Index
Stored Fields
Document Values
Cache

图解 Elasticsearch 原理_第7张图片

img

最最重要的Inverted Index

图解 Elasticsearch 原理_第8张图片

img

Inverted Index主要包括两部分：

一个有序的数据字典Dictionary（包括单词Term和它出现的频率）。
与单词Term对应的Postings（即存在这个单词的文件）。

当我们搜索的时候，首先将搜索的内容分解，然后在字典里找到对应Term，从而查找到与搜索相关的文件内容。

图解 Elasticsearch 原理_第9张图片

img

查询“the fury”

图解 Elasticsearch 原理_第10张图片

img

自动补全（AutoCompletion-Prefix）

如果想要查找以字母“c”开头的字母，可以简单的通过二分查找（Binary Search）在Inverted Index表中找到例如“choice”、“coming”这样的词（Term）。

图解 Elasticsearch 原理_第11张图片

img

昂贵的查找

如果想要查找所有包含“our”字母的单词，那么系统会扫描整个Inverted Index，这是非常昂贵的。

图解 Elasticsearch 原理_第12张图片

img

在此种情况下，如果想要做优化，那么我们面对的问题是如何生成合适的Term。

问题的转化

图解 Elasticsearch 原理_第13张图片

img

对于以上诸如此类的问题，我们可能会有几种可行的解决方案：

* suffix -> xiffus *
如果我们想以后缀作为搜索条件，可以为Term做反向处理。
(60.6384, 6.5017) -> u4u8gyykk
对于GEO位置信息，可以将它转换为GEO Hash。
123 -> {1-hundreds, 12-tens, 123}
对于简单的数字，可以为它生成多重形式的Term。

解决拼写错误

一个Python库为单词生成了一个包含错误拼写信息的树形状态机，解决拼写错误的问题。

图解 Elasticsearch 原理_第14张图片

img

Stored Field字段查找

当我们想要查找包含某个特定标题内容的文件时，Inverted Index就不能很好的解决这个问题，所以Lucene提供了另外一种数据结构Stored Fields来解决这个问题。本质上，Stored Fields是一个简单的键值对key-value。默认情况下，ElasticSearch会存储整个文件的JSON source。

图解 Elasticsearch 原理_第15张图片

img

Document Values为了排序，聚合

即使这样，我们发现以上结构仍然无法解决诸如：排序、聚合、facet，因为我们可能会要读取大量不需要的信息。

所以，另一种数据结构解决了此种问题：Document Values。这种结构本质上就是一个列式的存储，它高度优化了具有相同类型的数据的存储结构。

图解 Elasticsearch 原理_第16张图片

img

为了提高效率，ElasticSearch可以将索引下某一个Document Value全部读取到内存中进行操作，这大大提升访问速度，但是也同时会消耗掉大量的内存空间。

总之，这些数据结构Inverted Index、Stored Fields、Document Values及其缓存，都在segment内部。

搜索发生时

搜索时，Lucene会搜索所有的segment然后将每个segment的搜索结果返回，最后合并呈现给客户。

Lucene的一些特性使得这个过程非常重要：

Segments是不可变的（immutable）
Delete? 当删除发生时，Lucene做的只是将其标志位置为删除，但是文件还是会在它原来的地方，不会发生改变
Update? 所以对于更新来说，本质上它做的工作是：先删除，然后重新索引（Re-index）
随处可见的压缩
Lucene非常擅长压缩数据，基本上所有教科书上的压缩方式，都能在Lucene中找到。
缓存所有的所有
Lucene也会将所有的信息做缓存，这大大提高了它的查询效率。

缓存的故事

当ElasticSearch索引一个文件的时候，会为文件建立相应的缓存，并且会定期（每秒）刷新这些数据，然后这些文件就可以被搜索到。

图解 Elasticsearch 原理_第17张图片

img

随着时间的增加，我们会有很多segments，

图解 Elasticsearch 原理_第18张图片

img

所以ElasticSearch会将这些segment合并，在这个过程中，segment会最终被删除掉

图解 Elasticsearch 原理_第19张图片

img

这就是为什么增加文件可能会使索引所占空间变小，它会引起merge，从而可能会有更多的压缩。

举个栗子

有两个segment将会merge

图解 Elasticsearch 原理_第20张图片

img

这两个segment最终会被删除，然后合并成一个新的segment

图解 Elasticsearch 原理_第21张图片

img

这时这个新的segment在缓存中处于cold状态，但是大多数segment仍然保持不变，处于warm状态。

以上场景经常在Lucene Index内部发生的。

图解 Elasticsearch 原理_第22张图片

img

在Shard中搜索

ElasticSearch从Shard中搜索的过程与Lucene Segment中搜索的过程类似。

图解 Elasticsearch 原理_第23张图片

img

与在Lucene Segment中搜索不同的是，Shard可能是分布在不同Node上的，所以在搜索与返回结果时，所有的信息都会通过网络传输。

需要注意的是：

1次搜索查找2个shard ＝ 2次分别搜索shard

图解 Elasticsearch 原理_第24张图片

img

对于日志文件的处理

当我们想搜索特定日期产生的日志时，通过根据时间戳对日志文件进行分块与索引，会极大提高搜索效率。

当我们想要删除旧的数据时也非常方便，只需删除老的索引即可。

图解 Elasticsearch 原理_第25张图片

img

在上种情况下，每个index有两个shards

如何Scale

图解 Elasticsearch 原理_第26张图片

img

shard不会进行更进一步的拆分，但是shard可能会被转移到不同节点上

图解 Elasticsearch 原理_第27张图片

img

所以，如果当集群节点压力增长到一定的程度，我们可能会考虑增加新的节点，这就会要求我们对所有数据进行重新索引，这是我们不太希望看到的，所以我们需要在规划的时候就考虑清楚，如何去平衡足够多的节点与不足节点之间的关系。

节点分配与Shard优化

为更重要的数据索引节点，分配性能更好的机器
确保每个shard都有副本信息replica

图解 Elasticsearch 原理_第28张图片

img

路由Routing

每个节点，每个都存留一份路由表，所以当请求到任何一个节点时，ElasticSearch都有能力将请求转发到期望节点的shard进一步处理。

图解 Elasticsearch 原理_第29张图片

img

一个真实的请求

图解 Elasticsearch 原理_第30张图片

img

Query

图解 Elasticsearch 原理_第31张图片

img

Query有一个类型filtered，以及一个multi_match的查询

Aggregation

图解 Elasticsearch 原理_第32张图片

img

根据作者进行聚合，得到top10的hits的top10作者的信息

请求分发

这个请求可能被分发到集群里的任意一个节点

图解 Elasticsearch 原理_第33张图片

img

上帝节点

图解 Elasticsearch 原理_第34张图片

img

这时这个节点就成为当前请求的协调者（Coordinator），它决定：

根据索引信息，判断请求会被路由到哪个核心节点
以及哪个副本是可用的
等等

路由

图解 Elasticsearch 原理_第35张图片

img

在真实搜索之前

ElasticSearch 会将Query转换成Lucene Query

图解 Elasticsearch 原理_第36张图片

img

然后在所有的segment中执行计算

图解 Elasticsearch 原理_第37张图片

img

对于Filter条件本身也会有缓存

图解 Elasticsearch 原理_第38张图片

img

但queries不会被缓存，所以如果相同的Query重复执行，应用程序自己需要做缓存

图解 Elasticsearch 原理_第39张图片

img

所以，

filters可以在任何时候使用
query只有在需要score的时候才使用

返回

搜索结束之后，结果会沿着下行的路径向上逐层返回。

图解 Elasticsearch 原理_第40张图片

img

图解 Elasticsearch 原理_第41张图片

img

图解 Elasticsearch 原理_第42张图片

img

图解 Elasticsearch 原理_第43张图片

img

图解 Elasticsearch 原理_第44张图片

img

参考

参考来源:

SlideShare: Elasticsearch From the Bottom Up

Youtube: Elasticsearch from the bottom up

Wiki: Document-term matrix

Wiki: Search engine indexing

Skip list

Standford Edu: Faster postings list interp via skip pointers

StackOverflow: how an search index works when querying many words?

StackOverflow: how does lucene calculate interp of documents so fast?

Lucene and its magical indexes

misspellings 2.0c: A tool to detect misspellings

欢迎加入我的知识星球，一起探讨架构，交流源码。加入方式，长按下方二维码噢：

已在知识星球更新源码解析如下：

《精尽 Dubbo 源码解析系列》69 篇。
《精尽 Netty 源码解析系列》61 篇。
《精尽 Spring 源码解析系列》35 篇。
《精尽 MyBatis 源码解析系列》34 篇。
《数据库实体设计》17 篇。
《精尽 Spring MVC 源码解析系列》15 篇。

目前在知识星球更新了《Dubbo 源码解析》目录如下：

01. 调试环境搭建
02. 项目结构一览
03. 配置 Configuration
04. 核心流程一览

05. 拓展机制 SPI

06. 线程池

07. 服务暴露 Export

08. 服务引用 Refer

09. 注册中心 Registry

10. 动态编译 Compile

11. 动态代理 Proxy

12. 服务调用 Invoke

13. 调用特性

14. 过滤器 Filter

15. NIO 服务器

16. P2P 服务器

17. HTTP 服务器

18. 序列化 Serialization

19. 集群容错 Cluster

20. 优雅停机

21. 日志适配

22. 状态检查

23. 监控中心 Monitor

24. 管理中心 Admin

25. 运维命令 QOS

26. 链路追踪 Tracing

... 一共 69+ 篇

目前在知识星球更新了《Netty 源码解析》目录如下：

01. 调试环境搭建
02. NIO 基础
03. Netty 简介
04. 启动 Bootstrap

05. 事件轮询 EventLoop

06. 通道管道 ChannelPipeline

07. 通道 Channel

08. 字节缓冲区 ByteBuf

09. 通道处理器 ChannelHandler

10. 编解码 Codec

11. 工具类 Util

... 一共 61+ 篇

目前在知识星球更新了《数据库实体设计》目录如下：

01. 商品模块
02. 交易模块
03. 营销模块
04. 公用模块

... 一共 17+ 篇

目前在知识星球更新了《Spring 源码解析》目录如下：

01. 调试环境搭建
02. IoC Resource 定位
03. IoC BeanDefinition 载入

04. IoC BeanDefinition 注册

05. IoC Bean 获取

06. IoC Bean 生命周期

... 一共 35+ 篇

目前在知识星球更新了《MyBatis 源码解析》目录如下：

01. 调试环境搭建
02. 项目结构一览
03. MyBatis 面试题合集

04. MyBatis 学习资料合集

05. MyBatis 初始化

06. SQL 初始化

07. SQL 执行

08. 插件体系

09. Spring 集成

... 一共 34+ 篇

源码不易↓↓↓↓↓

点赞支持老艿艿↓↓

你可能感兴趣的:(图解 Elasticsearch 原理)

【Docker基础】Docker容器管理：docker stats及其参数详解 IT成长日记容器技术深度解析与实践 docker 容器运维 docker stats
目录1Docker监控概述2dockerstats基本用法2.1基本命令格式2.2常用操作示例3dockerstats参数详解3.1常用参数说明3.2输出字段解析3.3格式化输出示例4dockerstats工作原理4.1监控数据采集流程4.2数据源解析5常见问题解答5.1为什么CPU使用率会超过100%？5.2内存统计中的cache/buffer包含在哪里？5.3如何监控已停止的容器？6总结1Do
RNN循环神经网络原理解读 zhishidi ai笔记 rnn 人工智能深度学习
我们把循环神经网络想象成一个有记忆的助手，特别擅长处理按顺序出现的信息，比如句子、语音、股票价格、音乐旋律等。核心思想：记住过去的信息，帮助理解现在。普通神经网络的局限（没有记忆）想象一个普通的神经网络（比如用于识别图片的）：输入：你给它一张图片。处理：它分析这张图片的像素。输出：告诉你图片里是“猫”还是“狗”。问题：它每次只看一个独立的输入（一张图片），输入之间没有联系。给它看一个视频（连续很多
Istio 深度解析与实战：从原理到应用的全面指南阿贾克斯的黎明 java istio 网络云原生
目录Istio深度解析与实战：从原理到应用的全面指南一、Istio原理深度剖析1.数据平面2.控制平面二、Istio的安装与部署1.环境准备2.安装Istio3.注入Sidecar三、Istio实战应用场景1.流量管理（1）简单路由（2）流量镜像2.安全防护（1）服务间双向认证（2）基于角色的访问控制（RBAC）3.监控与可观测性（1）启用Prometheus和Grafana（2）查看监控指标四、
深度学习中Embedding原理讲解 zhishidi ai笔记深度学习 embedding 人工智能
我们用最直白的方式来理解深度学习中Embedding（嵌入）的概念。核心思想一句话：Embedding就是把一些复杂、离散的东西（比如文字、类别、ID）转换成计算机更容易理解和计算的“数字密码”，这些“数字密码”能代表这个东西的本质特征或含义。为什么需要Embedding？想象一下，你要教计算机认识“苹果”和“橙子”：原始表示（不好用）：你告诉计算机：“苹果”的编号是1，“橙子”的编号是2。问题来
掌握软件工程领域持续集成的部署流程
掌握软件工程领域持续集成的部署流程关键词：持续集成、自动化构建、版本控制、单元测试、持续交付、DevOps、流水线摘要：本文通过面包工厂的生动比喻，揭示持续集成的核心原理。我们将构建一条"代码加工流水线"，用真实的Jenkins配置案例展示从代码提交到自动化部署的全过程，并探讨现代软件开发中持续集成带来的革命性变化。背景介绍目的和范围本文面向初入软件行业的开发者，系统讲解持续集成（Continuo
Serverless架构下的持续交付实践软件工程实践软件工程最佳实践 AI软件构建大数据系统架构 serverless 架构运维 ai
Serverless架构下的持续交付实践关键词：Serverless架构、持续交付、DevOps、无服务器计算、自动化部署摘要：本文深入探讨了Serverless架构下的持续交付实践。首先介绍了Serverless架构和持续交付的背景知识，接着解释了相关核心概念及其关系，详细阐述了核心算法原理与操作步骤，通过数学模型加深理解，结合实际项目案例展示了代码实现与解读，探讨了实际应用场景，推荐了相关工具
Java中的finalize()方法周杰伦fans JAVA ai学习参考考试学习 java python jvm
Java中的finalize()方法详解Java的finalize()方法是Object类定义的一个特殊方法，主要用于在对象被垃圾回收器回收之前执行一些清理工作。下面我将从基本概念、工作原理、使用场景、注意事项以及示例代码等方面详细解释这个方法。基本概念finalize()方法是Java中Object类的一个protected方法，每个Java类都隐式继承了这个方法。它的基本语法如下：protec
SR触发器为什么能够消抖马职音人嵌入式硬件
SR触发器（Set-Reset触发器）能够用于**消抖（Debounce）**，主要是因为它的双稳态特性和对输入信号的锁定能力。机械开关（如按键、拨动开关）在闭合或断开时，由于金属触点的弹性，会在短时间内产生多次快速通断（即“抖动”），导致信号出现多个脉冲。SR触发器可以通过其逻辑特性消除这些抖动，确保输出稳定的电平信号。---##**SR触发器消抖的原理**###**1.SR触发器的基本特性**
《FastAPI & AI编程结合：从入门到精通》指南 AI编程员 001AI传统＆编程语言 002AI编程工具汇总 003AI编程作品汇总笔记学习 fastapi 开发语言深度学习
以下是一篇系统性的《FastAPI&AI编程结合：从入门到精通》指南，共分30大章节，超过10万字，涵盖FastAPI核心开发、AI集成原理、高性能优化、经典案例和5大完整项目实战。第一章：FastAPI革命性优势1.1现代API框架对比#性能基准测试(Requests/sec)|框架|JSON响应|数据验证|异步支持||---
什么是Seata 肘击鸣的百k路 spring cloud
Seata的实现原理主要围绕其核心架构（TC/TM/RM）和事务模式（如AT、TCC等）展开，通过协调全局事务与分支事务的协作保证数据一致性。以下是核心实现原理的详细解析：⚙️一、核心架构协作机制Seata通过TC（事务协调器）、TM（事务管理器）、RM（资源管理器）三组件协同工作：全局事务启动（TM主导）TM通过@GlobalTransactional注解标记事务起点，向TC申请开启全局事务，生
Spring Cache+Redis缓存方案详解：从代码到实践大手你不懂 Java Java项目实战 Redis spring 缓存 redis
描述：在现代Java开发中，缓存是提升系统性能的核心手段之一。本文通过实际代码案例，深入解析SpringCache与Redis的集成原理，结合项目中的ModuleDatabaseInfoService接口和RedisConfig配置，探讨如何通过声明式缓存实现高效的数据库访问优化。一、核心代码解析1.服务接口设计（拿查询数据源配置信息举例）publicinterfaceModuleDatabase
C++ —— 内存管理啥也不懂！！！ C++c++开发语言
文章目录1.回顾C语言内存管理2.C++的动态内存管理方式2.1new/delete操作内置类型2.2new和delete操作自定义类型3.operatornew和operatordelete函数3.1operatornew与operatordelete函数4.new和delete的实现原理4.1内置类型4.2自定义类型5.new和delete操作不匹配（了解）6.定位new表达式（了解）7.常见
Cesium快速入门到精通系列教程十：实现任意多个蜂巢似六边形组合 duansamve cesium cesium
要实现完美的正六边形蜂巢排列，关键在于精确计算每个六边形的顶点位置和排列方式。以下是Cesium1.106中优化后的完整实现方案：正六边形几何原理正六边形的特性：所有边长相等（设为radius）中心到每个顶点的距离相等（外接圆半径）相邻六边形中心间距为√3*radius行间距为1.5*radiusCesium.Ion.defaultAccessToken='你的defaultAccessToken
深入了解数据库领域行式存储的架构设计数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent SQL实战数据库 ai
深入了解数据库领域行式存储的架构设计关键词：行式存储、数据库架构、OLTP、存储引擎、行记录格式摘要：本文将以“行式存储”为核心，从生活场景切入，逐步拆解数据库行式存储的底层架构设计。我们将通过“图书馆藏书”的趣味比喻、具体代码示例和真实数据库（如MySQLInnoDB）的实践案例，深入理解行式存储的核心原理、适用场景及未来趋势，帮助读者建立对数据库存储架构的系统认知。背景介绍目的和范围数据库是现
非关系型数据库在数据库领域的崛起与应用数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent SQL实战数据库 nosql 网络 ai
非关系型数据库在数据库领域的崛起与应用关键词：非关系型数据库、关系型数据库、崛起原因、应用场景、数据库领域摘要：本文主要探讨了非关系型数据库在数据库领域的崛起与应用。首先介绍了非关系型数据库的背景，包括目的、预期读者等内容。接着详细解释了非关系型数据库、关系型数据库等核心概念，并阐述了它们之间的关系。然后深入讲解了非关系型数据库的核心算法原理、数学模型和公式。通过项目实战展示了非关系型数据库的实际
搜索领域知识图谱的知识推理算法研究搜索引擎技术知识图谱算法人工智能 ai
搜索领域知识图谱的知识推理算法研究关键词：知识图谱、知识推理、搜索算法、图神经网络、路径推理、规则推理、表示学习摘要：本文深入探讨搜索领域中知识图谱的知识推理算法。我们将从知识图谱的基本概念出发，分析不同类型的知识推理算法原理，包括基于规则的推理、基于表示的推理和基于路径的推理。通过实际案例和代码实现，展示这些算法如何提升搜索效果，最后讨论该领域的未来发展趋势和挑战。背景介绍目的和范围本文旨在系统
数据结构与算法中单调栈的常见误区数据结构与算法学习服务器运维 ai
数据结构与算法中单调栈的常见误区关键词：单调栈、数据结构、算法、误区、栈、时间复杂度、应用场景摘要：单调栈是一种特殊的数据结构，它在解决某些特定问题时非常高效。然而，许多初学者在使用单调栈时容易陷入一些常见的误区。本文将详细介绍单调栈的概念、原理和应用，重点分析使用单调栈时的常见误区，并通过实际代码示例展示如何正确使用单调栈解决问题。背景介绍目的和范围本文旨在帮助读者深入理解单调栈的概念和工作原理
AI优化算法实战：使用粒子群优化求解复杂工程问题 AI学长带你学AI ai
AI优化算法实战：使用粒子群优化求解复杂工程问题关键词：粒子群优化（PSO）、全局优化、工程问题、智能算法、参数调优摘要：本文以“鸟群觅食”为灵感来源，深入浅出地讲解粒子群优化（ParticleSwarmOptimization,PSO）算法的核心原理，并通过机械结构轻量化设计的实战案例，展示其在复杂工程问题中的应用。文章从算法起源到数学模型，从代码实现到工程落地，层层拆解技术细节，帮助读者快速掌
前端微前端架构的探索与实践大厂前端小白菜前端架构 ai
前端微前端架构的探索与实践关键词：微前端、前端架构、模块化、独立部署、团队协作、技术栈隔离、渐进式迁移摘要：本文将深入探讨微前端架构的概念、原理和实践。我们将从微前端的起源讲起，分析其核心设计思想，并通过实际案例展示如何实现一个完整的微前端解决方案。文章将涵盖微前端的多种实现方式、技术选型考量、以及在实际项目中的应用场景和挑战，帮助读者全面理解这一现代前端架构模式。背景介绍目的和范围本文旨在为前端
AI绘画背后的技术：Stable Diffusion原理详解与实战 AI学长带你学AI ai
AI绘画背后的技术：StableDiffusion原理详解与实战关键词：StableDiffusion、扩散模型、AI绘画、潜在空间、文本生成图像摘要：本文将带你揭开AI绘画“魔法”背后的核心技术——StableDiffusion的神秘面纱。我们会用“给小学生讲故事”的方式，从生活中的例子出发，逐步解释扩散模型的底层逻辑、StableDiffusion的关键创新，并用Python代码实战演示如何生
因果推理与因果学习原理与代码实战案例讲解 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
因果推理与因果学习原理与代码实战案例讲解作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：因果关系发现、因果推断、因果学习、机器学习、统计方法1.背景介绍1.1问题的由来在现实世界的数据分析中，我们经常面临这样的挑战：从观察数据中识别出潜在的原因与效果之间的关联，并理解这些关联背后的实际机制。传统的预测建模关注于基于输入变量对输出变量进行预测，
深度剖析AI人工智能在自动驾驶中的系统优化 AI云原生与云计算技术学院人工智能自动驾驶机器学习 ai
深度剖析AI人工智能在自动驾驶中的系统优化关键词：AI人工智能、自动驾驶、系统优化、传感器融合、决策算法摘要：本文深入探讨了AI人工智能在自动驾驶系统中的优化问题。从自动驾驶的背景入手，详细解释了相关核心概念，如传感器、决策算法等。阐述了这些核心概念之间的关系，介绍了核心算法原理和具体操作步骤，还通过数学模型和公式进行了理论支持。给出了项目实战案例，分析了实际应用场景，推荐了相关工具和资源，最后探
JavaScript 事件循环竟还能这样玩! 前端javascript
JavaScript是一种单线程的编程语言，这意味着它一次只能执行一个任务。为了能够处理异步操作，JavaScript使用了一种称为事件循环（EventLoop）的机制。本文将深入探讨事件循环的工作原理，并展示如何基于这一原理实现一个更为准确的setTimeout、setInterval什么是事件循环？事件循环是JavaScript运行时环境中处理异步操作的核心机制。它允许JavaScript在执
量化价值投资入门：Fama-French三因子模型详解与实战应用量化价值投资入门到精通 ai
量化价值投资入门：Fama-French三因子模型详解与实战应用关键词：量化投资、Fama-French三因子模型、价值投资、因子投资、资产定价、Python实现、投资组合管理摘要：本文深入解析Fama-French三因子模型的理论基础、数学原理和实际应用。作为现代金融学最重要的资产定价模型之一，三因子模型通过市场因子、规模因子和价值因子解释股票收益差异。我们将从模型起源开始，详细讲解其数学表达和
路由表原理以及数据包进入路由器，路由器的处理
路由表原理以及数据包进入路由器，路由器的处理路由表是路由器转发数据包的数据库，当路由表收到一个数据包时，它会用数据报的目的IP地址去匹配路由表中的路由条目，然后根据匹配条目的路由参数决定如何转发这个数据包。但是，路由表中的路由条目并不会由路由器根据入站数据包的信息自动填充。路由信息的3种来源：链路层协议发现的路由（也称为直连路由）：只要连接该网络的接口状态正常，那么管理员就不需要进行任何配置，直连
CI/CD的常规设置及核心原理啃火龙果的兔子开发DEMO ci/cd
以下是关于CI/CD常规设置及核心原理的全面解析，采用结构化方式呈现：一、CI/CD核心概念1.持续集成（CI）目标：频繁（每天多次）将代码变更合并到共享主干核心活动：自动化构建单元测试/静态分析快速反馈机制2.持续交付/部署（CD）持续交付：随时可手动部署到生产环境持续部署：自动部署到生产环境（需完备的自动化测试）3.核心价值代码质量快速反馈发布效率分钟级部署团队协作减少集成冲突二、常规CI/C
【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。努力毕业的小土博^_^ 深度学习学习笔记深度学习学习笔记人工智能机器学习
【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。文章目录【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。前言一、什么是正则化？为什么需要它？✅
OpenCV实战：图像颜色识别与提取、掩膜制作
前言在计算机视觉和图像处理领域，颜色识别是一项基础而重要的技术。无论是交通标志识别、工业分拣还是美颜滤镜开发，都离不开对特定颜色的处理。本文将带你全面掌握使用OpenCV进行颜色识别的关键技术，包含完整的代码实现和原理讲解。一、颜色空间基础1.1RGB颜色空间在图像处理中，最常见的就是RGB颜色空间。RGB颜色空间是我们接触最多的颜色空间，是一种用于表示和显示彩色图像的一种颜色模型。RGB代表红色
C51单片机控制OLED显示屏反白显示SPI通信例程草莓味儿柠檬
本文还有配套的精品资源，点击获取简介：本文档详细介绍0.96英寸OLED显示屏、C51系列单片机、SPI接口及反白显示技术的原理与应用，并提供一套完整的例程源码，指导开发者如何使用C51单片机通过SPI接口控制OLED显示屏实现反白显示效果。文档内容包括硬件连接、初始化SPI、配置OLED显示参数、绘制像素和实现反白显示等关键步骤，旨在帮助初学者学习嵌入式系统开发，并理解相关硬件和软件工作流程。1
SBC编解码器库：蓝牙音频传输的核心草莓味儿柠檬
本文还有配套的精品资源，点击获取简介：SBC编解码器库是一个软件工具集，提供在蓝牙技术中核心使用的音频编解码功能。该库以C语言实现，包含编码、解码以及相关设置控制功能，使得开发者可以在应用中集成SBC编解码能力，如蓝牙音频播放器或耳机。SBC编解码工作原理基于子带编码理论，通过量化和编码音频信号的各个子带，实现高效的数据传输。SBC支持多种比特率、采样率和声道配置，并包含错误检测与恢复机制，控制接
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他