静幽水1

ElasticSearch入门之基本概念和RESTful api

1、简介
2、基本概念

2.1索引
2.2文档
2.3文档类型（ES7中已移除）
2.4字段
2.5映射
2.6接近实时 NRT
2.7 集群 cluster
2.8 节点 node
2.9 分片和复制 shards&replicas

3、RESTful api

3.1准备工作
3.2创建索引
3.3插入数据
3.4更新数据
3.5删除数据
3.6搜索数据
3.7DSL搜索
3.8高亮显示
3.9聚合

1、简介

ElasticSearch是一个基于Lucene的搜索服务器，它提供了一个分布式多用户能力的全文搜索引擎，它是基于RESTful web接口的，采用java开发，并作为Apache许可条款下的开源发布，是当前流行的企业级搜索引擎。

2、基本概念

Elasticsearch是面向文档(document oriented)的,这意味着它可以存储整个对象或文档(document)。然而它不仅仅是存储,还会索引(index)每个文档的内容使之可以被搜索。在Elasticsearch中,你可以对文档(而非成行成列的数据)进行索引、搜索、排序、过滤。Elasticsearch比传统关系型数据库如下:

Relational DB ‐> Databases ‐> Tables ‐> Rows ‐> Columns
Elasticsearch ‐> Indices‐> Types‐> Documents ‐> Fields

2.1索引

索引(index)是ElasticSearch对逻辑数据的逻辑存储，一个索引就是一个拥有几分相似特征的文档的集合，所以它可以分为更小的部分。
可以把索引当做关系数据库中的表，索引的结构是为快速有效的全文索引准备的，它不存储原始值。
一个索引由一个名字来标识(必须全部是小写字母的),并且当我们要对对应于这个索引中的文档进行索引、搜索、更新和删除的时候,都要使用到这个名字。
ES可以把索引存放在一台机器或多台机器上，在一个集群中,可以定义任意多的索引，每个索引有一个或多个分片（shard），每个分片可以有多个副本（replica）。

2.2文档

文档(document)是存储在ES中的主要实体，一个文档是一个可被索引的基础信息单元，相当于数据库表中的一行记录。
ES和MongoDB中的文档类似，都可以有不同的结构，但ES的文档中，相同字段必须有相同的类型。
在一个index/type里面,你可以存储任意多的文档。注意,尽管一个文档,物理上存在于一个索引之中,文档必须被索引/赋予一个索引的type。
文档由多个字段组成，每个字段可以多次出现在一个文档里，这样的字段叫做多值字段。

2.3文档类型（ES7中已移除）

类型(type)相当于数据库中的表。（虽然可以这样假设，但是并不完全正确，在关系型数据库里,"表"是相互独立的,一个“表”里的列和另外一个“表”的同名列没有关系，互不影响。但在类型里字段不是这样的。在一个Elasticsearch索引里，所有不同类型的同名字段内部使用的是同一个lucene字段存储。在同一个索引中，存储仅有小部分字段相同或者全部字段都不相同的文档，会导致数据稀疏，影响Lucene有效压缩数据的能力。）
在一个索引中,可以定义一种或多种类型。一个类型是你的索引的一个逻辑上的分类/分区,其语义完全由你来定。通常,会为具有一组共同字段的文档定义一个类型。
不同的文档类型不能为相同的属性设置不同的类型。例如，在同一索引中的所有文档类型中，一个叫title的字段必须具有相同的类型。

2.4字段

字段(field)相当于是数据表的字段,对文档数据根据不同属性进行的分类标识。

2.5映射

映射(mapping)是处理数据的方式和规则方面做一些限制,如某个字段的数据类型、默认值、分析器、是否被索引等等。
处理es里面数据的一些使用规则设置也叫做映射,按着最优规则处理数据对性能提高很大,因此才需要建立映射,并且需要思考如何建立映射才能对性能更好。

2.6接近实时 NRT

Elasticsearch是一个接近实时的搜索平台。这意味着,从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟(通常是1秒以内)

2.7 集群 cluster

一个集群就是由一个或多个节点组织在一起,它们共同持有整个的数据,并一起提供索引和搜索功能。
一个集群由一个唯一的名字标识,这个名字默认就是“elasticsearch”。这个名字是重要的,因为一个节点只能通过指定某个集群的名字,来加入这个集群。

2.8 节点 node

一个节点是集群中的一个服务器,作为集群的一部分,它存储数据,参与集群的索引和搜索功能。
和集群类似,一个节点也是由一个名字来标识的,默认情况下,这个名字是一个随机的漫威漫画角色的名字,这个名字会在启动的时候赋予节点。这个名字对于管理工作来说挺重要的,因为在这个管理过程中,你会去确定网络中的哪些服务器对应于ES集群中的哪些节点。
个节点可以通过配置集群名称的方式来加入一个指定的集群。默认情况下,每个节点都会被安排加入到一个叫做“elasticsearch”的集群中,这意味着,如果你在你的网络中启动了若干个节点,并假定它们能够相互发现彼此,它们将会自动地形成并加入到一个叫做“elasticsearch”的集群中。
在一个集群里,只要你想,可以拥有任意多个节点。而且,如果当前你的网络中没有运行任何Elasticsearch节点,这时启动一个节点,会默认创建并加入一个叫做“elasticsearch”的集群。

2.9 分片和复制 shards&replicas

一个索引可以存储超出单个结点硬件限制的大量数据。比如,一个具有10亿文档的索引占据1TB的磁盘空间,而任一节点都没有这样大的磁盘空间;或者单个节点处理搜索请求,响应太慢。为了解决这个问题,Elasticsearch提供了将索引划分成多份的能力,这些份就叫做分片。当你创建一个索引的时候,你可以指定你想要的分片的数量。
每个分片本身也是一个功能完善并且独立的“索引”,这个“索引”可以被放置到集群中的任何节点上。分片很重要,主要有两方面的原因:
- 1)允许你水平分割/扩展你的内容容量。
- 2)允许你在分片(潜在地,位于多个节点上)之上进行分布式的、并行的操作,进而提高性能/吞吐量。
至于一个分片怎样分布,它的文档怎样聚合回搜索请求,是完全由Elasticsearch管理的,对于作为用户的你来说,这些都是透明的。
在一个网络/云的环境里,失败随时都可能发生,在某个分片/节点不知怎么的就处于离线状态,或者由于任何原因消失了,这种情况下,有一个故障转移机制是非常有用并且是强烈推荐的。为此目的,Elasticsearch允许你创建分片的一份或多份拷贝,这些拷贝叫做复制分片,或者直接叫复制。
复制之所以重要,有两个主要原因: 在分片/节点失败的情况下,提供了高可用性。因为这个原因,注意到复制分片从不与原/主要(original/primary)分片置于同一节点上是非常重要的。扩展你的搜索量/吞吐量,因为搜索可以在所有的复制上并行运行。总之,每个索引可以被分成多个分片。一个索引也可以被复制0次(意思是没有复制)或多次。一旦复制了,每个索引就有了主分片(作为复制源的原来的分片)和复制分片(主分片的拷贝)之别。
分片和复制的数量可以在索引创建的时候指定。在索引创建之后,你可以在任何时候动态地改变复制的数量,但是你事后不能改变分片的数量。
默认情况下,Elasticsearch中的每个索引被分片5个主分片和1个复制,这意味着,如果你的集群中至少有两个节点,你的索引将会有5个主分片和另外5个复制分片(1个完全拷贝),这样的话每个索引总共就有10个分片。

3、RESTful api

在ElasticSearch中，提供了功能丰富的restful api操作，包括CURD操作和创建索引，删除索引等。

3.1准备工作

首先需要打开ElasticSearch服务，访问127.0.0.1:9200出现下面界面表示打开成功：

然后安装elasticsearch-head插件，安装成功后如下：

最后安装postman应用或者安装Advanced REST Client谷歌浏览器插件，都是用来发送http请求的。linux安装postmanl链接

3.2创建索引

创建一个简单的空索引，索引的名字为blog，如下：

采用put的方式，url为服务地址加上索引的名称，请求参数如下：

{
	"settings":{
		"index":{
			"number_of_shards":"2",
			"number_of_replicas":"0"
		}
	}
}

number_of_shards为片数，number_of_replicas为副本数。点击发送之后，状态码为200表示创建成功，刷新可以看到多了一个blog索引：

3.3插入数据

向索引blog1中插入一条user类型的数据时，_id设置为1001,请求地址为http://127.0.0.1:9200/blog1/user/1001，采用post方式。也可以不设置_id，就会使用自动生成的_id，这是一条数据的唯一标识符。

{
	"id":1001,
	"name":"张三",
	"age":20,
	"sex":"男"
}

会出现错误如下，说名这个索引是只读状态。

{
    "error": {
        "root_cause": [
            {
                "type": "cluster_block_exception",
                "reason": "index [blog1] blocked by: [FORBIDDEN/12/index read-only / allow delete (api)];"
            }
        ],
        "type": "cluster_block_exception",
        "reason": "index [blog1] blocked by: [FORBIDDEN/12/index read-only / allow delete (api)];"
    },
    "status": 403
}

解决方法，终端运行下面命令：

curl -XPUT -H "Content-Type: application/json" http://127.0.0.1:9200/blog1/_settings -d '{"index.blocks.read_only_allow_delete": null}'

或者在postman中执行PUT http://127.0.0.1:9200/blog1/_settings

{
"index.blocks.read_only_allow_delete": null
}

其中，blog1换成你的索引名称，也可以换成_all表示所有索引。
再次发送请求，响应结果如下，表示插入数据成功：

{
    "_index": "blog1",
    "_type": "user",
    "_id": "1001",
    "_version": 3,
    "result": "updated",
    "_shards": {
        "total": 1,
        "successful": 1,
        "failed": 0
    },
    "_seq_no": 2,
    "_primary_term": 2
}

注：这是非结构化的索引，不需要事先创建，直接插入数据默认创建索引。

3.4更新数据

在elasticsearch中，文档数据是不可以修改的，但是可以通过覆盖的方式进行更新。

PUT http://127.0.0.1:9200/blog1/user/1001
{
	"id":1001,
	"name":"张三",
	"age":23,
	"sex":"女"
}

查看数据，如图以及修改了：

数据虽然被更新了，但是确实全部数据的覆盖，那么能不能局部更新呢，其实是可以的，在内部，依然会查询到这个文档数据，然后进行覆盖，步骤如下：
1.从旧文档中检索json
2.进行修改
3.删除旧文档
4.索引新文档
如下，把年龄更改为26，请求地址为http://127.0.0.1:9200/blog1/user/1001/_update

POST http://127.0.0.1:9200/blog1/user/1001/_update
{
	"doc":{
		"age":26
	}
}

查看结果：

3.5删除数据

删除数据只需要在postman中执行DELETE http://127.0.0.1:9200/blog1/user/1001即可，相应的数据如下，表示删除成功。

{
    "_index": "blog1",
    "_type": "user",
    "_id": "1001",
    "_version": 7,
    "result": "deleted",
    "_shards": {
        "total": 1,
        "successful": 1,
        "failed": 0
    },
    "_seq_no": 6,
    "_primary_term": 2
}

注：删除一个文档不会立即从磁盘上移除，只是被标记为已删除状态，Elasticsearch会在你之后添加更多索引的时候在后台进行删除内容的清理。

3.6搜索数据

1.搜索一条数据：只需要执行GET http://127.0.0.1:9200/blog1/user/1001即可，其中1001是_id
返回结果如下：

{
	"_index": "blog1",
	"_type": "user",
	"_id": "1001",
	"_version": 1,
	"_seq_no": 7,
	"_primary_term": 2,
	"found": true,
	"_source": {
		"id": 1001,
		"name": "张三",
		"age": 23,
		"sex": "女"
	}
}

2.搜索全部数据：GET http://127.0.0.1:9200/blog1/user/_search，默认返回10条数据。
3.关键字搜索：例如根据年龄搜索，GET http://127.0.0.1:9200/blog1/user/_search?q=age:23
返回的数据：

{
	"took": 2,
	"timed_out": false,
	"_shards": {
		"total": 2,
		"successful": 2,
		"skipped": 0,
		"failed": 0
	},
	"hits": {
		"total": {
			"value": 1,
			"relation": "eq"
		},
		"max_score": 1.0,
		"hits": [
			{
				"_index": "blog1",
				"_type": "user",
				"_id": "1001",
				"_score": 1.0,
				"_source": {
					"id": 1001,
					"name": "张三",
					"age": 23,
					"sex": "女"
				}
			}
		]
	}
}

3.7DSL搜索

Elasticsearch提供了丰富且灵活的查询语叫做DSL查询，它允许构建更加复杂，强大的查询。post http://127.0.0.1:9200/blog1/user/_search

{
	"query":{
		"match":{
			"age":23
		}
	}
}

响应数据：

{
	"took": 2,
	"timed_out": false,
	"_shards": {
		"total": 2,
		"successful": 2,
		"skipped": 0,
		"failed": 0
	},
	"hits": {
		"total": {
			"value": 1,
			"relation": "eq"
		},
		"max_score": 1.0,
		"hits": [
			{
				"_index": "blog1",
				"_type": "user",
				"_id": "1001",
				"_score": 1.0,
				"_source": {
					"id": 1001,
					"name": "张三",
					"age": 23,
					"sex": "女"
				}
			}
		]
	}
}

查询年龄大于20岁，姓名为男的数据，请求体如下：

{
	"query":{
		"bool":{
			"filter":{
				"range":{
					"age":{
						"gt":20
					}
				}
			},
			"must":{
				"match":{
					"sex":"男"
				}
			}
		}
	
	}
}

返回结果：

{
	"took": 24,
	"timed_out": false,
	"_shards": {
		"total": 2,
		"successful": 2,
		"skipped": 0,
		"failed": 0
	},
	"hits": {
		"total": {
			"value": 2,
			"relation": "eq"
		},
		"max_score": 0.2876821,
		"hits": [
			{
				"_index": "blog1",
				"_type": "user",
				"_id": "1001",
				"_score": 0.2876821,
				"_source": {
					"id": 1002,
					"name": "李四",
					"age": 25,
					"sex": "男"
				}
			},
			{
				"_index": "blog1",
				"_type": "user",
				"_id": "jmsZD20Bk9NfkJ2KxpRa",
				"_score": 0.18232156,
				"_source": {
					"id": 1004,
					"name": "张三",
					"age": 21,
					"sex": "男"
				}
			}
		]
	}
}

全文搜索，请求体如下：

{
	"query":{
		"match":{
			"name":"张三 李四"
		}
	}
}

搜索结果为：

{
	"took": 13,
	"timed_out": false,
	"_shards": {
		"total": 2,
		"successful": 2,
		"skipped": 0,
		"failed": 0
	},
	"hits": {
		"total": {
			"value": 2,
			"relation": "eq"
		},
		"max_score": 1.3862944,
		"hits": [
			{
				"_index": "blog1",
				"_type": "user",
				"_id": "jmsZD20Bk9NfkJ2KxpRa",
				"_score": 1.3862944,
				"_source": {
					"id": 1004,
					"name": "张三",
					"age": 21,
					"sex": "男"
				}
			},
			{
				"_index": "blog1",
				"_type": "user",
				"_id": "1001",
				"_score": 0.5753642,
				"_source": {
					"id": 1002,
					"name": "李四",
					"age": 25,
					"sex": "男"
				}
			}
		]
	}
}

3.8高亮显示

请求体

{
	"query":{
		"match":{
			"name":"张三 李四"
		}
	},
	"highlight":{
		"fields":{
			"name":{}
			
		}
	}
}

返回结果：

{
	"took": 72,
	"timed_out": false,
	"_shards": {
		"total": 2,
		"successful": 2,
		"skipped": 0,
		"failed": 0
	},
	"hits": {
		"total": {
			"value": 2,
			"relation": "eq"
		},
		"max_score": 1.3862944,
		"hits": [
			{
				"_index": "blog1",
				"_type": "user",
				"_id": "jmsZD20Bk9NfkJ2KxpRa",
				"_score": 1.3862944,
				"_source": {
					"id": 1004,
					"name": "张三",
					"age": 21,
					"sex": "男"
				},
				"highlight": {
					"name": [
						"张三"
					]
				}
			},
			{
				"_index": "blog1",
				"_type": "user",
				"_id": "1001",
				"_score": 0.5753642,
				"_source": {
					"id": 1002,
					"name": "李四",
					"age": 25,
					"sex": "男"
				},
				"highlight": {
					"name": [
						"李四"
					]
				}
			}
		]
	}
}

这里涉及到中文分词的问题，将在以后谈到

3.9聚合

请求体：

{
	"aggs":{
		"all_interests":{
			"terms":{
				"field":"age"
			}
		}
	}
}

响应结果：

{
	"took": 50,
	"timed_out": false,
	"_shards": {
		"total": 2,
		"successful": 2,
		"skipped": 0,
		"failed": 0
	},
	"hits": {
		"total": {
			"value": 4,
			"relation": "eq"
		},
		"max_score": 1.0,
		"hits": [
			{
				"_index": "blog1",
				"_type": "user",
				"_id": "jGsYD20Bk9NfkJ2K1JRX",
				"_score": 1.0,
				"_source": {
					"id": 1003,
					"name": "王五",
					"age": 18,
					"sex": "男"
				}
			},
			{
				"_index": "blog1",
				"_type": "user",
				"_id": "jmsZD20Bk9NfkJ2KxpRa",
				"_score": 1.0,
				"_source": {
					"id": 1004,
					"name": "张三",
					"age": 21,
					"sex": "男"
				}
			},
			{
				"_index": "blog1",
				"_type": "user",
				"_id": "kGsnD20Bk9NfkJ2KRZTb",
				"_score": 1.0,
				"_source": {
					"id": 1005,
					"name": "赵六",
					"age": 21,
					"sex": "男"
				}
			},
			{
				"_index": "blog1",
				"_type": "user",
				"_id": "1001",
				"_score": 1.0,
				"_source": {
					"id": 1002,
					"name": "李四",
					"age": 25,
					"sex": "男"
				}
			}
		]
	},
	"aggregations": {
		"all_interests": {
			"doc_count_error_upper_bound": 0,
			"sum_other_doc_count": 0,
			"buckets": [
				{
					"key": 21,
					"doc_count": 2
				},
				{
					"key": 18,
					"doc_count": 1
				},
				{
					"key": 25,
					"doc_count": 1
				}
			]
		}
	}
}

上半部分是查询的数据，下半部分是根据年龄进行的聚合统计。

Elasticsearch 启动失败？从日志分析到最终解决（磁盘空间不足案例） Leaton Lee elasticsearch 大数据搜索引擎
问题背景最近在本地运行一个SpringBoot项目时，突然遇到Elasticsearch(ES)连接超时的问题：org.springframework.beans.factory.UnsatisfiedDependencyException:Errorcreatingbeanwithname'awardController':Unsatisfieddependencyexpressedthroug
Elasticsearch：基本概念、索引结构与优缺点分析 Leaton Lee elasticsearch 大数据搜索引擎
一、Elasticsearch基本概念Elasticsearch是一个基于Lucene构建的开源、分布式、RESTful搜索引擎，专为云计算环境设计，能够实现近乎实时的数据搜索和分析功能。核心概念解析文档(Document)Elasticsearch中的基本数据单元，使用JSON格式表示每个文档有唯一ID和类型示例：一条产品信息、一篇博客文章或一个客户记录索引(Index)文档的集合，类似于关系数
Elasticsearch 查询统计 A 字段全部为空的 B 字段（qbit）
前言本文对Elasticsearch7.17适用问题是有两个字符串字段app_id和owner，怎么查询app_id全部为空字符串的owner有哪些？查询DSL语句{"size":0,"aggs":{"owners":{"terms":{"field":"owner",//取决于owner字段的基数"size":10000},"aggs":{"non_empty_app_id_docs":{"fi
【123揭秘】Elasticsearch内部数据结构大起底：行存、列存与倒排索引，你选对了吗？墨瑾轩 Java乐园 elasticsearch 数据结构 jenkins
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣第一部分：理解基本概念——构建知识的基础首先，我们需要了解一些基础概念，这对于理解Elasticsearch如何处理和存储数据至关重要。1.1行存储vs列存储行存储：适用于频繁写入和读取整行数据的场景。例如，在关系型数据库中，每一行代表一条记录，所有列的数据都
ElasticSearch中的分片是什么? java1234_小锋 java elasticsearch 大数据搜索引擎
大家好，我是锋哥。今天分享关于【ElasticSearch中的分片是什么?】面试题。希望对大家有帮助；ElasticSearch中的分片是什么?超硬核AI学习资料，现在永久免费了！在Elasticsearch中，分片（Shard）是将数据拆分成更小的部分，允许在分布式环境中并行处理和存储数据的机制。它是Elasticsearch在水平扩展时用于管理大量数据的关键概念。主要概念：主分片（Primar
spring-ai-alibaba 1.0.0.2 学习（十二）——聊天记忆扩展包
学习spring-ai时提到过，spring-ai除了内置的InMemoryChatMemoryRepository，还提供jdbc、cassandra、neo4j三个扩展包。而spring-ai-alibaba则提供了jdbc、redis、elasticsearch三个扩展包。两者都提供了jdbc扩展包，有什么区别呢？spring-aijdbc和spring-ai-alibabajdbc对比sp
基于Elasticsearch的短视频平台个性化推荐系统设计与实现亲爱的非洲野猪 elasticsearch 音视频推荐算法
在当今内容爆炸的时代，个性化推荐系统已成为短视频平台的核心竞争力之一。本文将详细介绍如何利用Elasticsearch（ES）构建一个高效、可扩展的短视频个性化推荐系统。一、系统架构概述我们的推荐系统将采用混合推荐策略，结合协同过滤、内容相似度和热度推荐等多种方法。Elasticsearch作为核心搜索引擎和数据存储，将承担以下职责：用户画像存储与查询视频内容索引与检索实时行为日志分析推荐结果计算
Docker三分钟部署ElasticSearch平替MeiliSearch轻量级搜索引擎
‍个人主页：阿木木AEcru(更多精彩内容可进入主页观看)系列专栏：《Docker容器化部署系列》《Java每日面筋》每一次技术突破，都是对自我能力的挑战和超越。目录一、什么是MeiliSearch？二、对比ElasticSearch有什么好处？三、使用场景有哪些？四、docker部署MeiliSearch4.1创建数据持久化文件夹4.2拉取镜像4.3运行容器五、访问测试5.1访问5.2下载测试文
meilisearch-轻量级搜索引擎 Leon.ENV 大数据搜索引擎
meilisearch是一款开源的轻量级搜索引擎，相比于elasticsearch等重量级搜索引擎，meilisearch注重数据搜索，从而而省去了其它不必要的功能（如支持聚合分析、分布式搜索等特性），以便于快速上手开发和构建应用。meilisearch有以下优点1）非常轻量级，只需500MB内存就可以运行2）支持多种接入方式：http、多种语言SDK3）无其它依赖环境，下载启动即可使用4）非常适
亿级电商搜索引擎基石：Elasticsearch分片、副本与性能调优实战 lingRJ777 Java技术栈应用 java backend elasticsearch springboot microservices searchengine
亿级电商搜索引擎基石：Elasticsearch分片、副本与性能调优实战引言每年的“双十一”大促，海量用户涌入电商平台，搜索请求量瞬时可达平时的数十甚至上百倍。同时，数百万商品的库存、价格、促销信息也在以极高的频率更新。这种“读写混合”的超高并发场景，对商品搜索引擎提出了两大核心挑战：高可用与可扩展性：如何在流量洪峰下保证搜索服务7x24小时不间断，并且能够随着业务增长而平滑扩容？极致的查询性能：
【ES】--Elasticsearch的高亮模式
目录一、高亮策略1、FastVectorHighlighter（快速向量高亮器）2、PostingHighlighter（帖子高亮器）3、UnifiedHighlighter（统一高亮器）4、PlainHighlighter（普通高亮器）5、总结二、高亮参数三、高亮案例解析1、words_one配置解析2、words_two配置解析3、words_three配置解析4、words_four配置解析
Elasticsearch检索高亮不正确，不精确问题
问题场景：搜索“a”高亮"A8A",,,,,分词器：IK分词器确认分词结果：下图说明已经正确分词！确认高亮效果：换一种高亮器查询效果：对应java代码：总结：当高亮显示不精确的时候，要从以下两方面找问题：1.分词器是否分词准确2.高亮器是否满足你的要求，不满足换一种高亮器查看效果我之前原默认的高亮器（plain）不能满足要求，后来使用unified高亮器解决了高亮不精确的问题。
【Elasticsearch】深度分页及其替代方案 G皮T #Elastic elasticsearch 大数据搜索引擎深度分页 search_after scroll 检索
深度分页及其替代方案1.深度分页2.为什么不推荐深度分页2.1性能问题（核心原因）2.2资源消耗对比2.3实际限制3.深度分页的替代方案3.1方案一：SearchAfter（推荐）3.1.1为什么SearchAfter性能更高3.1.2技术原理简化3.1.3关键区别3.1.4适用场景3.2方案二：ScrollAPI（适用于大批量导出）3.2.1详细解释3.2.2类比理解3.2.3注意事项3.3方案
docker安装单机nacos、rocketmq、reids、xxl-job、minio、elasticsearch、kibana、gogs、nginx、mongo 丶会武术的流氓丶 docker rocketmq redis elasticsearch
目录在右侧中部启动容器报错直接删除那个name后边的就可以安装nacos首先需要拉取对应的镜像文件：dockerpullnacos/nacos-server挂载目录：mkdir-p/mydata/nacos/logs/#新建logs目录mkdir-p/mydata/nacos/init.d/vim/mydata/nacos/init.d/custom.properties#修改配置文件修改cust
50个Java+SpringBoot+Vue毕业设计选题（含技术栈+核心功能） 21光年 java spring boot vue.js 毕业设计毕设
适合人群：计算机专业毕业设计/实战项目/求职作品技术亮点：前后端分离、主流技术栈、多领域覆盖一、电商与交易类智能推荐电商平台技术栈：SpringBoot+Vue+Redis+Elasticsearch核心功能：协同过滤推荐算法、秒杀系统、物流跟踪二手商品交易平台技术栈：SpringBoot+Vue+OSS存储核心功能：多维度检索、信用评分、实名认证社区团购管理系统技术栈：SpringBoot+Vu
canal实现Mysql数据同步 BUG指挥官 MySQL数据库相关讲解 mysql 数据库
在当今互联网行业尤其是现在分布式、微服务开发环境下，为了提高搜索效率，以及搜索的精准度，会大量使用Redis、Memcached等NoSQL数据库，也会使用大量的Solr、Elasticsearch等全文检索服务和搜索引擎。那么，这个时候，就会有一个问题需要我们来思考和解决：那就是数据同步的问题！如何将实时变化的数据库中的数据同步到Redis/Memcached或者Solr/Elasticsear
springCloud集成elasticsearch 月光一族吖 spring cloud elasticsearch spring
Elasticsearch是一个分布式、RESTful风格的搜索和数据分析引擎，同时是可扩展的数据存储和矢量数据库，能够应对日益增多的各种用例。作为ElasticStack的核心，Elasticsearch能够集中存储您的数据，实现闪电般的搜索速度、精细的相关性调整以及强大的分析能力，并且能够轻松地进行规模扩展。废话少说，开干一、docker部署ES1、创建网络，让ES与Kibana容器互联doc
docker安装Elasticsearch Uluoyu docker elasticsearch
1.安装版本Elasticsearch（8.18.3）kibana（8.18.3）ik分词器（8.18.3）2.创建网络，让ES与Kibana容器互联dockernetworkcreatees-net3.加载镜像dockerpulldocker.elastic.co/elasticsearch/elasticsearch:8.18.3sudodockerpulldocker.elastic.co/
windows安装ELK
ELK是什么？ELK是Elasticsearch、Logstash和Kibana三款开源软件的组合，主要用于日志收集、存储、分析和可视化。三款软件版本必须保持一致三款软件下载地址通过网盘分享的文件：elasticsearch-9.0.3-windows-x86_64.zip等3个文件链接:https://pan.baidu.com/s/16Y7T6TYIZZ4uAou4ZeoQ4w?pwd=e8x
解决 Spring Boot 对 Elasticsearch 字段没有小驼峰映射的问题大只鹅 spring boot elasticsearch 后端
场景重现在使用MyBatis/Mybatis-Plus框架对MySQL操作时习惯了字段名小驼峰映射，然而在操作Elasticsearch时发现字段名没有小驼峰映射。解决方法1.使用`ObjectMapper`手动转换：这是最直接也最常用的方法。在SpringBoot应用中使用`ObjectMapper`将从Elasticsearch获取的数据进行转换，将下划线命名转换为小驼峰命名。importco
ELK日志分析系统搭建奔跑吧邓邓子高效运维 elk elasticsearch
目录一、ELK是什么？ElasticsearchLogstashKibana二、搭建ELK1.安装Elasticsearch2.安装Logstash3.安装Kibana三、配置实例1.将某个服务器某个目录下的日志收集到系统分析展示（1）修改logstash-sample.conf配置（2）配置Kibana一、ELK是什么？ELK是三个开源项目的首字母缩写，这三个项目分别是：Elasticsearc
按月设置索引名的完整指南：Elasticsearch日期索引实践少林码僧 elasticsearch jenkins 大数据
按月设置索引名的完整指南：Elasticsearch日期索引实践在时序数据场景中，按月设置索引名（如logs-2024-01）是优化查询效率、降低管理成本的关键策略。以下是三种实现方案及详细步骤：方案一：索引模板+日期数学表达式（推荐）原理：利用ES内置的日期数学表达式动态生成索引名，无需额外工具操作步骤：创建索引模板PUT_index_template/monthly_logs{"index_p
Elasticsearch索引模板：自动化索引管理搜索引擎技术搜索引擎实战 elasticsearch 自动化 jenkins ai
Elasticsearch索引模板：自动化索引管理关键词：Elasticsearch、索引模板、自动化管理、索引映射、索引设置、生命周期管理、数据建模摘要：本文深入解析Elasticsearch索引模板的核心原理与实践方法，通过系统化的步骤演示如何利用索引模板实现索引的自动化创建与统一管理。内容涵盖模板结构设计、映射与设置配置、动态字段处理、优先级策略、实战案例及最佳实践，帮助读者掌握高效管理大规
SeaTunnel 社区月报（5-6 月）：全新功能上线、Bug 大扫除、Merge 之星是谁？ SeaTunnel bug SeaTunnel 开源数据集成大数据
在5月和6月，SeaTunnel社区迎来了一轮密集更新：2.3.11正式发布，新增对Databend、Elasticsearch向量、HTTP批量写入、ClickHouse多表写入等多个连接器能力，全面提升了数据同步灵活性。同时，近100个修复与优化PR合入，涵盖Spark引擎并行性修复、Paimon精度兼容性增强、Mongo-CDCExactlyOnce默认值优化、OracleDDL类型支持补全
Elasticsearch性能调优金字塔：从分片与副本策略构建海量日志分析平台 lingRJ777 Java技术栈应用 java backend elasticsearch spring boot microservices elk
Elasticsearch性能调优金字塔：从分片与副本策略构建海量日志分析平台引言在当前的微服务架构体系中，一个复杂的业务流程往往会横跨数十甚至上百个服务。当线上出现问题时，如何从每天产生的TB级海量日志中快速定位根源，成为衡量系统可观测性的关键。传统的日志聚合方案在面对如此巨大的数据量时，普遍会遇到两大核心挑战：高并发写入瓶颈：数千个服务实例同时产生大量日志，要求日志系统具备极高的写入吞吐能力，
Elasticsearch分组后排序，并查询组数量 Gzzz__ Elasticsearch elasticsearch java 大数据
项目场景：Elasticsearch分组后，根据分组后的数量排序，并查询分组后的组数量，通过DSL和javaAPI两种方式解决方案：示例：在单据表中，查询2022-01-19当天每个人提交的单据数量，从高到低排序，并查询提交过单据的总人数。期望实现的SQLselectId,count(Id)ascfromuserbillwheretype='bill'andcreateTime>='2022-01
ES 和 lucene 的区别是什么？晚夜微雨问海棠呀 elasticsearch lucene 大数据
Elasticsearch(ES)和Lucene都是用于全文搜索和分析的工具，但它们在功能和使用场景上有一些重要的区别：基础与角色：Lucene是一个开源的信息检索软件库，提供了一个高性能、全功能的文本搜索引擎。它是许多搜索应用的核心，包括Elasticsearch。Elasticsearch是一个分布式搜索和分析引擎，构建在Lucene之上。它不仅提供了Lucene的所有功能，还增加了分布式计算
Lucence 和 Elasticsearch 的区别? 码出财富 elasticsearch 大数据搜索引擎
Lucene和Elasticsearch都是在信息检索和文本处理领域中广泛使用的工具，它们的主要区别如下：概念和定位Lucene：是一个基于Java的全文检索库，它提供了一套强大的底层索引和搜索功能的API。Lucene更像是一个工具包，开发人员可以基于它来构建自己的搜索应用程序，需要深入了解搜索的底层原理和算法，对开发者的技术要求较高。Elasticsearch：是一个基于Lucene的分布式搜
2023年JAVA面试题【Redis/Elasticsearch】 GJH-JAVA java redis elasticsearch
1.什么是Redis？Redis是一个使用C语言写成的，开源的高性能key-value非关系缓存数据库。它支持存储的value类型相对更多，包括string(字符串)、list(链表)、set(集合)、zset(sortedset--有序集合)和hash（哈希类型）。Redis的数据都基于缓存的，所以很快，每秒可以处理超过10万次读写操作，是已知性能最快的Key-ValueDB。Redis也可以实
后端Spring Data Elasticsearch的集群故障恢复 AI大模型应用实战 spring elasticsearch java ai
后端SpringDataElasticsearch的集群故障恢复关键词：SpringDataElasticsearch、集群故障恢复、分布式系统、故障处理、数据一致性摘要：本文围绕后端SpringDataElasticsearch的集群故障恢复展开深入探讨。首先介绍了相关背景，包括目的范围、预期读者等。接着阐述了核心概念与联系，详细讲解了核心算法原理及具体操作步骤，并结合数学模型和公式进行说明。通
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s

ElasticSearch入门之基本概念和RESTful api