在开发中,随着业务需求的迭代,较⽼的业务逻辑就要⾯临更新甚⾄是重构,⽽对于es来说,为了
适应新的业务逻辑,可能就要对原有的索引做⼀些修改,⽐如对某些字段做调整,甚⾄是重建索
引。⽽做这些操作的时候,可能会对业务造成影响,甚⾄是停机调整等问题。由此,es提供了索引
别名来解决这些问题。 索引别名就像⼀个快捷⽅式或是软连接,可以指向⼀个或多个索引,也可
以给任意⼀个需要索引名的API来使⽤。别名的应⽤为程序提供了极⼤地灵活性
查询
GET /_alias
创建别名
POST /_aliases
{
"actions": [
{
"add": {
"index": "my_data_index",
"alias": "current_data"
}
}
]
}
删除别名
POST /_aliases
{
"actions": [
{
"remove": {
"index": "my_data_index",
"alias": "current_data"
}
}
]
}
在 Elasticsearch 中,重建索引是一项重要的操作,通常用于更新或优化现有索引。以下是有关如何执行重建索引的一些建议和步骤:
在执行重建索引之前,确保你有原始索引的备份。这是因为重建索引会创建一个新的索引,然后将数据从旧索引复制到新索引。如果出现问题,你可以回滚到原始索引。
首先,你需要创建一个新的索引,用于存储重新索引后的数据。你可以使用 Elasticsearch 的索引模板和设置来定义新索引的配置,确保它符合你的需求。
PUT /new_index
{
"settings": {
"number_of_shards": 5,
"number_of_replicas": 1
},
"mappings": {
"_doc": {
"properties": {
"field1": { "type": "text" },
"field2": { "type": "keyword" }
}
}
}
}
使用 Elasticsearch 的 Reindex API:这是一种安全的方法,它允许你从旧索引到新索引复制数据,并提供了一些高级选项来处理数据转换和过滤等任务。
POST /_reindex
{
"source": {
"index": "old_index"
},
"dest": {
"index": "new_index"
}
}
使用 Logstash 或其他 ETL 工具:如果你有复杂的数据转换需求,可以考虑使用 Logstash 或其他 ETL(Extract, Transform, Load)工具来从旧索引导出数据并将其导入新索引
在执行重建操作后,务必进行测试和验证以确保新索引中的数据与旧索引中的数据一致。你可以执行一些查询和聚合操作,以验证数据的准确性。
一旦你验证了新索引中的数据,可以更新别名,将其指向新索引,以便应用程序可以开始使用新索引中的数据。
POST /_aliases
{
"actions": [
{
"remove": {
"index": "old_index",
"alias": "my_alias"
}
},
{
"add": {
"index": "new_index",
"alias": "my_alias"
}
}
]
}
一旦你确认新索引正常工作,可以考虑删除或归档旧索引,以释放磁盘空间并减轻集群负载。
在 Elasticsearch 中,refresh 操作用于使新索引数据在搜索前立即可见。默认情况下,Elasticsearch 具有自动刷新机制,索引每秒自动刷新一次,以使新的文档和更改对搜索可见。
修改默认更新时间(默认时间是1s,-1为关闭)
PUT /star/_settings
{
"index": {
"refresh_interval": "5s"
}
}
有时你可能需要手动执行 refresh 操作以确保最新的数据立即可用。
POST /my_index/_refresh
在执行搜索查询时,你可以使用 highlight 参数来请求高亮信息。以下是一个简单的示例:
GET /my_index/_search
{
"query": {
"match": {
"content": "关键词"
}
},
"highlight": {
"fields": {
"content": {} // 高亮的字段
}
}
}
在上面的示例中,我们执行了一个简单的全文搜索查询,目标是 content 字段中包含关键词 “关键词” 的文档。高亮信息将包含在响应中。
在查询结果中,你将看到一个名为 highlight 的部分,它包含了高亮信息。你可以从中提取高亮的文本以及它们的位置。
"hits": {
"total": 3,
"hits": [
{
"_source": {
"content": "这是包含关键词的文本。"
},
"highlight": {
"content": [
"这是包含 关键词 的文本。"
]
}
}
]
}
默认情况下,高亮文本使用 标签标记,但你可以根据需要自定义高亮的样式。你可以在查询中使用 pre_tags 和 post_tags 参数定义前缀和后缀标签。
"highlight": {
"fields": {
"content": {}
},
"pre_tags": [""],
"post_tags": [""]
}
Elasticsearch 提供了几种不同类型的查询建议器,包括 Term Suggester(词语建议器)、Phrase Suggester(短语建议器)和 Completion Suggester(自动完成建议器)。让我分别解释它们的作用和用法:
作用:Term Suggester 用于纠正拼写错误,提供与用户输入的单个词语最接近的建议。
用法:你可以在查询请求中使用 Term Suggester 来提供词语级别的建议。它通常用于搜索引擎的搜索框,以帮助用户纠正拼写错误并提供相关的建议。
示例:
POST /my_index/_search
{
"suggest": {
"my-suggestion": {
"text": "applle",
"term": {
"field": "product_name"
}
}
}
}
作用:Phrase Suggester 用于提供纠正的短语或建议,而不仅仅是单个词。
用法:你可以在查询请求中使用 Phrase Suggester 来提供短语级别的建议。它通常用于搜索引擎的搜索框,以帮助用户在纠正拼写错误的同时提供整个查询短语的建议。
示例:
POST /my_index/_search
{
"suggest": {
"my-suggestion": {
"text": "red bbaloon",
"phrase": {
"field": "product_name"
}
}
}
}
作用:Completion Suggester 用于实现自动完成搜索,根据用户输入的一部分提供建议。
用法:通常在搜索框中,当用户键入查询的一部分时,Completion Suggester 提供可能的建议,以帮助用户更快地完成输入。
示例:
POST /my_index/_search
{
"suggest": {
"my-suggestion": {
"prefix": "app",
"completion": {
"field": "product_name.suggest"
}
}
}
}
请注意,对于 Completion Suggester,通常需要在索引映射中定义一个专门的 “completion” 字段,以便支持自动完成建议。