谦玉

《ElasticSearch权威指南》学习笔记

ElasticSearch权威指南

一、环境配置：

1.     安装ElasticSearch与配置

2.     Head插件安装

3.     Kibanna安装/Dev Tools安装

4.     Elasticsearch 面向文档，它存储和索引整个对象或者文档；对文档进行索引/检索/过滤，而不是对列。

5.     存储数据到Elasticsearch的行为叫做索引，一个Elasticsearch集群可以包含多个索引，相应的索引也可以包含多个类型，这些不同的类型存储着不同的文档，每个文档又有多个属性。

6.     Elasticsearch和Lucene使用了一个叫做倒排索引的结构来提高数据检索速度，默认每个文档中的每个属性都会被索引，而且可搜索。

7.     启动：直接运行{ES_HOME}/bin/elasticsearch.bat 则直接运行在9002端口下。

8.     启动Kibanna:直接运行{KIBANA_HOME}/bin/kibana.bat 访问：
http://localhost:5601/app/kibana#/dev_tools/console?_g=()
9. 启动head:直接在C:\软件安装\head\elasticsearch-head-master\elasticsearch-head-master下运行 grunt server 访问：
http://localhost:9100/
10.curl使用：在CMD中执行：
curl -i -XGET http://localhost:9200/website/blog/124?pretty

二、简单查询

1. 使用一条put命令就可以完成创建索引和类型以及添加数据。

PUT/megacorp/employee/1
{
    "first_name" : "John",
    "last_name" :  "Smith",
    "age" :        25,
    "about" :      "I love to go rock climbing",
    "interests": ["sports", "music" ]
}

2. 使用get命令检索文档：

GET /megacorp/employee/1

3. 轻量检索

GET /megacorp/employee/_search

4. 高亮检索

GET /megacorp/employee/_search?q=last_name:Smith

5. 查询表达式

GET/megacorp/employee/_search
{
  "query": {
    "match": {
      "last_name": "Smith"
    }
  }
}

6. 查询范围使用filter

GET/megacorp/employee/_search
{
  "query":
  {
    "bool":
    {
      "must":
      {
        "match":
        {
         "last_name":"smith"
        }
      },
      "filter":
      {
        "range": {
          "age": {
            "gt": 30
          }
        }
      }
    }
  }
}

7. elasticsearch根据相关性返回文档，这跟关系型数据库有很大差别

GET/megacorp/employee/_search
{
  "query":
  {
    "match":
    {
      "about":"rockclimbing"
    }
  }
}

8. 短语搜索

GET/megacorp/employee/_search
{
  "query":
  {
    "match_phrase":
    {
      "about":"rockclimbing"
    }
  }
}

9. 高亮显示短语搜索匹配的结果

GET/megacorp/employee/_search
{
  "query":
  {
    "match_phrase":
    {
      "about":"rockclimbing"
    }
  },
  "highlight":
  {
    "fields":
    {
      "about":{}
    }
  }
}

10. 聚合分析按照兴趣进行分组统计

直接执行查询，则显示如下异常："Fielddata is disabled on text fieldsby default. Set fielddata=true on”，执行如下PUT命令后，就可以直接操作了。

PUTmegacorp/_mapping/employee/
{
  "properties":
  {
    "interests":
    {
      "type":"text",
      "fielddata":true
    }
  }
}
GET /megacorp/employee/_search
{
  "aggs":
  {
    "all_interests":
    {
      "terms":
      {
        "field":"interests"
      }
    }
  }
}

11. 对满足条件的就进行分组统计查询名称为smith的员工的兴趣分组统计

GET/megacorp/employee/_search
{
  "query":
  {
    "match": {
      "last_name": "smith"
    }
  },
  "aggs":
  {
    "all_interests":
    {
      "terms":
      {
        "field":"interests"
      }
    }
  }
}

12. 对分组聚合查询所得结果求平均值各个兴趣关注员工的平均年龄

GETmegacorp/employee/_search
{
  "aggs":
  {
    "all_interests":
    {
      "terms":
      {
        "field":"interests"
      }
      , "aggs": {
        "avg_age": {
          "avg": {
            "field": "age"
          }
        }
      }
    }
  }
}

13. 分布式特性

Elasticsearch自动进行如下操作：

    a.     分配文档到不同的容器或者分片中，文档可以存储在一个或者多个节点中

    b.     按照集群节点均衡分配这些分片，从而对索引和搜索进行负载均衡

    c.     复制每个分片以支持数据冗余，从而方式硬件故障导致的数据丢失

    d.     将集群中任一节点的请求路由到存有数据的节点

    e.     集群扩容时无缝整合新节点，重新分配分片以便从离群节点恢复

三、集群内的原理

    1.     集群节点：一个运行中Elasticsearch实例就是一个节点；每个节点都能够将接收到的请求发送到拥有相关数据的节点并成功返回查询结果。

    2.     主节点：当一个节点被选择为主节点时，它将负责管理集群范围内的所有变更，例如增加、删除索引或者增加删除节点等，主节点并不涉及文档级别的变更和搜索等操作；任何节点都可以成为主节点。

    3.     集群健康：查询：GET /_cluster/health

        查询结果中的status字段：

            green:所有主分片和副分片都正常

            yellow:所有主分片都运行正常，部分副分片运行不正常

            red:部分主分片未正常运行

    4.     添加索引

        向Elasticsearch中添加数据时需要用到索引——保存相关数据的地方。索引是指向一个或者多个物理分片的逻辑命名空间。

        一个分片是一个底层的工作单元，它仅保存了全部数据的一部分，一个分片是一个lucene实例，其本身就是一个完整的搜索引擎，文档会被存储和索引到分片内，但是应用程序是直接与索引而不是与分片交互。

        分片是容器，文档保存在分片内，而分片又被分配在不同的节点内；当集群伸缩时，Elasticsearch会自动在各个节点中进行节点迁移，使数据均匀分布在集群里。

        一个分片可以时主分片或者副分片，索引内任意一个文档都属于主分片，所以主分片的数量决定了索引能够保存的最大数据量。

        一个副分片是一个主分片的拷贝，副分片作为主分片的数据冗余备份以防硬件故障引起的数据丢失，并为搜索和返回文档等读操作提供服务。

        主分片数在建立索引时已经确定，但是副分片数可以随时修改。

创建索引：

PUT/blogs
{
  "settings": {
    "number_of_shards": 3,
    "number_of_replicas": 1
  }
}

5.     添加故障转移

        添加节点，可在同一台机器启动多个Elasticsearch实例，这样就会有多个节点；同一台机器上启动多个实例时，Elasticsearch会根据cluster.name自动发现同一集群节点，自动加入；如果在不同机器上启动节点，则需要配置单播主机列表，以便让此节点加入集群。

6.     水平扩容

        增加节点，Elasticsearch会自动将分片在各个节点直接重新分配，以充分利用新加入的硬件资源。

可以通过调整副分片数目实现扩容：

PUT/blogs/_settings
{
  "number_of_replicas": 2
}

7. 应对故障

分片的提升和恢复。

四、数据的输入和输出

一个对象是基于特定语言的内存数据结构，JSON是一种以人可读的文本表示对象的方法。

1. 对象和文档

对象：类似于hash、hashmap、字典或者关联数组的JSON对象，对象中也可以嵌套其他对象。

文档：指最顶层或者根对象，这个根对象被序列化成JSON并存储在Elasticsearch中，并制定了唯一ID。

2. 文档元数据

一个文档不仅仅包含它的数据，也包含元数据——有关文档的信息，三个必须的元数据如下：

_index 文档存在在哪里

        一个索引应该是因为拥有共同特性而被分在一起的文档集合。索引名称要求：必须小写，不能以下划线开头，不能包含逗号。

_type   文档表示的对象类别

               索引中数据的逻辑分区，不同的type内的文档可能有不同的字段，但最好是相似的。Type命名要求：可以是大写或者小写，不能以下划线开头，不能包含逗号，长度不能超过256个字符。

_id     文档唯一标识

               _id与_index,_type组合就可以确定唯一一个文档,可自行提供，也可自动生成。

_version 文档版本号

               每个文档都有一个版本号，文档的任何修改（包括删除），文档的版本号都会递增。

3. 索引文档使用index API,存储或者使文档可被搜索

A.自定义ID

PUT/{index}/{type}/{id}
{
  "field": "value",
  ...
}

B.自动生成ID

POST/website/blog/
{
  "title":"My second blogentry",
  "text":"Still trying thisout",
  "date":"2014/01/01"
}

4. 取回文档

GET /website/blog/1?pretty

获取部分字段：

GET /website/blog/1?_source=title,text

只获取source：

GET/website/blog/1/_source

提问：如果需要显示source中的一部分字段呢？

5. 检查文档是否存在

如果不需要返回内容，仅仅是确认文档是否存在，则可以使用HEAD

curl-i -XHEAD http://localhost:9200/website/blog/124

6. 更新整个文档

在Elasticsearch中文档是不可变的，不能修改它们。如果需要更新现有文档，就需要重新创建索引或者进行替换，可以使用index API实现。

PUT /website/blog/1
{
  "title":"My first blogentry",
  "text":"I am starting to getthe hang of this ...",
  "date":"2014/01/02"
}

使用update API 可以完成文档部分更新，但是实质根上述操作完全一致，唯一的区别是不需要单独发送get和index请求：

A．从旧文档构建JSON

B．更改该JSON

C．删除旧文档

D．索引一个新文档

7. 创建新文档

索引一个文档时，我们需要确认时在覆盖一个文档还是在创建一个文档。

a. 使用post让es自动生成唯一ID

POST/website/blog/
{
  "title":"My third blogentry",
  "text":"I am starting to getthe hang of this ...",
  "date":"2014/01/02"
}

b. 使用op_type查询字符串当指定index/type/id的文档不存在时才接受请求，否则异常

POST/website/blog/1?op_type=create
{
  "title":"My third blogentry",
  "text":"I am starting to getthe hang of this ...",
  "date":"2014/01/02"
}

c. 在URL末端使用/_create 当指定index/type/id的文档不存在时才接受请求，否则异常

POST/website/blog/1/_create
{
  "title":"My third blogentry",
  "text":"I am starting to getthe hang of this ...",
  "date":"2014/01/02"
}

8. 删除文档逻辑删除，然后自动在后台物理清除

DELETE /website/blog/1

9. 处理冲突

悲观并发控制：

乐观并发控制：

10. 乐观并发控制

Elasticsearch通过使用_version（版本号）来避免新的版本被覆盖；在搜索返回结果中，包含有文档当前版本号，在对文档内容做修改后，提交时会检查库中文档的当前版本号与提交内容中的版本号是否一致，如果不一致，则请求失败，如果一致，则执行请求。

PUT/website/blog/1?version=1
{
  "title":"My first blogentry",
  "text":"Starting to get thehang of this"
}

11. 通过外部系统使用版本控制

如果主数据库中已经存在一个可以作为版本号的字段值比如timestamp，就可以在Elasticsearch中通过增加version_type=external到查询字符串的方式重用这些版本号，版本号必须是大于零的整数，且小于9.2e+18.

处理方式：检查当前_version是否小于指定的版本号，如果请求成功，外部的版本号作为文档新的版本号进行存储。版本号在文档创建/索引/删除时都可以指定。

PUT/website/blog/2?version=10&version_type=external
{
  "title":"My first externalblog entry",
  "text":"Starting to get thehang of this"
}

12. 文档的部分更新

使用update API部分更新文档。

检索-修改-重建索引发生在分片内部，减少了多次请求的网络开销，降低了冲突的可能性。

POST/website/blog/1/_update
{
   "doc" : {
      "tags" : [ "testing"],
      "views": 0
   }
}

13. 使用脚本更新文档

POST/website/blog/1/_update
{
 "script":"ctx._source.views+=1"
}

Elasticsearch允许使用脚本编写自定义的逻辑。可以在集群中的所有节点的config/elasticsearch.yml 中禁用动态Groovy脚本：

Script.groovy.sandbox.enabled:false

以下脚本执行失败：

POST/website/blog/1/_update
{
   "script" :"ctx._source.tags+=new_tag",
   "params" : {
      "new_tag" : "search"
   }
}

14. 更新的文档可能不存在

Upsert参数，指定如果所要更新的文档不存在则创建。

POST/website/blog/1/_update
{
 "script":"ctx._source.viess+=1",
  "upsert":
  {
    "viess":1
  }
}

第一次运行上述请求时，upsert值作为新文档被索引，初始化viess字段值为1，在后续的运行中，由于文档已经存在，script更新操作将替代upsert进行应用，对viess计数器进行累加。

15. 更新和冲突

如果版本冲突，更新失败，可以通过retry_on_conflict来自动完成重试操作。

POST/website/blog/1/_update?retry_on_conflict=5
{
 "script":"ctx._source.viess+=1",
  "upsert":{
    "viess":0
  }
}

16. 取回多个文档

GET /_mget
{
 "docs":[
    {
     "_index":"website",
     "_type":"blog",
     "_id":"2"
   },{
     "_index":"website",
     "_type":"pageviews",
     "_id":"1",
     "_source":"viess"
    }
    ]
}

如果检索的数据在相同的_index或者_type中，则可以在URL中指定默认的/_index或者默认的/_index/_type

GET /website/blog/_mget
{
 "docs": [
    {
     "_id": 2
   },
    {
     "_type": "pageviews",
     "_id": 1
    }
  ]
}
GET/website/blog/_mget
{
  "ids" : [ "2", "1" ]
}

17. 代价较小的批量操作

bulk API 允许在单个步骤中多次create、index、update或delete请求。

   {action:{metadata}}\n
   {request body}\n
   {action:{metadata}}\n
   {request body}\n
      …

注意点：a.每行以\n结束，包括最后一行 b.不能包含未转义字符，避免对解析造成干扰

Action/metadata指定做什么操作

Action 必须是一下选项之一：

Create

Index

Update

Delete

Metadata应该指定被索引、创建、更新或者删除的文档的_index,_type和_id.

Request body 行由文档的_source本身组成，它是index、update和create操作所必需的,delete不需要。

Bulk请求不是原子的，不能用它来实现事务控制。

整个批量请求都需要由接收到请求的节点加载到内存中，所以存在最佳请求大小，可以通过尝试获得该值。

POST/website/log/_bulk
{"delete":{"_index":"website","_type":"blog","_id":"123"}}
{"create":{"_index":"website","_type":"blog","_id":"123"}}
{"title":"Myfirst blog post"}
{"update":{"_index":"website","_type":"blog","_id":"123","_retry_on_conflict":3}}
{"doc":{"reviss":"Myupdated blog post"}}
{"index":{"_index":"website","_type":"blog"}}
{"title":"Mysecond blog post"}

五、分布式文档存储

1. 路由一个文档到一个分片中

shard =hash(routing) % number_of_primary_shards

routing 是一个可变值，默认是文档的id，也可以设置自定义值；number_of_primary_shards主分片的数量。上述公式所得结果分布在0到number_of_primary_shards之间。

所有的API都接受routing的路由参数，通过此参数我们可以自定义文档到分片的映射。

2. 主分片和副分片如何交互

相同分片的副本不会放在同一节点上；协调节点（coordinating node）

3. 新建、索引、删除文档

新建、索引、删除请求都是写操作，必须在主分片上面完成之后才能被复制到相关的副分片。

操作顺序：

a. 客户端向node1发送新建、索引、删除请求

b. 节点使用文档的_id确定文档输入分片0.请求会被转发到node3,因为分片0的主分片在node3上。

c. Node3在主分片上执行请求，若成功，则同时将请求转发到node1和node2的扶分片上，一旦副分片上请求报告成功，node3将向node1(协调节点)报告成功，协调节点向客户端报告成功。

一些额外参数：

Consistency 默认设置向，当主分片数大于1时，执行请求签主分片会要求必须要有规定数据量的分片副本处于活跃可用状态，可会执行请求。

Int((primary+number_of_replicas)/2)+1

值：one all quorum

number_of_replicas指的时在索引设置中的设定副本分片数，而不是指当前处理活动状态的副本分片数。

Timeout 如果没有到达规定数量的分片副本处于活跃可用状态，则会等待一定时间，超过等待时间仍未满足条件，则超时。

4. 取回单个文档

在处理读取请求时，协调节点在每次请求时都会通过轮询所有的副本分片来达到负载均衡。

5. 局部更新文档

从主分片检索文档，修改_source字段中的JSON，重新索引主分片文档；若版本冲突，则重试；如果索引成功，则将完成文档的新版本并行转发到拥有副本分片的节点，重新建立索引；副本分片返回成功，则向协调节点返回成功，协调节点向客户端返回成功。

6. 多文档模式

Mget和bulk API的模式类似于单文档模式，区别在于协调节点知道每个文档存在于哪个分片中；它将整个多文档请求分解成每个分片的多文档请求，并且将这些请求并行转发到每个参与节点。协调节点一旦受到来自每个节点的应答，就将每个节点的响应收集整理成单个响应，返回给客户端。

7. 搜索-最基本的工具

你可能感兴趣的:(ElasticSearch)

Spring boot with ELK(Elasticsearch + Logstash + Kibana) netkiller-BG7NYT 多维度架构 spring boot elk elasticsearch
SpringbootwithELK(Elasticsearch+Logstash+Kibana)节选自《NetkillerSpringCloud手札》将Springboot日志写入ELK有多种实现方式，这里仅提供三种方案：Springboot->logback->Tcp/IP->logstash->elasticsearch这种方式实现非常方便不需要而外包或者软件Springboot->logba
Java面试系列-ElasticSearch面试题20道，文档，索引，搜索，聚合，分词器，集群管理，索引模版，数据备份和恢复，安全机制，集群扩展，实时搜索，索引生命周期，节点发现，批量操作，基本架构图苑 java 面试 elasticsearch
文章目录1.Elasticsearch的基本架构是什么？2.Elasticsearch中的Shard和Replica是如何工作的？3.Elasticsearch中的文档是如何存储的？4.Elasticsearch中的索引是如何创建的？5.Elasticsearch中的搜索是如何工作的？6.Elasticsearch中的聚合是如何工作的？7.Elasticsearch中的分词器是如何工作的？8.El
Spark任务读取hive表数据导入es 小小小小小小小小小小码农 hive elasticsearch spark java
使用elasticsearch-hadoop将hive表数据导入es，超级简单1.引入pomorg.elasticsearchelasticsearch-hadoop9.0.0-SNAPSHOT2.创建sparkconf//spark参数设置SparkConfsparkConf=newSparkConf();//要写入的索引sparkConf.set("es.resource","");//es集
windows安装es怎么在后台运行_Windows-ElasticSearch安装和启动 weixin_39531037
步骤二：安装ES服务Window版的ElasticSearch的安装很简单，类似Window版的Tomcat，解压开即安装完毕，解压后的ElasticSearch的目录结构如下：修改elasticsearch配置文件，config/elasticsearch.yml文件，增加文件内容如下：http.cors.enabled:truehttp.cors.allow-origin:"*"添加配置是为了
ES的预置分词器阿湯哥 elasticsearch 服务器 linux
Elasticsearch（简称ES）提供了多种预置的分词器（Analyzer），用于对文本进行分词处理。分词器通常由字符过滤器（CharacterFilters）、分词器（Tokenizer）和词元过滤器（TokenFilters）组成。以下是一些常用的预置分词器及其示例：1.StandardAnalyzer（标准分词器）默认分词器，适用于大多数语言。处理步骤：使用标准分词器（StandardT
elasticsearch 备份恢复步骤 qq_35640866 elasticsearch chrome 大数据
1、查看仓库，GET_snapshot返回，仓库名是aliyun_auto_snapshot{"aliyun_auto_snapshot":{"type":"oss","settings":{"compress":"true","base_path":"fb632b-1241148226163200/xxx","endpoint":"http://oss-cn-shenzhen-internal.
elasticsearch 横向扩展-添加节点 yp2800 elasticsearch elasticsearch
ELKELK运维都会接触到，是一个分布式日志收集平台。logstash收集数据写到elasticsearch里，kibana从elasticsearch里读取数据。数据在elasticsearch里可以被检索，各种查询api,数据聚合等，功能很强大，不多说。environments目前现状：os:centos6.6elasticsearch:2.4cpu:8mem:48disk:8Tindex:4
使用Spring Boot和Elastic Stack构建实时日志分析系统微赚淘客系统开发者@聚娃科技 spring boot jenkins 后端
使用SpringBoot和ElasticStack构建实时日志分析系统大家好，我是微赚淘客系统3.0的小编，是个冬天不穿秋裤，天冷也要风度的程序猿！随着现代应用程序的复杂性增加，实时日志分析成为确保系统稳定性和性能的重要手段。本文将介绍如何利用SpringBoot和ElasticStack（Elasticsearch、Logstash、Kibana）构建一个高效的实时日志分析系统，实现日志的收集、
Elastic Stack 8.16.0 日志收集平台的搭建 JingAi_jia917 Elastisearch Logstash Filebeat Kibana Elastic stack ELK日志平台
简介1.1ELK介绍ELK是‌Elasticsearch‌、‌Logstash‌、‌Kibana‌三款开源工具的首字母缩写，构成了一套完整的日志管理解决方案，主要用于日志的采集、存储、分析与可视化‌。1）Logstash：数据管道工具，负责从多种来源（如文件、数据库、消息队列）采集日志，进行过滤、格式化后输出到目标（如Elasticsearch）‌；2）Elasticsearch：分布式实时搜索与
springboot2.2.x对接elasticsearch7.2.0，实现分页搜索情况下的高亮和摘要功能 lyc613 elasticsearch
springboot2.2.x对接elasticsearch7.2.0，实现分页搜索情况下的高亮和摘要功能相关依赖2.2.0.RELEASEorg.springframework.bootspring-boot-starter-data-elasticsearches配置spring:elasticsearch:rest:#es地址uris:http://192.168.125.12:9200功能
Java与Elasticsearch集成详解，以及使用指南 qzw1210 java elasticsearch jenkins
Java与Elasticsearch集成详解1.环境配置首先，你需要在Maven项目中添加ElasticsearchJava客户端依赖：co.elastic.clientselasticsearch-java8.10.0com.fasterxml.jackson.corejackson-databind2.15.2jakarta.jsonjakarta.json-api2.1.12.客户端初始化E
Elasticsearch大文件检索性能提升20倍实践（干货）_elasticsearch 查询优化 2401_84247505 2024年程序员学习 elasticsearch jenkins 大数据
3、问题排查与定位步骤1：限定返回记录条数。不提供直接访问末页的入口。baidu，360，搜狗等搜索引擎都不提供访问末页的请求方式。都是基于如下的请求方式：通过点击上一下、下一页逐页访问。这个从用户的角度也很好理解，搜索引擎返回的前面都是相关度最高的，也是用户最关心的信息。Elasticsearch的默认支持的数据条数是10000条，可以通过post请求修改。最终，本步骤将支持ES最大返回值100
elasticsearch analyzer 学习笔记 weixin_40455124 elasticsearch 代码分析及扩展 elasticsearch analyzer token
基本定义analyzer执行将输入字符流分解为token的过程使用场景在indexing的时候，也即在建立索引的时候在searching的时候，也即在搜索时，分析需要搜索的词语analysisCharacterfiltering(字符过滤器):使用字符过滤器转换字符Breakingtextintotokens(把文字转化为标记):将文本分成一组一个或多个标记Tokenfiltering：使用标记过
springboot 整合 elk （Elasticsearch+Logstash+Kibana）高大王竟然被注册 spring 运维
Elasticsearch是个开源分布式搜索引擎，它的特点有：分布式，零配置，自动发现，索引自动分片，索引副本机制，restful风格接口，多数据源，自动搜索负载等。Logstash是一个完全开源的工具，他可以对你的日志进行收集、过滤，并将其存储供以后使用（如，搜索）。Kibana也是一个开源和免费的工具，它Kibana可以为Logstash和ElasticSearch提供的日志分析友好的Web界
【Springboot知识】开发属于自己的中间件健康监测HealthIndicate 问道飞鱼微服务相关技术 spring boot 中间件后端 HealthIndicate
文章目录**一、技术栈****二、项目结构****三、依赖配置(pom.xml)****四、配置文件(application.yml)****五、自定义健康检查实现****1.Redis健康检查****2.Elasticsearch健康检查****3.Kafka健康检查****4.MySQL健康检查****六、自定义健康检查接口(可选)****七、测试与验证****八、高级功能扩展****九、部署
elk的相关的基础 weixin_43806846 elk
以下是关于ELK（Elasticsearch,Logstash,Kibana）的200个基础问题及其答案，涵盖了ELK的核心概念、组件、配置、使用场景、优化等方面。Elasticsearch基础**什么是Elasticsearch？**答：Elasticsearch是一个分布式、RESTful的搜索和分析引擎，基于ApacheLucene构建。**Elasticsearch的主要用途是什么？**答
Elasticsearch Java High Level Client [7.17] 使用 DavidSoCool java elasticsearch 开发语言
es的HighLevelClient存在es源代码的引用，结合springboot使用时，会存在es版本的冲突，这里记录下解决冲突和使用方式（es已经不建议使用这个了）。注意es服务端的版本需要与client的版本对齐，否则返回数据可能会解析失败！！！文档地址：JavaHighLevelRESTClient|JavaRESTClient[7.17]|Elastic1、首先创建个javaspring
ES 使用geo point 查询离目标地址最近的数据 DavidSoCool elasticsearch Mysql elasticsearch 搜索引擎 mysql
需求描述：项目中需要通过经纬度坐标查询目标地所在的行政区。解决思路大致有种，使用es和mysql分别查询。1、使用es进行查询将带有经纬度坐标的省市区数据存入es中，mappings字段使用geopoint类型，索引及查询dsl如下。geopoint文档地址：Geo-distancequery|ElasticsearchGuide[8.6]|ElasticSortsearchresults|Ela
【实战ES】实战 Elasticsearch：快速上手与深度实践-附录-1-常用命令速查表-集群健康检查、索引生命周期管理、故障诊断命令言析数智实战 elasticsearch 搜索引擎大数据
点击关注不迷路点击关注不迷路点击关注不迷路附录-常用命令速查表1-Elasticsearch运维命令速查表（集群健康检查、ILM管理、故障诊断）一、集群健康检查与监控1.1集群健康状态核心命令1.2节点级健康诊断二、索引生命周期管理（ILM）2.1ILM策略配置模板2.2ILM操作命令集三、故障诊断命令大全3.1分片问题诊断流程3.2常见故障场景处理场景1：`节点离线导致分片未分配`场景2：`高内
SpringBoot整合Netty 晚上睡不着！ #SpringBoot spring boot nio websocket tcp/ip http
前言Netty是一个高性能、异步事件驱动的网络应用程序框架，用于快速开发可维护的高并发协议服务器和客户端。Netty主要基于JavaNIO实现，提供了异步和事件驱动的网络编程工具，简化了TCP和UDP服务器的编程。Netty广泛应用于分布式系统、实时通信、游戏开发等领域，例如，知名的Elasticsearch和Dubbo框架内部都采用了Netty。Netty吸收了多种协议的实现经验，经过精心设计，
通过 ElasticSearch的Python API和`curl` 命令获取Elasticsearch 所有索引名称 BigBookX elasticsearch jenkins 大数据
导言在大数据管理和实时搜索场景中，Elasticsearch是一款不可或缺的工具。无论是开发调试、数据维护，还是系统监控，快速列出所有索引名称都是一个高频需求。本文将手把手教你如何通过Python客户端连接Elasticsearch，并用两种方法获取索引列表，同时提供代码示例和实战技巧，助你高效掌控Elasticsearch的索引管理。一、为什么需要列出索引名称？在Elasticsearch中，索
[特殊字符] Elasticsearch 双剑合璧：HTTP API 与 Java API 实战整合指南周小闯 elasticsearch 项目实战 elasticsearch http java
Elasticsearch双剑合璧：HTTPAPI与JavaAPI实战整合指南一、HTTPAPI定义与用途Elasticsearch的HTTPAPI是基于RESTful接口设计的核心交互方式，支持通过URL和JSON数据直接操作索引、文档、集群等资源。适用于快速调试、脚本调用和跨语言集成。1.索引管理(1)创建索引（指定分片与映射）PUT/products{"settings":{"number_
Easyliev在线视频分享平台项目总结——SpringBoot、Mybatis、Redis、ElasticSearch、FFmpeg 周小闯项目总结 spring boot mybatis redis
EasyLive项目总结登陆注册获取图片验证码captchat插件base编码（图片，用于前端展示）checkCodeKey验证码标识（用于匹配redis缓存，校验验证码）redis缓存保存验证码缓存用于登录注册校验（checkCodeKey为标识）注册校验验证码根据前端传递的checkCodeKey，在Redis缓存中查找验证码并进行比较注册昵称是否被使用邮箱是否被使用清除Redis中的验证码缓
【大数据】大数据处理-Lambda架构-Kappa架构 weixin_33884611 大数据系统架构
大数据处理-Lambda架构-Kappa架构elasticsearch-headElasticsearch-sqlclientNLPchina/elasticsearch-sql:UseSQLtoqueryElasticsearch360企业安全V5.6SP1,杨军01,您好!lamda架构_百度搜索Lambda架构vsKappa架构-数据源博客-CSDN博客数据系统架构——Lambdaarchi
flink-cdc实时增量同步mysql数据到elasticsearch 大数据技术派 #Flink elasticsearch flink mysql
什么是CDC？CDC是（ChangeDataCapture变更数据获取）的简称。核心思想是，监测并捕获数据库的变动（包括数据或数据表的插入INSERT、更新UPDATE、删除DELETE等），将这些变更按发生的顺序完整记录下来，写入到消息中间件中以供其他服务进行订阅及消费。1.环境准备mysqlelasticsearchflinkonyarn说明：如果没有安装hadoop，那么可以不用yarn，直
Kibana 单机与集群部署教程闲人编程大数据集群部署教程大数据集群单机部署 Kibana 日志分析数据可视化
目录Kibana单机与集群部署教程第一部分：Kibana概述第二部分：Kibana单机部署教程1.安装Kibana1.1安装依赖项1.2下载和安装Kibana1.3启动Kibana2.单机案例代码实现（Python）3.常见问题及解决方法3.1无法启动Kibana服务3.2Kibana无法连接到Elasticsearch第三部分：Kibana集群部署教程1.配置集群节点1.1配置Elasticse
Elasticsearch（ES）详解：从入门到实践坚持蛊 elasticsearch jenkins 大数据
引言简介：Elasticsearch是一个基于Lucene的分布式搜索引擎，具有高效的全文搜索功能，广泛应用于日志分析、搜索引擎、实时数据处理等领域。本文目标：介绍Elasticsearch的基本概念、架构设计、配置优化、常见应用以及实际案例，帮助开发者掌握ES1.Elasticsearch概述Elasticsearch的背景和发展历程核心功能：全文检索、分布式搜索、实时数据分析主要应用场景：日志
ES8的Java API client 8.0 简单示例操作 Elasticsearch it-shiyadi es java elasticsearch 开发语言
1.加入依赖co.elastic.clientselasticsearch-java8.12.22.配置类@Slf4j@ConfigurationpublicclassElasticSearchConfig{@Value("${elasticsearch.hosts}")privateStringhosts;@Value("${elasticsearch.port}")privateintport
Elasticsearch 入门教学：从零开始掌握分布式搜索引擎格子先生Lab 搜索引擎 elasticsearch 分布式
引言Elasticsearch是一个开源的分布式搜索引擎，基于ApacheLucene构建，能够实现近乎实时的数据搜索和分析。它广泛应用于日志分析、全文搜索、数据可视化等场景。本文将带你从零开始学习Elasticsearch，掌握其基本概念、安装配置、数据操作及搜索功能。1.Elasticsearch简介1.1什么是Elasticsearch？Elasticsearch是一个分布式的RESTful
ELK Stack 安装教程 - 构建日志存储告警系统运维
介绍“ELK”是三个开源项目的首字母缩写，这三个项目分别是：Elasticsearch、Logstash和Kibana。Elasticsearch是一个搜索和分析引擎。Logstash是服务器端数据处理管道，能够同时从多个来源采集数据，转换数据，然后将数据发送到诸如Elasticsearch等“存储库”中。Kibana则可以让用户在Elasticsearch中使用图形和图表对数据进行可视化。目前最
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen