ElasticSearch学习(一) 基本概念

基本概念

官方文档

1 Near Realtime(NRT) 几乎实时

ES是一个几乎实时的查询平台,从开始执行查询命令,到文档可查看,只需要1s

2 Cluster 集群

  1. 集群用来承载数据以及联邦查询能力,可以有一个或者多个节点(主机)。
  2. 一个集群用一个唯一的名字来标识一个集群用一个唯一的名字来标识
  3. 一台主机只能隶属于一个集群一台主机只能隶属于一个集群

3 Node 节点

  1. node是集群里面的一台服务器,用来存储数据,提供检索、查询能力。
  2. node默认在初始化的时候通过UUID唯一标识,可以在任何时候改名。
  3. node可以被制定隶属于某个集群,同一个集群里面的node会相互寻找对方,并自动初始化。
  4. 一个集群可以有无限多的节点,也可以只有一个节点。

4 Index 索引

  1. index是document的集合,类似于characteristics的概念。
  2. 举例:一个用于存储客户数据的index,一个存储产品目录的index,一个用于存储有序数据的index
  3. index命名必须全是小写,后面对document的检索、查询、更新、删除等操作都是基于这个名字。

5 Type 类型

  1. type用来对index做逻辑上的分区或者目录。
  2. 通过type,可以将不同类型的document存储在相同类
  3. 在6.0.0以上的版本,不会再支持这个特性,参考removal of mapping type

6 Document 文档

  1. document是能被检索的信息的最小单元。
  2. 举例:一个单个用户的document,一个单个产品的document,一个单个命令的document。
  3. document存储为JSON格式。
  4. 一个index或者type中可以有多个无限多个document

7 Shards&Replicas 分片和复制

  1. 每个index能被分成多个shards
  2. 每个index能被replicated0次或者多次
  3. 备份之后,shards就分为primary shards和replica shards(简称replicas)
  4. shards和replicas能在index被创建的时候设置
  5. 也可以在创建之后,使用改变数量也可以在创建之后,使用_shrink和_split API改变数量。
  6. 可以通过设置shards和replica的数量进行调优,默认对于有两台以上主机的集群,对一个index会创建5份shards,1份replicas,即共10份shards

你可能感兴趣的:(ElasticSearch学习(一) 基本概念)