Elasticsearch的核心概念:
1,NRT(near real time):es是一个近实时搜索平台;
2,cluster:集群是一个或多个node节点,存储所有数据,并提供跨node间搜索和索引的能力.集群是根据名字区分的,默认为”elasticsearch”;
3,Node:是一个server,可以存储数据,参与集群的索引和搜索.node的名字在启动时使用UUID随机生成的,可以自己定义.
4,Index:索引是存储相似特征的文档的集合,索引通过名字标识,名字必须小写,类比数据库;
5,Type:类型是索引中的一个逻辑分类或分区,因此一个索引中可以定义一个或多个type,每一个type通常存储相同的field的文档,类比数据表;
6,Document:文档是保存在索引中的基本信息单元,使用JSON格式表示,文档真正的保存到type中,类比记录;
7,Shards & Replicas:
1)索引分割为多个小片就是分片,分片可以在创建索引时指定,默认是5个.
分片原因:
1.水平分割或扩展容量
2.分布式和并行操作多分片多节点,提升性能和吞吐量
3.分片就是Lucene index,最大存储Integer.MAX_VALUE-128个文档,可以使用_cat/shards查看
4.分片划分机制以及搜索聚合文档是es管理的,对用户是透明的;
2)在网络或云环境下,失败随时发生,es可以将索引的分片拷贝一份或多份,这就是副本,默认是1份.
副本原因:
1.因为分片或节点失败,提高可靠性
2.扩展搜索容量,并行执行提升吞吐量
3.副本可以在创建索引时指定,也可以在索引创建后指定.
原文: https://www.elastic.co/guide/en/elasticsearch/reference/current/_basic_concepts.html