Elasticsearch集群的搭建

简介

ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

基础概念

  1. Cluster(集群)
    cluster(集群)是一个或者多个节点的集合,它们一起保存数据并且提供所有节点联合索引以及搜索功能。集群存在一个唯一的名字且默认为 “elasticsearch”。这个名字非常重要,因为如果节点安装时通过它自己的名字加入到集群中的话,那么一个节点只能是一个集群中的一部分。
    请确保您在不同环境中不要重复使用相同的集群名字,否则您可能最终会将节点加入到了错误的集群中。
  2. Node(节点)
    node(节点)是一个单独的服务器,它是集群的一部分,存储数据,参与集群中的索引和搜索功能。像一个集群一样,一个节点通过一个在它启动时默认分配的一个随机的 UUID(通用唯一标识符)名称来识别。如果您不想使用默认名称您也可自定义任何节点名称。
  3. Index(索引)
    index(索引)是具有稍微类似特征文档的集合。类似关系型数据库中库的概念。
  4. Type(类型)
    在 Index(索引)中,可以定义一个或多个类型。一个类型是索引中一个逻辑的种类/分区,它的语义完全取决于您自己。类似关系型数据库中表的概念。
  5. Document(文档)
    document(文档)是索引信息的基本单位。该文档可以使用json来表示。类似关系型数据库中记录的概念。
  6. Shards (分片 )
    索引可以存储大量数据,可以超过单个节点的硬件限制。例如,十亿个文档占用了 1TB 的磁盘空间的单个索引可能不适合放在单个节点的磁盘上,并且从单个节点服务请求会变得很慢。
    为了解决这个问题,Elasticsearch 提供了把 Index(索引)拆分到多个 Shard(分片)中的能力。在创建索引时,您可以简单的定义 Shard(分片)的数量。
  7. Replicas(副本)
    为了在 shard或node 故障的情况下提供高可用性和容错性。所以提供了shard的副本功能。

总而言之,每个索引可以被拆分成多个分片,一个索引可以设置 0 个(没有副本)或多个副本。开启副本后,每个索引将有主分片(被复制的原始分片)和副本分片(主分片的副本)。分片和副本的数量在索引被创建时都能够被指定。在创建索引后,您也可以在任何时候动态的改变副本的数量,但是不能够改变分片数量。
默认情况下,Elasticsearch 中的每个索引分配了 5 个主分片和 1 个副本,这也就意味着如果您的集群至少有两个节点的话,您的索引将会有 5 个主分片和另外 5 个副本分片(1 个完整的副本),每个索引共计 10 个分片。

下载安装

前提条件:Elasticsearch 是使用 Java 构建的,并且至少需要 Java 8 才能运行。 只支持 Oracle 的 Java 和 OpenJDK。在所有 Elasticsearch 节点和客户端上应使用相同的 JVM 版本。

cd /opt
wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.2.3.tar.gz #使用wget命令下载
tar -zxvf elasticsearch-6.2.3.tar.gz
cd elasticsearch-6.2.3
#当我们不进行任何配置的时候运行下面的命令就可以启动一个单节点的集群。
#当我们在输出信息中看到started的时候就表示启动成功了。
#我们可以在浏览器地址栏中输入http://localhost:9200就可以看到相关的信息。
# 在后面加 -d 参数可以后台启动
./bin/elasticsearch 

集群配置

以下我使用三个节点(192.168.10.104、192.168.10.105、192.168.10.106)来组成一个elasticsearch集群
我们使用scp命令把tar包复制到集群中另外的两个节点上,并进行解压操作。

scp elasticsearch-6.2.3.tar.gz root@cn05:/opt
scp elasticsearch-6.2.3.tar.gz root@cn06:/opt

首先我们先配置cn04(192.168.10.104)节点。
配置文件在config目录下
我们只需配置elasticsearch.yml文件即可。

cd /opt/elasticsearch-6.2.3/
vim config/elasticsearch.yml
#在文件中添加以下内容
cluster.name: elasticsearch_test #集群的名称。 默认名称为elasticsearch。
node.name: cn04 #节点名称。默认情况下,Elasticsearch将使用随机生成的uuid的第一个字符作为节点id。
path.data: /var/lib/elasticsearch #数据存放目录。默认数据目录是$ES_HOME的子文件夹。
path.logs: /var/log/elasticsearch #日志存放目录。默认日志目录是$ES_HOME的子文件夹。
bootstrap.memory_lock: false 
bootstrap.system_call_filter: false
network.host: 192.168.10.104 #ip
http.port: 9200 #port
node.master: true #标识该节点为master
discovery.zen.minimum_master_nodes: 2 
#保存退出即可。

配置cn05(192.168.10.105)节点

vim config/elasticsearch.yml
#在文件中添加以下内容
cluster.name: elasticsearch_test #集群的名称。 默认名称为elasticsearch。
node.name: cn05 #节点名称。默认情况下,Elasticsearch将使用随机生成的uuid的第一个字符作为节点id。
path.data: /var/lib/elasticsearch #数据存放目录。默认数据目录是$ES_HOME的子文件夹。
path.logs: /var/log/elasticsearch #日志存放目录。默认日志目录是$ES_HOME的子文件夹。
bootstrap.memory_lock: false 
bootstrap.system_call_filter: false
network.host: 192.168.10.105 #ip
http.port: 9200 #port
discovery.zen.ping.unicast.hosts: ["cn04"]
discovery.zen.minimum_master_nodes: 2 

配置cn06(192.168.10.106)节点

vim config/elasticsearch.yml
#在文件中添加以下内容
cluster.name: elasticsearch_test #集群的名称。 默认名称为elasticsearch。
node.name: cn06 #节点名称。默认情况下,Elasticsearch将使用随机生成的uuid的第一个字符作为节点id。
path.data: /var/lib/elasticsearch #数据存放目录。默认数据目录是$ES_HOME的子文件夹。
path.logs: /var/log/elasticsearch #日志存放目录。默认日志目录是$ES_HOME的子文件夹。
bootstrap.memory_lock: false 
bootstrap.system_call_filter: false
network.host: 192.168.10.106 #ip
http.port: 9200 #port
discovery.zen.ping.unicast.hosts: ["cn04"]
discovery.zen.minimum_master_nodes: 2 

ok,三个节点全部配置完了。
当我们启动cn04节点的时候启动不了,出现了几个Error.
常见的几个Error信息如下:

  1. max file descriptors [4096] for elasticsearch process likely too low, increase to at least [65536]
    解决办法:
    执行命令即可解决:ulimit -n 65536,不过这只是临时设置,要想永久生效需要在/etc/security/limits.conf文件中添加配置elasticsearch - nofile 65536
    elasticsearch表示用户名,在用户下次打开一个新的会话时才会生效。
  2. max virtual memory areas vm.max_map_count [65530] likely too low, increase to at least [262144]
    解决方法:
切换到root用户下,修改配置文件sysctl.conf
vim /etc/sysctl.conf
添加下面配置:
vm.max_map_count=262144
#保存退出即可
之后执行命令:
sysctl -p
  1. system call filters failed to install; check the logs and fix your configuration or disable system call filters at your own risk
    解决办法:在配置文件中增加如下两个配置项(我已经提前增加进配置文件里了。)
bootstrap.memory_lock: false
bootstrap.system_call_filter: false
  1. max number of threads [1024] for user [es] likely too low, increase to at least [2048]
    解决方法:切换到root用户,进入limits.d目录下,修改90-nproc.conf 配置文件。
vim /etc/security/limits.d/90-nproc.conf
#找到如下内容:
* soft nproc 1024
#修改为
* soft nproc 2048

解决了以上出现的问题,集群就可以正常启动,使用./bin/elasticsearch命令,先启动cn04节点,在启动cn05和cn06两个节点。
当我们在每个节点输出信息中都看到started的时候就表示三个节点已经启动成功了。

常用命令

  1. 我们可以使用命令curl -XGET 'localhost:9200/_cat/nodes?v&pretty'获取集群列表.可以看到有三个节点的信息。
  2. 使用命令curl -XGET 'localhost:9200/_cat/health?v&pretty'可以查看节点的健康状况。当status是green的时候表示是健康的。另外还有yellow和red两个状态表示。Green 表示一切正常(集群功能齐全), yellow 表示所有数据可用,但是有些副本尚未分配(集群功能齐全),red 意味着由于某些原因有些数据不可用。注意,集群是 red,它仍然具有部分功能(例如,它将继续从可用的分片中服务搜索请求),但是您可能需要尽快去修复它,因为您已经丢失数据了。
  3. 使用命令curl -XGET 'localhost:9200/_cat/indices?v&pretty'列出所有索引。
  4. 使用命令curl -XPUT 'localhost:9200/customer?pretty&pretty'创建一个名为 “customer” 的索引。
  5. 使用命令curl -XPUT 'localhost:9200/customer/external/1?pretty&pretty' -d' { "name": "John Doe" }'创建一条简单的文档到 customer 索引中,“external” 类型,与一个为 1 的 ID。
  6. 使用命令curl -XGET 'localhost:9200/customer/external/1?pretty&pretty'检索我们刚刚索引的文档。
  7. 使用命令curl -XDELETE 'localhost:9200/customer?pretty&pretty'删除刚才创建的索引。

更多的命令可以到官网去学习。
elasticsearch只是elastic stack家族中的一个开源框架,家族成员中还有logstash、kibana等。了解更多信息的话就可以去官网看看。
有一个中文文档分享给大家http://cwiki.apachecn.org/pages/viewpage.action?pageId=4260364


END

你可能感兴趣的:(Elasticsearch集群的搭建)