Consul 是 HashiCorp 公司推出的开源工具,使用go语言开发,可用于实现分布式系统的服务发现与配置。 Consul内置了服务注册与发现框 架、分布一致性协议实现、健康检查、Key/Value存储、多数据中心方案,不再需要依赖其他工具(比如ZooKeeper等)。Consul 是分布式的、高可用的、 可横向扩展的。
Feature | Consul | zookeeper | etcd | euerka |
---|---|---|---|---|
服务健康检查 | 服务状态,内存,硬盘等 | (弱)长连接,keepalive | 连接心跳 | 可配支持 |
多数据中心 | 支持 | — | — | — |
kv存储服务 | 支持 | 支持 | 支持 | — |
一致性 | raft | paxos | raft | — |
cap | cp | cp | cp | ap |
使用接口 | 支持http和dns | 客户端 | http/grpc | http(sidecar) |
watch支持 | 全量/支持long polling | 支持 | 支持 long polling | 支持 long polling |
自身监控 | metrics | — | metrics | metrics |
安全 | acl/https | acl | https支持(弱) | - |
spring cloud集成 | 已支持 | 已支持 | 已支持 | 已支持 |
注:
词汇 | 说明 |
---|---|
Agent | agent是一直运行在Consul集群中每个成员上的守护进程。通过运行 consul agent 来启动。agent可以运行在client或者server模式。指定节点作为client或者server是 非常简单的,除非有其他agent实例。所有的agent都能运行DNS或者HTTP接口,并负责运行时检查和保持服务同步。 |
Client | 一个Client是一个转发所有RPC到server的代理。这个client是相对无状态的。client唯一执行的后台活动是加入LAN gossip池。这有一个最低的资源开销并且仅消耗少量的网络带宽。 |
Server | 一个server是一个有一组扩展功能的代理,这些功能包括参与Raft选举,维护集群状态,响应RPC查询,与其他数据中心交互WAN gossip和转发查询给leader或者远程数据中心。 |
DataCenter | 虽然数据中心的定义是显而易见的,但是有一些细微的细节必须考虑。例如,在EC2中,多个可用区域被认为组成一个数据中心?我们定义数据中心为一个私有的,低延迟和 高带宽的一个网络环境。这不包括访问公共网络,但是对于我们而言,同一个EC2中的多个可用区域可以被认为是一个数据中心的一部分。 |
Consensus | 在我们的文档中,我们使用Consensus来表明就leader选举和事务的顺序达成一致。由于这些事务都被应用到有限状态机上,Consensus暗示复制状态机的一致性。 |
Gossip | Consul建立在Serf的基础之上,它提供了一个用于多播目的的完整的gossip协议。Serf提供成员关系,故障检测和事件广播。更多的信息在gossip文档中描述。这足以知道g ossip使用基于UDP的随机的点到点通信。 |
LAN Gossip | 它包含所有位于同一个局域网或者数据中心的所有节点。 |
WAN Gossip | 它只包含Server。这些server主要分布在不同的数据中心并且通常通过因特网或者广域网通信。 |
RPC | 远程过程调用。这是一个允许client请求server的请求/响应机制。 |
Consul最多需要6个不同的端口才能正常工作,有些使用TCP,UDP或两种协议。 主要端口说明如下:
角色 | 端口号 | 协议 | 功能 |
---|---|---|---|
server | 8300 | TCP | agent server 使用的,用于处理其他agent发来的请求 |
serf_lan | 8301 | TCP 、UDP | agent使用此端口处理LAN中的gossip(用于单个数据中心) |
serf_wan | 8302 | TCP 、UDP | agent server使用此端口处理WAN中的与其他server的gossip(用于多个数据中心) |
grpc | 8400 | TCP | agent用于处理从CLI来的RPC请求 |
http | 8500 | TCP | agent用于处理HTTP API |
dns | 8600 | TCP 、UDP | agent用于处理 DNS 查询 |
Consul分为Client和Server两种节点(所有的节点也被称为Agent)。
Consul节点模式:
准备三台虚拟机,每台虚拟机搭建一个server和一个client,共计三个server和三个client。
节点 | IP | 操作系统 | 角色 |
---|---|---|---|
consul-1 | 192.168.66.131 | centos7 | consul-server, consul-client |
consul-2 | 192.168.66.132 | centos7 | consul-server, consul-client |
consul-3 | 192.168.66.133 | centos7 | consul-server, consul-client |
关闭: systemctl stop firewalld
开机禁用 : systemctl disable firewalld
cd /soft
wget https://releases.hashicorp.com/consul/1.11.4/consul_1.11.4_linux_amd64.zip
mkdir -p /usr/local/consul/bin
unzip consul_1.11.4_linux_amd64.zip -d /usr/local/consul/bin
配置环境变量:
vi /etc/profile, PATH=$PATH:/usr/local/consul/bin
source /etc/profile
consul --version
由于server和client同时部署在一台虚拟机,为避免端口冲突,这里需改client的接口(修改server端口也可以)。
mkdir -p /usr/local/consul/config
cd /usr/local/consul/config
touch ports.json
vi ports.json
添加如下配置:
{
"ports":{
"http":8501,
"dns":8601,
"serf_lan":8311,
"serf_wan":8312,
"server":8310
}
}
#!/bin/sh
leader="192.168.66.131"
ip_addr=`ifconfig | grep -A 1 ens33 | grep "inet" | awk '{print $2}'`
client_out_file=client_consul_`date +"%Y%m%d%H%M%S"`.log
data_dir=/usr/local/consul/data
logs_dir=/usr/local/consul/logs
config_dir=/usr/local/consul/config
if [ ! -d $data_dir ]; then
mkdir $data_dir
fi
if [ ! -d $logs_dir ]; then
mkdir $logs_dir
fi
nohup /usr/local/consul/bin/consul agent -datacenter=DC01 -bind=$ip_addr -client=$ip_addr -data-dir=$data_dir -ui -node=$ip_addr:client -config-dir=$config_dir -retry-join $leader -node-id=$(uuidgen | awk '{print tolower($0)}') > $logs_dir/$client_out_file 2>&1 &
注意:-node-id=$(uuidgen | awk ‘{print tolower($0)}’), 加这个是因为server和client同时部署在一台虚拟机,id重复,报错。
#!/bin/sh
leader="192.168.66.131"
ip_addr=`ifconfig | grep -A 1 ens33 | grep "inet" | awk '{print $2}'`
server_out_file=server_consul_`date +"%Y%m%d%H%M%S"`.log
data_dir=/usr/local/consul/data
logs_dir=/usr/local/consul/logs
if [ ! -d $data_dir ]; then
mkdir $data_dir
fi
if [ ! -d $logs_dir ]; then
mkdir $logs_dir
fi
if [ $leader = $ip_addr ]; then
nohup /usr/local/consul/bin/consul agent -datacenter=DC01 -server -bootstrap-expect=2 -bind=$ip_addr -client=$ip_addr -data-dir=$data_dir -ui -node=$ip_addr:server > $logs_dir/$server_out_file 2>&1 &
else
nohup /usr/local/consul/bin/consul agent -datacenter=DC01 -server -bootstrap-expect=2 -bind=$ip_addr -client=$ip_addr -data-dir=$data_dir -ui -node=$ip_addr:server -retry-join $leader > $logs_dir/$server_out_file 2>&1 &
fi
#!/bin/sh
sh /usr/local/consul/server.sh
sh /usr/local/consul/client.sh
#配置说明:
-advertise:通知展现地址用来改变我们给集群中的其他节点展现的地址,一般情况下-bind地址就是展现地址。
-bootstrap:用来控制一个server是否在bootstrap模式,在一个datacenter中只能有一个server处于bootstrap模式,当一个server处于bootstrap模式时,可以自己选举为raft leader。
-bootstrap-expect:在一个datacenter中期望提供的server节点数目,当该值提供的时候,consul一直等到达到指定sever数目的时候才会引导整个集群,该标记不能和bootstrap公用
-bind:该地址用来在集群内部的通讯,集群内的所有节点到地址都必须是可达的,默认是0.0.0.0
-client:consul绑定在哪个client地址上,这个地址提供HTTP、DNS、RPC等服务,默认是127.0.0.1
-config-file:明确的指定要加载哪个配置文件
-config-dir:配置文件目录,里面所有以.json结尾的文件都会被加载
-data-dir:提供一个目录用来存放agent的状态,所有的agent允许都需要该目录,该目录必须是稳定的,系统重启后都继续存在
-dc:该标记控制agent允许的datacenter的名称,默认是dc1
-encrypt:指定secret key,使consul在通讯时进行加密,key可以通过consul keygen生成,同一个集群中的节点必须使用相同的key
-join:加入一个已经启动的agent的ip地址,可以多次指定多个agent的地址。如果consul不能加入任何指定的地址中,则agent会启动失败,默认agent启动时不会加入任何节点。
-retry-join:和join类似,但是允许你在第一次失败后进行尝试。
-retry-interval:两次join之间的时间间隔,默认是30s
-retry-max:尝试重复join的次数,默认是0,也就是无限次尝试
-log-level:consul agent启动后显示的日志信息级别。默认是info,可选:trace、debug、info、warn、err。
-node:节点在集群中的名称,在一个集群中必须是唯一的,默认是该节点的主机名
-protocol:consul使用的协议版本
-rejoin:使consul忽略先前的离开,在再次启动后仍旧尝试加入集群中。
-server:定义agent运行在server模式,每个集群至少有一个server,建议每个集群的server不要超过5个
-syslog:开启系统日志功能,只在linux/osx上生效
-pid-file:提供一个路径来存放pid文件,可以使用该文件进行SIGINT/SIGHUP(关闭/更新)agent
更详细配置看官方:Agent/Configuration
启动脚本:
./startup.sh
http://192.168.66.131:8501/ui/dc01/nodes