Swarm 是 Docker 官方推出的容器集群管理工具,最大的优势之一就是原生支持 Docker API,原来的 Docker 用户可以很方便地将服务迁移到 Swarm 中来。
Swarm 还内置了对 Docker 网络插件的支持,因此用户可以很方便地部署需要跨主机通信的容器集群。
除此之外,Swarm还有以下优点:
Swarm 的架构整体分为管理节点(Manager Nodes)和工作节点(Worker Nodes):
一组被 Swarm 统一管理和调度的节点,被 Swarm纳管的节点可以是物理机或者虚拟机。其中一部分节点作为管理节点,负责集群状态的管理和协调,另一部分作为工作节点,负责执行具体的任务来管理容器,实现用户服务的启停等功能。
Swarm 集群中的每一台物理机或者虚拟机称为节点。节点按照工作职责分为管理节点和工作节点,管理节点由于需要使用 Raft 协议来协商节点状态,生产环境中通常建议将管理节点的数量设置为奇数个,一般为 3 个、5 个或 7 个。
服务是为了支持容器编排所提出的概念,它是一系列复杂容器环境互相协作的统称。一个服务的声明通常包含容器的启动方式、启动的副本数、环境变量、存储、配置、网络等一系列配置,用户通过声明一个服务,将它交给 Swarm,Swarm 负责将用户声明的服务实现。
服务分为全局服务(global services)和副本服务(replicated services):
集群中的最小调度单位,它包含一个真正运行中的 Docker 容器。当管理节点根据服务中声明的副本数将任务调度到节点时,任务则开始在该节点启动和运行,当节点出现异常时,任务会运行失败。此时调度器会把失败的任务重新调度到其他正常的节点上正常运行,以确保运行中的容器副本数满足用户所期望的副本数。
由于容器的 IP 只能在集群内部访问到,而且容器又是用后马上销毁,这样容器的 IP 也会动态变化,因此容器集群内部的服务想要被集群外部的用户访问到,服务必须要映射到主机上的固定端口。
Swarm 使用入口负载均衡(ingress load balancing)的模式将服务暴露在主机上,该模式下,每一个服务会被分配一个公开端口(PublishedPort),你可以指定使用某个未被占用的公开端口,也可以让 Swarm 自动分配一个。
Swarm 集群的公开端口可以从集群内的任意节点上访问到,当请求达到集群中的一个节点时,如果该节点没有要请求的服务,则会将请求转发到实际运行该服务的节点上,从而响应用户的请求。
前提条件:
为了简化,这里仅是有一个manager管理节点
# 初始化 Swarm集群
docker swarm init --advertise-addr
Swarm initialized: current node (1ehtnlcf3emncktgjzpoux5ga) is now a manager.
To add a worker to this swarm, run the following command:
docker swarm join --token SWMTKN-1-1kal5b1iozbfmnnhx3kjfd3y6yqcjjjpcftrlg69pm2g8hw5vx-8j4l0t2is9ok9jwwc3tovtxbp 192.168.31.100:2377
To add a manager to this swarm, run 'docker swarm join-token manager' and follow the instructions.
# advertise-addr 一般用于主机有多块网卡的情况,如果你的主机只有一块网卡,可以忽略此参数
# 打印信息中,提示了如何把一台主机加入集群成为工作节点
# 复制初始化集群时,提示的加入工作节点命令,分别在工作节点上执行
$ docker swarm join --token SWMTKN-1-1kal5b1iozbfmnnhx3kjfd3y6yqcjjjpcftrlg69pm2g8hw5vx-8j4l0t2is9ok9jwwc3tovtxbp 192.168.31.100:2377
This node joined a swarm as a worker.
# 如果是生产环境,可以使用docker swarm join-token manager命令来查看如何加入管理节点
$ docker swarm join-to ken manager
To add a manager to this swarm, run the following command:
docker swarm join --token SWMTKN-1-1kal5b1iozbfmnnhx3kjfd3y6yqcjjjpcftrlg69pm2g8hw5vx-8fq89jxo2axwggryvom5a337t 192.168.31.100:2377
# 复制 Swarm 输出的结果即可加入管理节点到集群中
# 查看当前节点的状态
$ ]# docker node ls
ID HOSTNAME STATUS AVAILABILITY MANAGER STATUS ENGINE VERSION
1ehtnlcf3emncktgjzpoux5ga * swarm-manager Ready Active Leader 19.03.12
pn7gdm847sfzydqhcv3vma97y * swarm-node1 Ready Active 19.03.12
4dtc9pw5quyjs5yf25ccgr8uh * swarm-node2 Ready Active 19.03.12
est7ww3gngna4u7td22g9m2k5 * swarm-node3 Ready Active 19.03.12
# 当前集群包含 1 个管理节点,3 个工作节点
# 创建服务
$ docker service create --replicas 1 --name hello-world nginx
24f9ng83m9sq4ml3e92k4g5by
overall progress: 1 out of 1 tasks
1/1: running [==================================================>]
verify: Service converged
# 查看已经启动的服务
$ docker service ls
ID NAME MODE REPLICAS IMAGE PORTS
24f9ng83m9sq hello-world replicated 1/1 nginx:latest
# 删除服务
$ docker service rm hello-world
hello-world
更多的docker service
命令的相关操作,可以参考这里。
修改前述章节提到的docker-compose 的模板文件,添加了deploy 指令,并且指定使用副本服务(replicated)的方式启动两个 WordPress 实例
version: '3'
services:
mysql:
image: mysql:5.7
volumes:
- mysql_data:/var/lib/mysql
restart: always
environment:
MYSQL_ROOT_PASSWORD: root
MYSQL_DATABASE: mywordpress
MYSQL_USER: mywordpress
MYSQL_PASSWORD: mywordpress
wordpress:
depends_on:
- mysql
image: wordpress:php7.4
deploy:
mode: replicated
replicas: 2
ports:
- "8080:80"
restart: always
environment:
WORDPRESS_DB_HOST: mysql:3306
WORDPRESS_DB_USER: mywordpress
WORDPRESS_DB_PASSWORD: mywordpress
WORDPRESS_DB_NAME: mywordpress
volumes:
mysql_data: {}
在 /tmp 目下新建 docker-compose.yml 文件,并且写入以上的内容。使用以下命令启动服务:
$ docker stack deploy -c docker-compose.yml wordpress
Ignoring unsupported options: restart
Creating network wordpress_default
Creating service wordpress_mysql
Creating service wordpress_wordpress
以上命令执行后,将会启动两个服务:
# 查看启动的服务:
$ docker service ls
ID NAME MODE REPLICAS IMAGE PORTS
v8i0pzb4e3tc wordpress_mysql replicated 1/1 mysql:5.7
96m8xfyeqzr5 wordpress_wordpress replicated 2/2 wordpress:php7.4 *:8080->80/tcp