docker-compose下的java应用启动顺序两部曲之二：实战

上篇回顾

本文是《docker-compose下的java应用启动顺序两部曲》的终篇，在上一篇《docker-compose下的java应用启动顺序两部曲之一：问题分析》中，我们以SpringCloud环境下的注册中心和业务服务为例，展示了docker-compose.yml中depends_on参数的不足：即只能控制容器创建顺序，但我们想要的是eureka服务就绪之后再启动业务服务，并且docker官方也认为depends_on参数是达不到这个要求的，如下图所示：

针对上述问题，docker给出的解决办法是使用wait-for-it.sh脚本来解决问题，地址：https://docs.docker.com/compo... ，如下图：

什么是wait-for-it.sh

wait-for-it.sh脚本用来访问指定的地址和端口，如果收不到响应就等待一段时间再去重试，直到收到响应后，再去做前面指定好的命令，如上图红框所示./wait-for-it.sh db:5432 -- python app.py的意思是：等到db:5432这个远程访问能够响应的时候，就去执行python app.py命令
wait-for-it.sh文件的链接：
https://raw.githubusercontent...

环境信息

本次实战的环境如下：

操作系统：CentOS Linux release 7.7.1908
docker：1.13.1
docker-compose：1.24.1
spring cloud：Finchley.RELEASE
maven：3.6.0
jib：1.7.0

实战简介

上一篇的例子中，我们用到了eureka和service两个容器，eureka是注册中心，service是普通业务应用，service容器向eureka容器注册时，eureka还没有初始化完成，因此service注册失败，在稍后的自动重试时由于eureka进入ready状态，因而service注册成功。
今天我们来改造上一篇的例子，让service用上docker官方推荐的wait-for-it.sh脚本，等待eureka服务就绪再启动java进程，确保service可以一次性注册eureka成功；
为了达到上述目标，总共需要做以下几步：

简单介绍eureka和service容器的镜像是怎么制作的；
制作基础镜像，包含wait-for-it.sh脚本；
使用新的基础镜像构建service镜像；
改造docker-compose.yml；
启动容器，验证顺序控制是否成功；
wait-for-it.sh方案的缺陷；

接下来进入实战环节；

源码下载

如果您不想编码，也可以在GitHub上获取文中所有源码和脚本，地址和链接信息如下表所示：

名称	链接	备注
项目主页	https://github.com/zq2599/blo...	该项目在GitHub上的主页
git仓库地址(https)	https://github.com/zq2599/blo...	该项目源码的仓库地址，https协议
git仓库地址(ssh)	[email protected]:zq2599/blog_demos.git	该项目源码的仓库地址，ssh协议

这个git项目中有多个文件夹，本章的应用在wait-for-it-demo文件夹下，如下图红框所示：

源码的结构如下图所示：

接下来开始编码了；

简单介绍eureka和service容器

上一篇和本篇，我们都在用eureka和service这两个容器做实验，现在就来看看他们是怎么做出来的：

eureka是个maven工程，和SpringCloud环境中的eureka服务一样，唯一不同的是它的pom.xml中使用了jib插件，用来将工程构建成docker镜像：



    4.0.0

    com.bolingcavalry
    eureka
    0.0.1-SNAPSHOT
    jar

    eureka
    eureka

    
        com.bolingcavalry
        wait-for-it-demo
        0.0.1-SNAPSHOT
        ../pom.xml 
    

    
        UTF-8
        UTF-8
        1.8
        Finchley.RELEASE
    

    
        
            org.springframework.cloud
            spring-cloud-starter-netflix-eureka-server
        
    

    
        
            
                org.springframework.boot
                spring-boot-maven-plugin
            
            
            
                com.google.cloud.tools
                jib-maven-plugin
                1.7.0
                
                    
                    
                        
                        openjdk:8-jdk-stretch
                    
                    
                        
                        bolingcavalry/${project.artifactId}:${project.version}
                    
                    
                    
                        
                        
                            -Xms1g
                            -Xmx1g
                        
                        
                        
                            8080
                        
                        true
                    
                
                
                    
                        compile
                        
                            dockerBuild

上述pom.xml中多了个jib插件，这样在执行mvn compile的时候，插件就会用构建结果制作好docker镜像并放入本地仓库；

service是个普通的SpringCloud应用，除了在pom.xml中也用到了jib插件来构建镜像，它的配置文件中，访问eureka的地址要写成eureka容器的名称：

spring:
  application:
    name: service

eureka:
  client:
    serviceUrl:
      defaultZone: http://eureka:8080/eureka/

关于如何将java应用制作成docker镜像，如果您想了解更多请参考以下两篇文章：

《Docker与Jib(maven插件版)实战》
《Jib使用小结(Maven插件版)》

制作基础镜像

从上面的pom.xml可见，我们将Java应用制作成docker镜像时，使用的基础镜像是openjdk:8-jdk-stretch，这样做出的应用镜像是不含wait-for-it.sh脚本的，自然就无法实现启动顺序控制了，因此我们要做一个带有wait-for-it.sh的基础镜像给业务镜像用：

把wait-for-it.sh文件准备好，下载地址：https://raw.githubusercontent...
在wait-for-it.sh文件所在目录新建Dockerfile文件，内容如下：

FROM openjdk:8-jdk-stretch

ADD wait-for-it.sh /wait-for-it.sh
RUN sh -c 'chmod 777 /wait-for-it.sh'

注意：我这里用的是openjdk:8-jdk-stretch，您可以根据自己的实际需要选择不同的openjdk版本，可以参考：《openjdk镜像的tag说明》

执行命令docker build -t bolingcavalry/jkd8-wait-for-it:0.0.2 .就能构建出名为bolingcavalry/jkd8-wait-for-it:0.0.2的镜像了，请您根据自己的情况设置镜像名称和tag，注意命令的末尾有个小数点，不要漏了；
如果您有hub.docker.com账号，建请使用docker push命令将新建的镜像推送到镜像仓库上去，或者推送到私有仓库，因为后面使用jib插件构建镜像是，jib插件要去仓库获取基础镜像的元数据信息，取不到会导致构建失败；

使用新的基础镜像构建service镜像

我们的目标是让service服务等待eureka服务就绪，所以应该改造service服务，让它用docker官方推荐的wait-for-it.sh方案来实现等待：

修改service工程的pom.xml，有关jib插件的配置改为以下内容：


                com.google.cloud.tools
                jib-maven-plugin
                1.7.0
                
                    
                    
                        
                        bolingcavalry/jkd8-wait-for-it:0.0.2
                    
                    
                        
                        bolingcavalry/${project.artifactId}:${project.version}
                    
                    
                    
                        
                        INHERIT
                        
                        
                            8080
                        
                        true
                    
                
                
                    
                        compile
                        
                            dockerBuild

上述配置有几点需要注意：
a. 基础镜像改为刚刚构建好的bolingcavalry/jkd8-wait-for-it:0.0.2
b. 增加entrypoint节点，内容是INHERIT，按照官方的说法，entrypoint的值等于INHERIT表示jib插件不构建启动命令了，此时要使用者自己控制，可以在启动时输入，或者写在基础镜像中，这样我们在docker-compose.yml中用command参数来设置service容器的启动命令，就可以把wait-for-it.sh脚本用上了
c. 去掉jvmFlags节点，按照官方文档的说法，entrypoint节点的值等于INHERIT时，jvmFlags和mainClass参数会被忽略，如下图，地址是：https://github.com/GoogleCont...

至此，service工程改造完毕，接下来修改docker-compose.yml，让service容器能用上wait-for-it.sh
### 改造docker-compose.yml

完整的docker-compose.yml内容如下所示：

services:
eureka:

image: bolingcavalry/eureka:0.0.1-SNAPSHOT
container_name: eureka
restart: unless-stopped

service:

image: bolingcavalry/service:0.0.1-SNAPSHOT
container_name: service
restart: unless-stopped
command: sh -c './wait-for-it.sh eureka:8080 -t 0  -- java -Xms1g -Xmx1g -cp /app/resources:/app/classes:/app/libs/* com.bolingcavalry.waitforitdemo.ServiceApplication'
depends_on:
- eureka

2. 注意command参数的内容，如下，service容器创建后，会一直等待eureka:8080的响应，直到该地址有响应后，才会执行命令java -Xms1g -Xmx1g -cp /app/resources:/app/classes:/app/libs/* com.bolingcavalry.waitforitdemo.ServiceApplication：

sh -c './wait-for-it.sh eureka:8080 -t 0 -- java -Xms1g -Xmx1g -cp /app/resources:/app/classes:/app/libs/* com.bolingcavalry.waitforitdemo.ServiceApplication'

3. 对于命令java -Xms1g -Xmx1g -cp /app/resources:/app/classes:/app/libs/* com.bolingcavalry.waitforitdemo.ServiceApplication，您可能觉得太长了不好写，这里有个小窍门，就是在不使用entrypoint节点的时候，用jib插件制作的镜像本身是带有启动命令的，容器运行的时候，您可以通过docker ps --no-trunc命令看到该容器的完整启动命令，复制过来直接用就行了；

所有的改造工作都完成了，可以开始验证了；
### 启动容器，验证顺序控制是否成功

1. 在docker-compose.yml文件所在目录执行命令docker-compose up，会创建两个容器，并且日志信息会直接打印在控制台，我们来分析这些日志信息，验证顺序控制是否成功；
2. 如下图，可见service容器中并没有启动java进程，而是在等待eureka:8080的响应：
![在这里插入图片描述](https://image-static.segmentfault.com/125/374/1253743127-5dbe91a99d1c9_articlex)
3. 继续看日志，可见eureka服务就绪的时候，service容器的wait-for-it.sh脚本收到了响应，于是立即启动service应用的进程：
![在这里插入图片描述](https://image-static.segmentfault.com/815/418/815418065-5dbe91b1cbb37_articlex)
4.  继续看日志，如下图，service在eureka上注册成功：
![在这里插入图片描述](https://image-static.segmentfault.com/122/130/12213046-5dbe91ba6f992_articlex)
综上所述，使用docker官方推荐的wait-for-it.sh来控制java应用的启动顺序是可行的，可以按照业务自身的需求来量身定做合适的启动顺序；
### wait-for-it.sh方案的缺陷

使用docker官方推荐的wait-for-it.sh来控制容器启动顺序，虽然已满足了我们的需求，但依旧留不是完美方案，留下的缺陷还是请您先知晓吧，也许这个缺陷会对您的系统产生严重的负面影响：
1. 再开启一个SSH连接，登录到实战的linux电脑上，执行命令docker exec eureka ps -ef，将eureka容器内的进程打印出来，如下所示，java进程的PID等于1：

[root@maven ~]# docker exec eureka ps -ef
UID PID PPID C STIME TTY TIME CMD
root 1 0 2 07:04 ? 00:00:48 java -Xms1g -Xmx1g -cp /app/resources:/app/classes:/app/libs/* com.bolingcavalry.waitforitdemo.EurekaApplication
root 56 0 0 07:25 ? 00:00:00 /bin/bash
root 63 0 0 07:31 ? 00:00:00 ps -ef

2. 再来看看service的进程情况，执行命令docker exec service ps -ef，将service容器内的进程打印出来，如下所示，PID等于1的进程不是java，而是启动时的shell命令：

[root@maven ~]# docker exec service ps -ef
UID PID PPID C STIME TTY TIME CMD
root 1 0 0 07:04 ? 00:00:00 sh -c ./wait-for-it.sh eureka:8080 -t 0 -- java -Xms1g -Xmx1g -cp /app/resources:/app/classes:/app/libs/* com.bolingcavalry.waitforitdemo.ServiceApplication
root 7 1 1 07:04 ? 00:00:32 java -Xms1g -Xmx1g -cp /app/resources:/app/classes:/app/libs/* com.bolingcavalry.waitforitdemo.ServiceApplication
root 107 0 0 07:33 ? 00:00:00 ps -ef

3. 通常情况下，在执行命令docker stop xxx停止容器时，只有PID=1的进程才会收到"SIGTERM"信号量，所以在使用docker stop停止容器时，eureka容器中的java进程收到了"SIGTERM"可以立即停止，但是service容器中的java进程收不到"SIGTERM"，因此只能等到默认的10秒超时时间到达的时候，被"SIGKILL"信号量杀死，不但等待时间长，而且优雅停机的功能也用不上了；
4. 您可以分别输入docker stop eureka和docker stop service来感受一下，前者立即完成，后者要等待10秒。
5. 我的shell技能过于平庸，目前还找不到好的解决办法让service容器中的java进程取得1号进程ID，个人觉得自定义entrypoint.sh脚本来调用wait-for-it.sh并且处理"SIGTERM"说不定可行，如果您有好的办法请留言告知，在此感激不尽；
6. 目前看来，控制容器启动顺序最好的解决方案并非wait-for-it.sh，而是业务自己实现容错，例如service注册eureka失败后会自动重试，但是这对业务的要求就略高了，尤其是在复杂的分布式环境中更加难以实现；
7. docker官方推荐使用wait-for-it.sh脚本的文章地址是：https://docs.docker.com/compose/startup-order/ ，文章末尾显示了顶和踩的数量，如下图，顶的数量是145，踩的数量达到了563，一份官方文档居然这么不受待见，也算是开了眼界，不知道和我前面提到的1号PID问题有没有关系：
![在这里插入图片描述](https://image-static.segmentfault.com/404/481/404481406-5dbe91bc601e1_articlex)
至此，java应用的容器顺序控制实战就完成了，希望您在对自己的应用做容器化的时候，此文能给您提供一些参考。