Docker 是CS架构,这就意味着 Client 和 Server 可以在不同的主机上。在构建镜像的时候,Client 会把所有需要的文件打包发送给 Server,这些发送的文件叫做 build context
默认情况下,构建上下文中所有的文件都会被打包发送给 Docker deamon,但是我们可以使用 .dockerignore 来忽略 build context 中的某些路径和文件,从而避免发送不必要的数据内容,从而加快镜像的创建过程,特别是远程构建的时候
When you run a build command, the build client looks for a file named .dockerignore
in the root directory of the context. If this file exists, the files and directories that match patterns in the files are removed from the build context before it’s sent to the builder.
如果你有多个 Dockerfile,你可以为每一个 Dockerfile 指定一个 ignore 文件。为了达到这样的目的,我们需要遵循特定的命名规范:" Place your ignore-file in the same directory as the Dockerfile, and prefix the ignore-file with the name of the Dockerfile":
.dockerignore 的忽略规则如下
and foo/bar
来排除某些文件,即使他们匹配 .dockerignore 文件中的规则。*
:匹配任意数量的目录(包括零个)。 **/*.go
会排除 build context 中所有 .go 结尾的文件!
:用于排除特定文件或目录,即使它们被之前的模式匹配。构建镜像后可以发现,/data 目录下只有,而 file.txt 被忽略了
Dockerfile 多阶段构建的规则如下:
“With multi-stage builds, you use multiple FROM
statements in your Dockerfile. Each FROM
instruction can use a different base, and each of them begins a new stage of the build. You can selectively copy artifacts from one stage to another, leaving behind everything you don’t want in the final image.”
“When using multi-stage builds, you aren’t limited to copying from stages you created earlier in your Dockerfile. You can use the COPY --from
instruction to copy from a separate image. The Docker client pulls the image if necessary and copies the artifact from there”
也就是说,每一个 FROM
都对应着一个 stage 的开始,通过使用 COPY --from
指令,就可以将之前 stage 中的文件拷贝到当前的 stage。
那么 --from 后面的内容是什么?换句话说,如何区分每一个 build stage?你可以用数字表示,第一个 FROM
对应的数字为 0,以此往后递增。但是你可以在 FROM
后面添加 AS
完成多阶段构建后,最终镜像只会包含最后一个 stage 的内容,这样我们镜像的空间就可以保证最终生成的镜像只包括运行应用所需要的最小化环境。默认情况会停在最后一个 stage,当然你也可以停在指定的 build stage
例如使用下面的 build 指令中,最后构建阶段会停在名为 “build” 的构建阶段
我们的构建目标如下,编写一段 C 语言程序,然后编译成可执行文件:
替换为更轻量的镜像 busybox 时遇到这样的问题:
libc, the standard C library, provides the C and POSIX APIs to Linux programs and is an intrinsic part of the Linux system. Most Linux distributions are based on glibc, the GNU C library. However, both Alpine Linux and BusyBox images are based on musl standard C library, which is generally incompatible with glibc.
Consequently, executables that are built on glibc-based distros such as Ubuntu, Debian or Arch Linux, won’t work out of the box on Alpine Linux or BusyBox.
Dockerfile中每一行的指令都会创建一层 “image layer”,这些 layer 就像是 stack 一样, 后来 的“栈”堆在先来的栈“”上
在执行每条指令之前,docker 都会在 cache 中查找是否有可重用的 layer,如果有则会直接重用该层 layer,如果没有,那么之后的 layer 都需要 rebuild,不管之后操作是否相同, layer 的内容是否相同
上面这个 Dockerfile 并不是高效的,如果本地文件发生修改,COPY . .
因为,我们可以将上面的 COPY 指令一分为二。首先拷贝包管理文件(package.json 和 yarn.lock),然后安装依赖。最后再将项目的源文件(经常修改的部分)拷贝进来,执行 build 命令
经过这样的修改后,只要我们的包管理文件没有发生修改,npm install 这一层的内容是可以使用缓存的,省去了执行 npm install 的时间
下面是一个实操案例,在容器中编写编译运行一段 C 语言代码:
在没有缓存的情况下,我们构建用时 67.3 s
修改 hello.c 的内容后,再次构建。用时 30 多s也不少啊?这是因为我们修改 hello.c 后,COPY 指令以及之后的内容都不能使用缓存,需要重新执行,而之前的指令可以复用缓存,可以看到右边的耗时都是 0s
镜像层数越少意味着发生修改时,需要重建的 layers 层数越少,那么你的构建也会越快。如果希望所生成镜像的层数尽量少,可以遵循下面的建议:
apt get update && apt install
尽量写到一行使用 exec form 的优势如下: