前言
当我们需要使用某个容器的时候,通常先从docker hub或其它源上下载对应的镜像,然后通过一条命令就可以将其部署到服务器上,这使得我们能够快速地部署单个镜像。但是,当某一个镜像需要部署成多个不同用途的容器时,那么这些容器的管理就会变得非常麻烦。举例说,假设我现在有一个ubuntu镜像,需要改造它然后安装nginx用来做代理,需要安装tomcat用来做应用服务器等等,如果是有很多镜像需要部署,那么手工修改这些镜像就会变得非常棘手。为此,我们可以在ubuntu镜像的基础上,创建一个nginx镜像,再创建一个tomcat镜像。这样,镜像的功能就单一化了,更容易被部署,能节省大量的时间和精力。
而dockerfile就是解决类似问题的良药。
什么是dockerfile
dockerfile是一个文本文件,定义了构建docker镜像的过程。我们可以使用dockerfile来自定义镜像。
当发现现有的镜像无法满足项目需求时,就可能需要创建一个dockerfile来自定义一个镜像了。创建自定义镜像的流程大同小异:
- 创建一个dockerfile文件,在文件内定义构建过程的指令和配置。
- 通过docker build命令将dockerfile的内容创建成镜像。
- 通过docker run命令使用镜像。
初识dockerfile
以官方的python镜像为例,镜像地址是https://hub.docker.com/_/python,也可以直接在github上查看,地址是https://github.com/docker-library/python。先贴上dockerfile一睹真容
#
# NOTE: THIS DOCKERFILE IS GENERATED VIA "update.sh"
#
# PLEASE DO NOT EDIT IT DIRECTLY.
#
FROM buildpack-deps:buster
# ensure local python is preferred over distribution python
ENV PATH /usr/local/bin:$PATH
# http://bugs.python.org/issue19846
# > At the moment, setting "LANG=C" on a Linux system *fundamentally breaks Python 3*, and that's not OK.
ENV LANG C.UTF-8
# extra dependencies (over what buildpack-deps already includes)
RUN apt-get update && apt-get install -y --no-install-recommends \
libbluetooth-dev \
tk-dev \
uuid-dev \
&& rm -rf /var/lib/apt/lists/*
ENV GPG_KEY E3FF2839C048B25C084DEBE9B26995E310250568
ENV PYTHON_VERSION 3.9.4
RUN set -ex \
\
&& wget -O python.tar.xz "https://www.python.org/ftp/python/${PYTHON_VERSION%%[a-z]*}/Python-$PYTHON_VERSION.tar.xz" \
&& wget -O python.tar.xz.asc "https://www.python.org/ftp/python/${PYTHON_VERSION%%[a-z]*}/Python-$PYTHON_VERSION.tar.xz.asc" \
&& export GNUPGHOME="$(mktemp -d)" \
&& gpg --batch --keyserver hkps://keys.openpgp.org --recv-keys "$GPG_KEY" \
&& gpg --batch --verify python.tar.xz.asc python.tar.xz \
&& { command -v gpgconf > /dev/null && gpgconf --kill all || :; } \
&& rm -rf "$GNUPGHOME" python.tar.xz.asc \
&& mkdir -p /usr/src/python \
&& tar -xJC /usr/src/python --strip-components=1 -f python.tar.xz \
&& rm python.tar.xz \
\
&& cd /usr/src/python \
&& gnuArch="$(dpkg-architecture --query DEB_BUILD_GNU_TYPE)" \
&& ./configure \
--build="$gnuArch" \
--enable-loadable-sqlite-extensions \
--enable-optimizations \
--enable-option-checking=fatal \
--enable-shared \
--with-system-expat \
--with-system-ffi \
--without-ensurepip \
&& make -j "$(nproc)" \
&& make install \
&& rm -rf /usr/src/python \
\
&& find /usr/local -depth \
\( \
\( -type d -a \( -name test -o -name tests -o -name idle_test \) \) \
-o \( -type f -a \( -name '*.pyc' -o -name '*.pyo' -o -name '*.a' \) \) \
\) -exec rm -rf '{}' + \
\
&& ldconfig \
\
&& python3 --version
# make some useful symlinks that are expected to exist
RUN cd /usr/local/bin \
&& ln -s idle3 idle \
&& ln -s pydoc3 pydoc \
&& ln -s python3 python \
&& ln -s python3-config python-config
# if this is called "PIP_VERSION", pip explodes with "ValueError: invalid truth value ''"
ENV PYTHON_PIP_VERSION 21.0.1
# https://github.com/pypa/get-pip
ENV PYTHON_GET_PIP_URL https://github.com/pypa/get-pip/raw/29f37dbe6b3842ccd52d61816a3044173962ebeb/public/get-pip.py
ENV PYTHON_GET_PIP_SHA256 e03eb8a33d3b441ff484c56a436ff10680479d4bd14e59268e67977ed40904de
RUN set -ex; \
\
wget -O get-pip.py "$PYTHON_GET_PIP_URL"; \
echo "$PYTHON_GET_PIP_SHA256 *get-pip.py" | sha256sum --check --strict -; \
\
python get-pip.py \
--disable-pip-version-check \
--no-cache-dir \
"pip==$PYTHON_PIP_VERSION" \
; \
pip --version; \
\
find /usr/local -depth \
\( \
\( -type d -a \( -name test -o -name tests -o -name idle_test \) \) \
-o \
\( -type f -a \( -name '*.pyc' -o -name '*.pyo' \) \) \
\) -exec rm -rf '{}' +; \
rm -f get-pip.py
CMD ["python3"]
通过观察这份dockerfile,我们印证了上一节所说的几个内容:
- dockerfile是一个文本文件,包含了创建一个镜像所需的命令行代码
- dockerfile的每一行都是一个命令集
- docker提供了一系列的标准命令,比如FROM/COPY/RUN/ENV/EXPOSE/CMD等
- docker将通过这些命令自动创建镜像
命令详解
这部分的内容在网上非常多,建议跟随官方文档https://docs.docker.com/engine/reference/builder/
最佳实践
官方有相关的指导文档https://docs.docker.com/develop/develop-images/dockerfile_best-practices/
有如下几点说明:
Create ephemeral containers(构建无状态的容器)
Understand build context(理解上下文,不引入多余文件)
Pipe Dockerfile through stdin(无需上下文的情况,通过stdin构建)
Exclude with .dockerignore(排除context中文件,参见 .dockerignore文件)
Use multi-stage builds(多阶段构建,并合理利用缓存:排序原则->最基础的RUN放在前面)
Don’t install unnecessary packages(不安装不必要的包,中间过程文件,可以删除和clean:rm -rf src/* && yum clean all)
Decouple applications(为了更好管理容器,不推荐在一个容器中部署多个进程)
Minimize the number of layers(减少层数,合并RUN、COPY、ADD、LABEL)
Sort multi-line arguments(为了直观,RUN参数较多时,建议分成多行并排序)
Leverage build cache(同上,多阶段构建合理利用缓存)
Dockerfile instructions(Dockerfile指令优化)