Docker数据管理,镜像创建与分层结构

一、Docker的数据管理

        管理Docker 容器中数据主要有两种方式:数据卷(Data Volumes) 和数据卷容器(DataVolumes Containers)。

1.数据卷

数据卷是一个供容器使用的特殊目录,位于容器中。可将宿主机的目录挂载到数据卷上,对数据卷的修改操作立刻可见,并且更新数据不会影响镜像,从而实现数据在宿主机与容器之间的迁移。数据卷的使用类似于Linux下对目录进行的mount操作。

docker pull centos:7

#宿主机目录/var/www 挂载到容器中的/data1.
注意:宿主机本地目录的路径必须是使用绝对路径。如果路径不存在,Docker会自动创建相应的路径。
docker run -v /var/www:/data1 --name web1 -it centos:7 /bin/bash    #-v选项可以在容器内创建数据卷
ls
echo "this is web1" > /data1/abc.txt
exit

#返回宿主机进行查看
cat /var/www/abc.txt

2.数据卷容器

如果需要在容器之间共享一些数据,最简单的方法就是使用数据卷容器。数据卷容器是一个普通的容器,专门提供数据卷给其他容器挂载使用。

#创建一个容器作为数据卷容器
docker run --name web2 -v /data1 -v /data2 -it centos:7 /bin/bash
echo "this is web2" > /data1/abc.txt
echo "THIS IS WEB2" > /data2/ABC.txt

#使用--volumes-from来挂载web2容器中的数据卷到新的容器
docker run -it --volumes-from web2 --name web3 centos:7 /bin/bash
cat /data1/abc.txt
cat /data2/ABC.txt

二、容器互联(使用centos镜像)

容器互联是通过容器的名称在容器间建立一条专门的网络通信隧道。简单点说,就是会在源容器和接收容器之间建立一条隧道,接收容器可以看到源容器指定的信息。

#创建并运行源容器取名web1
docker run -itd -P --name web1 centos:7 /bin/bash

#创建并运行接收容器取名web2,使用--1ink选项指定连接容器以实现容器互联
docker run -itd -P --name web2 --link web1:web1 centos:7 /bin/bash     #--link容器名:连接的别名

#进web2容器,ping web1
docker exec -it web2 bash
ping web1

三、Docker 镜像的创建

创建镜像有三种方法,分别为基于已有镜像创建、基于本地模板创建以及基于Dockerfile创建

1.基于现有镜像创建

(1) 首先启动一个镜像,在容器里做修改

docker create -it centos:7 /bin/bash 

docker ps -a
CONTAINER ID  IMAGE       COMMAND      CREATED         STATUS    PORTS   NAMES
000550eb36da  centos: 7   "/bin/bash"  3 seconds ago   Created           gracious_ bassi

(2)然后将修改后的容器提交为新的镜像,需要使用该容器的ID号创建新镜像

docker commit -m "new" -a "centos" 000550eb36da centos:test
#常用选项:
-m说明信息;
-a作者信息;
-p生成过程中停止容器的运行。

docker images

2.基于本地模板创建

通过导入操作系统模板文件可以生成镜像,模板可以从OPENVZ开源项目下载,下 载地址为
http://openvz.org/Download/template/precreated

wget http://download.openvz.org/template/precreated/debian-7.0-x86-minimal.tar.gz

#导入为镜像
cat debian-7.0-x86-minimal.tar.gz | docker import - debian:test

3.基于Dockerfile 创建

(1)联合文件系统(UnionFS )

  1. UnionFS(联合文件系统) : Union文 件系统(UnionFS)是一种分层、轻量级并且高性能的文件系统,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下。AUFS、 OberlayFS及Devicemapper 都是一种UnionFS。
  2. Union文件系统是Docker镜像的基础。镜像可以通过分层来进行继承,基于基础镜像(没有父镜像),可以制作各种具体的应用镜像。
  3. 特性:一次同时加载多个文件系统,但从外面看起来,只能看到一个文件系统,联合加载会把各层文件系统叠加起来,这样最终的文件系统会包含所有底层的文件和目录。
  4. 我们下载的时候看到的一层层的就是联合文件系统
     

(2)镜像加载原理

  1. Docker的镜像实际上由一层一层的文件系统组成,这种层级的文件系统就是UnionFS。
  2. bootfs主要包含bootloader和kernel,bootloader主 要是引导加载kernel,Linux刚启动时会加载bootfs文件系统。
  3. 在Docker镜像的最底层是bootfs,这一- 层与我们典型的Linux/Unix系统是一样的,包含boot加载器和内核。当boot加载完成之后整个内核就都在内存中了,此时内存的使用权已由bootfs转交给内核,此时系统也会卸载bootfs。
  4. rootfs,在bootfs之 上。包含的就是典型Linux系统中的/dev, /proc, /bin, /etc等标准目录和文件。rootfs就 是各种不同的操作系统发行版,比如Ubuntu, Centos等等。
  5. 我们可以理解成一开始内核里什么都没有,操作-一个命令下载debian,这时就会在内核上面加了–层基础镜像;再安装–个emacs,会在基础镜像上叠加一层image; 接着再安装一个apache, 又会在images.上面再叠加一层image。 最后它们看起来就像一个文件系统即容器的rootfs。在Docker的体系里把这些root f s叫做Docker的镜像。但是,此时的每一层rootfs都是read-only的,我们此时还不能对其进行操作。当我们创建一个容器,也就是将Docker镜像进行实例化,系统会在一层或是多层read-only的rootfs之上分配一层空的read-write的rootfs。
     

(3)为什么Docker里的centos的大小才200M?

        因为对于精简的0s,rootfs可以很小, 只需要包含最基本的命令、工具和程序库就可以了,因为底层直接用宿主机的kernel,自己只需要提供rootfs就可以了。由此可见对于不同的linux发行版,bootfs基本是一致的, rootfs会有差别,因此不同的发行版可以公用bootfs。

(4)Dockerfile

  1. Docker镜像是一个特殊的 文件系统,除了提供容器运行时所需的程序、库、资源、配置等文件外, 还包含了一些为运 行时准备的一些配置参数(如匿名卷、环境变量、用户等)。镜像不包含任何动态数据,其内容在构建之后也不会被改变。
  2. 镜像的定制实际上就是定制每–层所添加的配置、文件。如果我们可以把每一层修改、安装、构建、操作的命令都写入一个脚本用这个脚本来构建、定制镜像,那么镜像构建透明性的问题、体积的问题就都会解决。这个脚本就是Dockerfile。
  3. Dockerfile是一个文本文件,其内包含了一条条的指令(Instruction),每一条指令构建一层, 因此每一条指令的内容,就是描述该层应当如何构建。有了Dockerfile,当我们需要定制自己额外的需求时,只需在Dockerfile.上添加或者修改指令,重新生成image即可,省去了敲命令的麻烦。
  4. 除了手动生成Docker镜像之外,可以使用Dockerfile自动生成镜像。Dockerfile是由多条的指令组成的文件,其中每条指令对应Linux中的一条命令,Docker 程序将读取Dockerfile中的指令生成指定镜像。
  5. Dockerfile结构大致分为四个部分:基础镜像信息、维护者信息、镜像操作指令和容器启动时执行指令。Dockerfile每 行支持一条指令,每条指令可携带多个参数,支持使用以“#“号开头的注释
     

四、Docker镜像结构的分层

        镜像不是一个单一的文件,而是有多层构成。容器其实是在镜像的最上面加了一层读写层,在运行容器里做的任何文件改动,都会写到这个读写层。如果删除了容器,也就删除了其最上面的读写层,文件改动也就丢失了。Docker使用存储驱动管理镜像每层内容及可读写层的容器层。

  • (1) Dockerfile中的每个指令都会创建一个新的镜像层;
  • (2)镜像层将被缓存和复用;
  • (3)当Dockerfile的指令修改了,复制的文件变化了,或者构建镜像时指定的变量不同了,对应的镜像层缓存就会失效;
  • (4)某一层的镜像缓存失效,它之后的镜像层缓存都会失效;
  • (5)镜像层是不可变的,如果在某一层中添加一个文件,然后在下一层中删除它,则镜像中依然会包含该文件,只是这个文件在Docker容器中不可见了。

你可能感兴趣的:(docker,运维,linux)