Docker容器和镜像存储机制介绍

本文主要介绍Docker容器(Container)和镜像(Image)是如何进行数据存储的。

容器如何读写文件

镜像(Image)是由若干个层(Layer)所组成的,当用户使用image运行了一个container之后,就会在这个image的最上面再加上一个可读可写的layer,如下图所示:

除了最上面那一个layer是可读写的之外,下面的所有layer都是属于image的,都是只读的。
在container运行时,任何在container文件系统中写入和修改的数据都会被写入到最上层的可读写layer(这里不包括volume、bind mount和tmpfs这些持久化存储手段),并不会影响到下面的那些只读layer。当container运行结束的时候,最上层的可读写layer就会被丢弃,而下面的那些只读layer是属于image的,并不会受到影响。
这也就是为什么使用同一个image运行container,该container结束之后,重新使用该image启动一个新的container,上一个container写入和修改的数据全都不见了,用户能看见的依旧是当初编写Dockerfile时写入该image的那些数据的原因。
如果使用同一个image启动了多个container,那么这些container会有各自的最上层的可读写layer,但是下面的那些只读layer是共用的,如下图所示:
Docker容器和镜像存储机制介绍_第1张图片

镜像的layer管理

一个image的多个layer并不是绑定和存储在一起的,它们之间是低耦合的。
使用docker pull命令拉取一个image的时候,并不是一次性拉取的,而是一个layer一个layer地拉取,然后存储在本机(在linux上默认是/var/lib/docker//下)。
一台主机中存在多个image时,有可能会出现多个image的某些layer相同的情况,那么此时在主机中就只会存储一份该layer,而不是存储多个。
那么问题来了:既然多个layer是分开存储的,那么用户在container中却可以看到所有的layer中存储的文件,这又是怎么做到的呢?这就涉及到了union file system和union mount。
可以通过docker image history以及docker image inspect来查看某个image的所有layer。

Copy On Write

当container想要更改原本就存在于image中的那些数据的时候该怎么办呢?那些数据是位于下面那些属于image的只读层的,因此肯定不能直接修改。Docker采用的解决方案一般是copy-on-write。
当container想要读取原本就存在于image中的数据时,直接从数据所在的只读layer读取即可。而如果想要修改原本就存在于image中的数据时,Docker就会先把要被修改的文件拷贝到最上层的属于container的可读写layer中,然后再在这个可读写的layer中进行数据的修改即可。
值得一提的是,哪怕是对文件的元数据(meta data)的修改(例如修改文件权限、所属用户等等),也会触发copy-on-write机制。
Docker有多种存储引擎(storage driver),不同的storage driver对copy-on-write的具体实现是不一样的。
注意:并不是所有的Docker存储引擎都支持copy on write的,例如vfs就不支持!

查看容器占用磁盘大小

使用docker ps -s来查看一个container在运行时占用的磁盘大小,例如:
image.png
SIZE指的是该container最上层的可读写layer的大小,而virtual指的是启动了该container的image的那些只读layer的大小。
需要注意的是,通过这个命令得到的container磁盘空间大小是不包括以下这些的:

  • log文件所使用的磁盘空间
  • volume和bind mount所使用的磁盘空间
  • container的配置文件所使用的磁盘空间
  • 内存交换所使用的磁盘空间
  • Checkpoints所使用的磁盘空间

Docker存储引擎

Docker在linux下提供了如下的存储引擎选项:

存储引擎 描述
overlay2 在linux上首选的存储引擎,不需要额外的配置
fuse-overlayfs 推荐在运行rootless的Docker时使用
btrfs和zfs 可以提供更多的功能,例如快照等等,但是需要额外的配置
vfs 目前仍处于测试中,用于不支持copy on write的文件系统中,性能堪忧,不推荐使用在生产环境中
devicemapper 在生产环境中需要direct-lvm的支持

可以通过docker info命令来查看自己使用的Docker用的是哪一个storage driver:
image.png
上图中使用的storage driver是overlay2。

参考资料

https://docs.docker.com/storage/storagedriver/

你可能感兴趣的:(Docker容器和镜像存储机制介绍)