Docker 从入门到放弃(一):Docker 简介

1、Docker 是什么
解释 docker 之前,我们要从操作系统说起,操作系统就是管理计算机的硬件软件和资源,并且为软件运行提供通用服务的系统软件。

  • 硬件管理,包括分配CPU时间、内存;从网络、存储设备等IO设备读写数据。
  • 软件管理,就是各种软件的运行,线程、进程调度之类的工作。
  • 为软件提供运行环境,这个运行环境通常一部分由操作系统内核(Kernel)提供,另一部分由运行库(Runtime Library)提供。

硬件、操作系统、应用程序之间的关系用下图表示:
Docker 从入门到放弃(一):Docker 简介_第1张图片

随着硬件的性能提升,以及软件种类的丰富,有两种情况变得很常见:

  1. 硬件性能过剩——很多计算机的硬件配置,即使不能完全满足峰值性能的要求,也往往会有大量时间处于硬件资源闲置的状态。例如一般家用电脑,已经是四核、六核的配置了,除了3A游戏、视频制作、3D渲染、高性能计算等特殊应用外,通常有90%以上时间CPU是闲置的。
  2. 软件冲突——因为业务需要,两个或者多个软件之间冲突,或者需要同一个软件的不同版本。例如早几年做web前端的,要测试网页在不同版本的IE上是否能正常显示,然而Windows只能装一个版本的IE。

为了解决软件冲突,只能配置多台计算机,或者很麻烦的在同一台电脑上安装多个操作系统,通过重启来进行切换。显然这两个方案都有其缺点:多台计算机成本太高,多操作系统的安装、切换都很麻烦。在硬件性能过剩的时候,硬件虚拟化的普及就很自然而然的提出来了。

硬件虚拟化:就是某个特殊的软件,仿真出一台或者多台计算机的各种硬件,用户可以在这一台虚拟机上安装、运行操作系统(一般叫来宾操作系统,Guest OS)和各种应用,并且把Guest OS和上面应用软件对硬件资源的访问转发到底层的硬件上来实现。著名的 VMware 就是这么一个软件。

虚拟机的一个缺点在于Guest OS通常会占用不少硬件资源。例如Windows安装开机不运行任何运用,就需要占用2 - 3G内存,20 - 30G硬盘空间。即使是没有图形界面的Linux,根据发行版以及安装软件的不同也会占用100 - 1G内存,1 - 4G硬盘空间。而且为了应用系统运行的性能,往往还要给每台虚拟机留出更多的内存容量。

这时候为了避免资源的浪费,避免包括运行库在内的软件冲突,容器的概念就被提了出来,在Linux可以通过控制组(Control Group,通常简写为cgroup)隔离,并把应用和运行库打包在一起,来解决资源浪费和软件冲突。
Docker 从入门到放弃(一):Docker 简介_第2张图片
Docker 把 App 和 Lib 的文件打包成为一个镜像,并且采用类似多次快照的存储技术,可以实现:

  1. 多个App可以共用相同的底层镜像(初始的操作系统镜像)
  2. App运行时的IO操作和镜像文件隔离;
  3. 通过挂载包含不同配置/数据文件的目录或者卷(Volume),单个App镜像可以同时用来运行无数个不同业务的容器。
    Docker 从入门到放弃(一):Docker 简介_第3张图片
    上图是基于一个Alpine Linux的镜像,分别建立了Nginx和MySQL的镜像,并且挂载不同的配置/数据同时运行3个网站应用3个数据库应用的示意图。大家需要注意,Docker 本身并不是容器,它是创建容器的工具,是应用容器引擎。

Docker 是一个开源的应用容器引擎,基于 Go 语言 并遵从 Apache2.0 协议开源。
Docker 可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化。
容器是完全使用沙箱机制,相互之间不会有任何接口(类似 iPhone 的 app),更重要的是容器性能开销极低。

2、Docker 的好处
启动速度快;资源占用少,利用率高,性能开销小;超轻量级;软件开源,社区活跃

3、Docker 的应用场景
简化配置;快速部署;应用隔离;整合服务器;提高开发效率;Web 应用的自动化打包和发布;自动化测试和持续集成、发布。

4、Docker 的三个基本概念

  • 镜像(Image)
  • 容器(Container)
  • 仓库(Repository)

镜像:操作系统分为内核和用户空间。对于 Linux 而言,内核启动后,会挂载 root 文件系统为其提供用户空间支持。而 Docker 镜像(Image),就相当于是一个 root 文件系统。Docker 镜像是一个特殊的文件系统,除了提供容器运行时所需的程序、库、资源、配置等文件外,还包含了一些为运行时准备的一些配置参数(如匿名卷、环境变量、用户等)。镜像不包含任何动态数据,其内容在构建之后也不会被改变

容器:镜像(Image)和容器(Conatiner)的关系就像是面向对象的类和实例一样,镜像是静态的定义,容器是镜像运行的实体,容器可以被创建,启动,停止,删除,暂停等。容器的实质是进程,但是又和宿主的进程不同,容器有自己的独立命名空间,因此容器拥有自己 root 文件系统,自己的网络配置,自己的进程空间,甚至自己的用户 ID 空间。容器内的进程是运行在一个隔离的环境里,使用起来,就好像是在一个独立于宿主的系统下操作一样。所以好多初学者都会把容器和虚拟机搞混。容器同样和镜像一样使用分层存储,以镜像为基础层,在上面创建了一个容器存储层,是为了容器运行时读写准备的。注意,在容器被删除后,容器存储层保存的任何信息都不会保存,它和容器的生命周期一样,所以任何需要保存的数据 Docker 建议保存在数据卷(Volumes)或者宿主机目录中,这样数据不会随着容器的消失而消失。

仓库:镜像构建完成后,可以很容易的在当前宿主机上运行,但是,如果需要在其它服务器上使用这个镜像,我们就需要一个集中的存储、分发镜像的服务,Docker Registry 就是这样的服务。

一个 Docker Registry 可以有多个 仓库(Repository),每个仓库可以含多个标签(Tag),每个标签都是一个镜像。

最初我没有搞懂 Docker Registry 和 仓库(Repository),简单来说就是 Docker Registry 是注册服务器,用于管理镜像仓库,起到服务器的作用,仓库(Repository)就是存储镜像,起到存储镜像的作用。默认的 Docker Registry 就是 Docker Hub,其中拥有很多高质量的镜像。

你可能感兴趣的:(Docker)