Docker网络,cgroup资源控制

Docker网络,cgroup资源控制

  • 一:Docker 网络
    • 实现原理
    • docker容器的端口映射
      • 1.容器正在创建时
      • 2.容器已经启动时
    • Docker 的网络模式:
    • 网络模式详解:4+1
      • 1.host模式
      • 2.container模式
      • 3.none模式
      • 4.bridge模式
      • 5.自定义网络(自定义bridge模式)
  • 二:资源控制
    • 1.CPU 资源控制
      • (1)设置CPU使用率上限
      • (2)设置CPU资源占用比(设置多个容器时才有效)
      • (3)设置容器绑定指定的CPU
    • 2.对内存使用的限制
      • `-m`(`--memory=`) 选项用于限制容器可以使用的最大内存
      • 限制可用的 swap 大小, `--memory-swap`
    • 3.对磁盘IO配额控制(blkio)的限制
    • 4.docker update 对已经运行的容器修改其配置
  • 三:清理docker占用的磁盘空间
  • 四:docker配置文件介绍
    • 1.daemon.json 配置介绍
    • 2.配置项注意点:

一:Docker 网络

实现原理

Docker使用Linux桥接,在宿主机虚拟一个Docker容器网桥(docker0),Docker启动一个容器时会根据Docker网桥的网段分配给容器一个IP地址,称为Container-IP,同时Docker网桥是每个容器的默认网关。因为在同一宿主机内的容器都接入同一个网桥,这样容器之间就能够通过容器的 Container-IP 直接通信。

docker容器的端口映射

Docker网桥是宿主机虚拟出来的,并不是真实存在的网络设备,外部网络是无法寻址到的,这也意味着外部网络无法直接通过 Container-IP 访问到容器。如果容器希望外部访问能够访问到,可以通过映射容器端口到宿主主机(端口映射),即 docker run 创建容器时候通过 -p 或 -P 参数来启用,访问容器的时候就通过[宿主机IP]:[容器端口]访问容器。

1.容器正在创建时

docker run -d --name test1 -P nginx					#随机映射端口(从32768开始)

docker run -d --name test2 -p 43000:80 nginx		#指定映射端口
docker ps -a

在这里插入图片描述

浏览器访问:http://192.168.50.150:43000 、http://192.168.50.150:32768
Docker网络,cgroup资源控制_第1张图片

2.容器已经启动时

参考文献

想修改或者添加端口时,先停止掉正在运行的容器。

#查看容器的输出和日志信息

docker logs 容器的ID/名称 #关闭容器后还是可以查看日志

Docker网络,cgroup资源控制_第2张图片

Docker 的网络模式:

●Host:容器将不会虚拟出自己的网卡,配置自己的IP等,而是使用宿主机的IP和端口。
●Container:创建的容器不会创建自己的网卡,配置自己的IP,而是和一个指定的容器共享IP、端口范围。
●None:该模式关闭了容器的网络功能。
●Bridge:默认为该模式,此模式会为每一个容器分配、设置IP等,并将容器连接到一个docker0虚拟网桥,通过docker0网桥以及iptables nat 表配置与宿主机通信。
●自定义网络

安装Docker时,它会自动创建三个网络,bridge(创建容器默认连接到此网络)、 none 、host

docker network lsdocker network list			#查看docker网络列表

Docker网络,cgroup资源控制_第3张图片

#使用docker run创建Docker容器时,可以用 --net 或 --network 选项指定容器的网络模式

●host模式:使用 --net=host 指定。
●none模式:使用 --net=none 指定。
●container模式:使用 --net=container:NAME_or_ID 指定。
●bridge模式:使用 --net=bridge 指定,默认设置,可省略。

网络模式详解:4+1

1.host模式

相当于Vmware中的桥接模式,与宿主机在同一个网络中,但没有独立IP地址
Docker使用了Linux的Namespaces技术来进行资源隔离,如PID Namespace隔离进程,Mount Namespace隔离文件系统,Network Namespace隔离网络等。
一个Network Namespace提供了一份独立的网络环境,包括网卡、路由、iptable规则等都与其他的Network Namespace隔离。 一个Docker容器一般会分配一个独立的Network Namespace。 但如果启动容器的时候使用host模式,那么这个容器将不会获得一个独立的Network Namespace, 而是和宿主机共用一个Network Namespace。容器将不会虚拟出自己的网卡、配置自己的IP等,而是使用宿主机的IP和端口。

docker run -itd --name test8 --net=host centos:7 /bin/bash

Docker网络,cgroup资源控制_第4张图片

docker inspect 6ca05aa4a832

Docker网络,cgroup资源控制_第5张图片

2.container模式

在理解了host模式后,这个模式也就好理解了。这个模式指定新创建的容器和已经存在的一个容器共享一个Network Namespace,而不是和宿主机共享。 新创建的容器不会创建自己的网卡,配置自己的IP,而是和一个指定的容器共享IP、端口范围等。同样,两个容器除了网络方面,其他的如文件系统、进程列表等还是隔离的。两个容器的进程可以通过lo网卡设备通信。

docker run -itd --name test3 centos:7 /bin/bash			#--name 选项可以给容器创建一个自定义名称
docker ps -a

Docker网络,cgroup资源控制_第6张图片

docker inspect -f '{{.State.Pid}}' 9045ced3a69f 			#查看容器进程号

在这里插入图片描述

ls -l /proc/6036/ns					#查看容器的进程、网络、文件系统等命名空间编号

Docker网络,cgroup资源控制_第7张图片

docker run -itd --name test4 --net=container:9045ced3a69f centos:7 /bin/bash
docker ps -a

Docker网络,cgroup资源控制_第8张图片

docker inspect -f '{{.State.Pid}}' 98768561e857 

在这里插入图片描述

ls -l /proc/6197/ns #查看可以发现两个容器的 net namespace 编号相同

Docker网络,cgroup资源控制_第9张图片

3.none模式

使用none模式,Docker容器拥有自己的Network Namespace,但是,并不为Docker容器进行任何网络配置。 也就是说,这个Docker容器没有网卡、IP、路由等信息。这种网络模式下容器只有lo回环网络,没有其他网卡。这种类型的网络没有办法联网,封闭的网络能很好的保证容器的安全性。

docker run -ltd --name=test9 --net=none nginx /bin/bash

Docker网络,cgroup资源控制_第10张图片

docker inspect b3a44440ecd5 #查看网络配置

Docker网络,cgroup资源控制_第11张图片

4.bridge模式

bridge模式是docker的默认网络模式,不用–net参数,就是bridge模式。

相当于Vmware中的 nat 模式,容器使用独立network Namespace,并连接到docker0虚拟网卡。通过docker0网桥以及iptables nat表配置与宿主机通信,此模式会为每一个容器分配Network Namespace、设置IP等,并将一个主机上的 Docker 容器连接到一个虚拟网桥上。

(1)当Docker进程启动时,会在主机上创建一个名为docker0的虚拟网桥,此主机上启动的Docker容器会连接到这个虚拟网桥上。虚拟网桥的工作方式和物理交换机类似,这样主机上的所有容器就通过交换机连在了一个二层网络中。

(2)从docker0子网中分配一个IP给容器使用,并设置docker0的IP地址为容器的默认网关。在主机上创建一对虚拟网卡veth pair设备。 veth设备总是成对出现的,它们组成了一个数据的通道,数据从一个设备进入,就会从另一个设备出来。因此,veth设备常用来连接两个网络设备。

(3)Docker将 veth pair 设备的一端放在新创建的容器中,并命名为 eth0(容器的网卡),另一端放在主机中, 以 veth* 这样类似的名字命名, 并将这个网络设备加入到 docker0 网桥中。可以通过 brctl show 命令查看。

(4)使用 docker run -p 时,docker实际是在iptables做了DNAT规则,实现端口转发功能。可以使用iptables -t nat -vnL 查看。

5.自定义网络(自定义bridge模式)

#直接使用bridge模式,是无法支持指定IP运行docker的,例如执行以下命令就会报错

docker run -itd --name test3 --network bridge --ip 172.17.0.10 centos:7 /bin/bash

在这里插入图片描述

//创建自定义网络
#可以先自定义网络,再使用指定IP运行docker

docker network create --subnet=172.18.0.0/16 --opt "com.docker.network.bridge.name"="docker1"  mynetwork

Docker网络,cgroup资源控制_第12张图片

#docker1 为执行 ifconfig -a 命令时,显示的网卡名,如果不使用 --opt 参数指定此名称,那你在使用 ifconfig -a 命令查看网络信息时,看到的是类似 br-110eb56a0b22 这样的名字,这显然不怎么好记。
#mynetwork 为执行 docker network list 命令时,显示的bridge网络模式名称。

docker run -itd --name test6 --net mynetwork --ip 172.18.0.10 centos:7 /bin/bash

docker ps -a 查看test6容器id

Docker网络,cgroup资源控制_第13张图片

docker inspect b0f8bc5b988b 查看ip地址
Docker网络,cgroup资源控制_第14张图片

二:资源控制

Docker 通过 Cgroup 来控制容器使用的资源配额,包括 CPU、内存、磁盘三大方面, 基本覆盖了常见的资源配额和使用量控制。
Cgroup 是 ControlGroups 的缩写,是 Linux 内核提供的一种可以限制、记录、隔离进程组所使用的物理资源(如 CPU、内存、磁盘 IO 等等) 的机制,被 LXC、docker 等很多项目用于实现进程资源控制。Cgroup 本身是提供将进程进行分组化管理的功能和接口的基础结构,I/O 或内存的分配控制等具体的资源管理是通过该功能来实现的。

1.CPU 资源控制

(1)设置CPU使用率上限

Linux通过CFS(Completely Fair Scheduler,完全公平调度器)来调度各个进程对CPU的使用。CFS默认的调度周期是100ms。
我们可以设置每个容器进程的调度周期,以及在这个周期内各个容器最多能使用多少 CPU 时间。

使用 --cpu-period 即可设置调度周期,使用 --cpu-quota 即可设置在每个周期内容器能使用的CPU时间。两者可以配合使用。
CFS 周期的有效范围是 1ms~1s,对应的 --cpu-period 的数值范围是 1000到1000000。
而容器的 CPU 配额必须不小于 1ms,即 --cpu-quota 的值必须 >= 1000。

docker run -itd --name test1 centos:7 /bin/bash
docker ps -a

在这里插入图片描述

cd /sys/fs/cgroup/cpu/docker/9b409ef95b7c277dc25b8e0da520561281155477dbef3db41f108a8ee3bfb67c/

在这里插入图片描述

cat cpu.cfs_quota_us 
cat cpu.cfs_period_us 

在这里插入图片描述

#cpu.cfs_period_us:cpu分配的周期(微秒,所以文件名中用 us 表示),默认为100000。
#cpu.cfs_quota_us:表示该cgroups限制占用的时间(微秒),默认为-1,表示不限制。 如果设为50000,表示占用50000/100000=50%的CPU。

#进行CPU压力测试

docker exec -it 3ed82355f811 /bin/bash
vi /cpu.sh
#!/bin/bash
i=0
while true
do
let i++
done

chmod +x /cpu.sh
./cpu.sh    
# 脚本前台占用,可以另开一个xshell来使用top命令
top					#可以看到这个脚本占了很多的cpu资源

Docker网络,cgroup资源控制_第15张图片

#设置50%的比例分配CPU使用时间上限

docker run -itd --name test6 --cpu-quota 50000 centos:7 /bin/bash	#可以重新创建一个容器并设置限额

在这里插入图片描述

Docker网络,cgroup资源控制_第16张图片

Docker网络,cgroup资源控制_第17张图片

或者

cd /sys/fs/cgroup/cpu/docker/3ed82355f81151c4568aaa6e7bc60ba6984201c119125360924bf7dfd6eaa42b/
echo 50000 > cpu.cfs_quota_us
docker exec -it 3ed82355f811 /bin/bash
./cpu.sh

top					#可以看到cpu占用率接近50%,cgroups对cpu的控制起了效果

#在多核情况下,如果允许容器进程完全占用两个 CPU, 则可以将 cpu-period 设置为 100000( 即 0.1 秒), cpu-quota设置为 200000(0.2 秒)。

(2)设置CPU资源占用比(设置多个容器时才有效)

Docker 通过 --cpu-shares 指定 CPU 份额,默认值为1024,值为1024的倍数。
#创建两个容器为 c1 和 c2,若只有这两个容器,设置容器的权重,使得c1和c2的CPU资源占比为1/3和2/3。

docker run -itd --name c1 --cpu-shares 512 centos:7	
docker run -itd --name c2 --cpu-shares 1024 centos:7

#分别进入容器c1和c2,进行压力测试

docker exec -it c1 /bin/bash
yum install -y epel-release
yum install -y stress
stress -c 4				#产生四个进程,每个进程都反复不停的计算随机数的平方根

#查看容器运行状态(动态更新)

docker stats

Docker网络,cgroup资源控制_第18张图片

可以看到在 CPU 进行时间片分配的时候,容器 c2 比容器 c1 多一倍的机会获得 CPU 的时间片。
但分配的结果取决于当时主机和其他容器的运行状态, 实际上也无法保证容器 c1 一定能获得 CPU 时间片。比如容器 c1 的进程一直是空闲的,那么容器 c2 是可以获取比容器 c1 更多的 CPU 时间片的。极端情况下,例如主机上只运行了一个容器,即使它的 CPU 份额只有 50,它也可以独占整个主机的 CPU 资源。

Cgroups 只在容器分配的资源紧缺时,即在需要对容器使用的资源进行限制时,才会生效。因此,无法单纯根据某个容器的 CPU 份额来确定有多少 CPU 资源分配给它,资源分配结果取决于同时运行的其他容器的 CPU 分配和容器中进程运行情况。

(3)设置容器绑定指定的CPU

#先分配虚拟机4个CPU核数

docker run -itd --name test7 --cpuset-cpus 1,3 centos:7 /bin/bash

#进入容器,进行压力测试

yum install -y epel-release
yum install stress -y
stress -c 4

#退出容器,执行 top 命令再按 1 查看CPU使用情况。

Docker网络,cgroup资源控制_第19张图片

2.对内存使用的限制

-m(--memory=) 选项用于限制容器可以使用的最大内存

docker run -itd --name test15 -m 512m centos:7 /bin/bash

在这里插入图片描述

docker stats

Docker网络,cgroup资源控制_第20张图片

限制可用的 swap 大小, --memory-swap

强调一下,--memory-swap 是必须要与 --memory 一起使用的。

正常情况下,--memory-swap 的值包含容器可用内存和可用 swap。
所以 -m 300m --memory-swap=1g 的含义为:容器可以使用 300M 的物理内存,并且可以使用 700M(1G - 300)的 swap。

如果 --memory-swap 设置为 0 或者 不设置,则容器可以使用的 swap 大小为 -m 值的两倍。
如果 --memory-swap值和 -m 值相同,则容器不能使用 swap。
如果 --memory-swap为 -1,它表示容器程序使用的内存受限,而可以使用的 swap 空间使用不受限制(宿主机有多少 swap 容器就可以使用多少)。

3.对磁盘IO配额控制(blkio)的限制

--device-read-bps:限制某个设备上的读速度bps(数据量),单位可以是kb、mb(M)或者gb。
例:docker run -itd --name test9 --device-read-bps /dev/sda:1M centos:7 /bin/bash

--device-write-bps : 限制某个设备上的写速度bps(数据量),单位可以是kb、mb(M)或者gb。
例:docker run -itd --name test10 --device-write-bps /dev/sda:1mb centos:7 /bin/bash

--device-read-iops :限制读某个设备的iops(次数)

--device-write-iops :限制写入某个设备的iops(次数)

#创建容器,并限制写速度

docker run -it --name test10 --device-write-bps /dev/sda:1mb centos:7 /bin/bash

#通过dd来验证写速度

dd if=/dev/zero of=test.out bs=1M count=10 oflag=direct				#添加oflag参数以规避掉文件系统cache

Docker网络,cgroup资源控制_第21张图片

4.docker update 对已经运行的容器修改其配置

名称 描述
--blkio-weight 阻塞IO (相对权重),介于10到1000之间,0表示禁用(默认禁止)
--cpu-period 限制CPU CFS(完全公平的调度程序)期限
--cpu-quota 限制CPU CFS(完全公平的调度程序)配额
--cpu-rt-period API 1.25+ ,将CPU实时时间限制为微秒
--cpu-rt-runtime API 1.25+ ,将CPU实时运行时间限制为微秒
--cpu-shares, -c CPU份额(相对权重)
--cpus API 1.29+, CPU数量
--cpuset-cpus 允许执行的CPU(0-3,0,1)
--cpuset-mem 允许执行的MEM(0-3,0,1)
--kernel-memory 内核内存限制
--memory-swap 交换限制等于内存加交换,“-1”以启用无限交换
--memory-reservatio 内存软限制
--memory, -m 内存限制
--pids-limit API 1.40+, 调节容器pids限制(-1表示无限制)
--restart 容器退出时重新启动策略以应用

三:清理docker占用的磁盘空间

docker system prune -a		
#可以用于清理磁盘,删除关闭的容器、无用的数据卷和网络

Docker网络,cgroup资源控制_第22张图片

四:docker配置文件介绍

1.daemon.json 配置介绍

{
“graph”: “/data/docker”,
“storage-driver”: “overlay2”,
“insecure-registries”: [“registry.access.redhat.com”,“quay.io”],
“registry-mirrors”: [“https://q2gr04ke.mirror.aliyuncs.com”],
“bip”: “172.24.38.1/24”,
“exec-opts”: [“native.cgroupdriver=systemd”],
“live-restore”: true
}

2.配置项注意点:

#graph: 该关键字未来将被弃用,可以采用 “data-root” 替代
#storage-driver: 存储驱动,即分层文件系统
#insecure-registries: 不安全的docker registries,即使用http协议推拉镜象
#registry-mirrors: 加速站点,一般可以使用阿里、网易云、docker中国(https://registry.docker-cn.com)的地址
#bip: 指定docker bridge地址(不能以.0结尾),生产中建议采用 172.xx.yy.1/24,其中xx.yy为宿主机ip后四位,方便定位问题
#若启动失败,查看 /var/log/message 日志排错
#live-restore 启用实时还原
默认情况下,当Docker守护程序终止时,它将关闭正在运行的容器。从Docker Engine 1.12开始,您可以配置守护程序,以便在守护程序不可用时容器仍在运行。此功能称为实时还原。实时还原选项有助于减少由于守护程序崩溃,计划内的停机或升级而导致的容器停机时间。

使用配置文件 /etc/docker/daemon.json(没有时新建该文件)

{

"insecure-registries": ["192.168.10.7:666"],

"registry-mirrors": ["https://9yhxvwku.mirror.aliyuncs.com"]

"live-restore": true

}

参数说明:

insecure-registries 私有仓库地址

registry-mirrors 镜像加速地址,也就是第三方仓库,也可以改成自己的仓库地址http://192.168.10.7:666,这样docker pull的时候就不用加上私有仓库的地址和端口了。

live-restore 启用实时还原

默认情况下,当Docker守护程序终止时,它将关闭正在运行的容器。从Docker Engine 1.12开始,您可以配置守护程序,以便在守护程序不可用时容器仍在运行。此功能称为实时还原。实时还原选项有助于减少由于守护程序崩溃,计划内的停机或升级而导致的容器停机时间。

将配置添加到守护程序配置文件。在Linux上,默认为/etc/docker/daemon.json

重新加载Docker守护程序

systemctl reload docker

你可能感兴趣的:(docker,docker,网络,容器)