K8S中的资源管理

K8S中的资源管理是通过pod的reources-requests和reources-limits进行的。

首先K8S中的资源分为两类:

  • 可压缩资源。就是cpu这种,特点是当资源不足时,Pod 只会“饥饿”,但不会退出
  • 不可压缩资源,就是内存这种。当内存不足时,Pod 就会因为 OOM(Out-Of-Memory)被内核杀掉

requests & limits

    spec:
      containers:
      - name: hostnames
        image: mirrorgooglecontainers/serve_hostname
        resources:
          requests:
            cpu: 100m
            memory: 100Mi
          limits:
            cpu: 100m
            memory: 100Mi

由于 Pod 可以由多个 Container 组成,所以 CPU 和内存资源的限额,是配置在每个Container 的定义上的。这样,Pod 整体的资源配置,就由这些 Container 的配置值累加得到

cpu:100m

指的就是 100 millicpu,也就是 0.1 个 CPU 的意思。这样,这个容器只就会被分配到 1 个 CPU 10%的计算能力

也可以写成 cpu:0.1。 但是推荐100m 的写法,毕竟这才是 Kubernetes 内部通用的 CPU 表示方式

Kubernetes 里为 CPU 设置的单位是“CPU 的个数”。比如,cpu=1 指的就是,这个 Pod 的 CPU 限额是 1 个 CPU。当然,具体“1 个 CPU”在宿主机上如何解释,是 1个 CPU 核心,还是 1 个 vCPU,还是 1 个 CPU 的超线程(Hyperthread),完全取决于宿主机的 CPU 实现方式。Kubernetes 只负责保证 Pod 能够使用到“1 个 CPU”的计算能力

memory: 100Mi

内存的单位这里用的是Mi

Mi和M的区别

1Mi=1024*1024;1M=1000*1000

requests & limits的区别

这两者的区别其实非常简单:

在调度的时候,kube-scheduler 是均价 requests 的值进行计算。

而在真正设置 Cgroup参数的时候 kubelet 则会按照 limits 的值来进行设置

也就是requests 是在调度时使用,limit是进行资源限制使用。

QoS级别

根据不同的 requests 和 limits 的设置方式,k8s会将这个 Pod 划分到不同的 QoS 级别当中

Guaranteed 类别 :

Pod 里的每一个 Container 都同时设置了 requests 和 limits,并且 requests 和limits 值相等的时候,k8s会将这个pod的qosClass 字段设置为Guaranteed。

比如上面的例子。


image-20221207142436863.png

需要注意的是,当 Pod 仅设置了 limits 没有设置 requests 的时候,Kubernetes 会自动为它设置与 limits 相同的 requests 值,所以,这也属于 Guaranteed

Burstable 类别

不满足 Guaranteed类别的条件,还设置了request参数。常见的情况就是request和limit不相等。

BestEffort类别

request和limit参数都没有任何配置,就是BestEffort

区分这三种级别有什么用处呢

当宿主机资源紧张的时候,kubelet 对 Pod 进行Eviction资源回收时需要用到的 。

具体地说,当 Kubernetes 所管理的宿主机上不可压缩资源短缺时,就有可能触发Eviction。比如,可用内存(memory.available)、可用的宿主机磁盘空间。

而当 Eviction 发生的时候,kubelet 具体会挑选哪些 Pod 进行删除操作,就需要参考这些Pod 的 QoS 类别了

首先干掉BestEffort级别的,然后是Burstable 类别 ,最后才是Guaranteed 类别。

绑核cpuset

可以通过设置 cpuset 把容器绑定到某个 CPU 的核上

这种情况下,由于操作系统在 CPU 之间进行上下文切换的次数大大减少,容器里应用的性能会得到大幅提升。

事实上,cpuset 方式,是生产环境里部署在线应用类型的 Pod 时,非常常用的一种方式

听起来很高级,在k8s做到却很简单。只需要两步

  1. Pod 的配置是 Guaranteed 的 QoS 类型
  2. CPU 资源的 requests 和 limits 设置为同一个相等的整数值

比如:

        resources:
          requests:
            cpu: 2
            memory: 100Mi
          limits:
            cpu: 2
            memory: 100Mi

这时候,该 Pod 就会被绑定在 2 个独占的 CPU 核上。当然,具体是哪两个 CPU 核,是由kubelet 为你分配的。

你可能感兴趣的:(K8S中的资源管理)