K8S中的资源管理

K8S中的资源管理是通过pod的reources-requests和reources-limits进行的。

首先K8S中的资源分为两类：

可压缩资源。就是cpu这种，特点是当资源不足时，Pod 只会“饥饿”，但不会退出
不可压缩资源，就是内存这种。当内存不足时，Pod 就会因为 OOM（Out-Of-Memory）被内核杀掉

requests & limits

    spec:
      containers:
      - name: hostnames
        image: mirrorgooglecontainers/serve_hostname
        resources:
          requests:
            cpu: 100m
            memory: 100Mi
          limits:
            cpu: 100m
            memory: 100Mi

由于 Pod 可以由多个 Container 组成，所以 CPU 和内存资源的限额，是配置在每个Container 的定义上的。这样，Pod 整体的资源配置，就由这些 Container 的配置值累加得到

cpu:100m

指的就是 100 millicpu，也就是 0.1 个 CPU 的意思。这样，这个容器只就会被分配到 1 个 CPU 10%的计算能力

也可以写成 cpu：0.1。但是推荐100m 的写法，毕竟这才是 Kubernetes 内部通用的 CPU 表示方式

Kubernetes 里为 CPU 设置的单位是“CPU 的个数”。比如，cpu=1 指的就是，这个 Pod 的 CPU 限额是 1 个 CPU。当然，具体“1 个 CPU”在宿主机上如何解释，是 1个 CPU 核心，还是 1 个 vCPU，还是 1 个 CPU 的超线程（Hyperthread），完全取决于宿主机的 CPU 实现方式。Kubernetes 只负责保证 Pod 能够使用到“1 个 CPU”的计算能力

memory: 100Mi

内存的单位这里用的是Mi

Mi和M的区别

1Mi=1024*1024；1M=1000*1000

requests & limits的区别

这两者的区别其实非常简单：

在调度的时候，kube-scheduler 是均价 requests 的值进行计算。

而在真正设置 Cgroup参数的时候 kubelet 则会按照 limits 的值来进行设置

也就是requests 是在调度时使用，limit是进行资源限制使用。

QoS级别

根据不同的 requests 和 limits 的设置方式，k8s会将这个 Pod 划分到不同的 QoS 级别当中

Guaranteed 类别：

Pod 里的每一个 Container 都同时设置了 requests 和 limits，并且 requests 和limits 值相等的时候，k8s会将这个pod的qosClass 字段设置为Guaranteed。

比如上面的例子。

image-20221207142436863.png

需要注意的是，当 Pod 仅设置了 limits 没有设置 requests 的时候，Kubernetes 会自动为它设置与 limits 相同的 requests 值，所以，这也属于 Guaranteed

Burstable 类别

不满足 Guaranteed类别的条件，还设置了request参数。常见的情况就是request和limit不相等。

BestEffort类别

request和limit参数都没有任何配置，就是BestEffort

区分这三种级别有什么用处呢

当宿主机资源紧张的时候，kubelet 对 Pod 进行Eviction资源回收时需要用到的。

具体地说，当 Kubernetes 所管理的宿主机上不可压缩资源短缺时，就有可能触发Eviction。比如，可用内存（memory.available）、可用的宿主机磁盘空间。

而当 Eviction 发生的时候，kubelet 具体会挑选哪些 Pod 进行删除操作，就需要参考这些Pod 的 QoS 类别了

首先干掉BestEffort级别的，然后是Burstable 类别，最后才是Guaranteed 类别。

绑核cpuset

可以通过设置 cpuset 把容器绑定到某个 CPU 的核上

这种情况下，由于操作系统在 CPU 之间进行上下文切换的次数大大减少，容器里应用的性能会得到大幅提升。

事实上，cpuset 方式，是生产环境里部署在线应用类型的 Pod 时，非常常用的一种方式

听起来很高级，在k8s做到却很简单。只需要两步

Pod 的配置是 Guaranteed 的 QoS 类型
CPU 资源的 requests 和 limits 设置为同一个相等的整数值

比如：

        resources:
          requests:
            cpu: 2
            memory: 100Mi
          limits:
            cpu: 2
            memory: 100Mi

这时候，该 Pod 就会被绑定在 2 个独占的 CPU 核上。当然，具体是哪两个 CPU 核，是由kubelet 为你分配的。