《深入剖析Kubernetes》学习笔记 —— Custom Resource Definition

最近学习张磊的《深入剖析Kubernetes》,感觉 Kubernetes 编程范式确实优秀,这里总结一下。

1. 声明式 API

API 对象

从 Kubernetes 使用者的角度来看,使用 YAML 文件声明 API 对象,例如一个 cronjob 对象:

apiVersion: batch/v1beta1
kind: CronJob
metadata:
  name: hello
spec:
  schedule: "*/1 * * * *"
  jobTemplate:
    spec:
      template:
        spec:
          containers:
          - name: hello
            image: busybox
            args:
            - /bin/sh
            - -c
            - date; echo Hello from the Kubernetes cluster
          restartPolicy: OnFailure

其中 kind: CronJob 表示 API 资源类型,apiVersion: batch/v1beta1 表示 API 组和 API 版本。(有些 API 资源使用默认分组,比如 Pod、Node)

声明式

“声明式”这种方式相对于“命令式”而言。

首先体现在以 YAML 文件的形式声明 API 对象,而不是进行命令式命令行操作;然而仅仅以 YAML 文件声明还不够,每次替换一下就成了命令式配置文件操作。

“声明式”关键体现在一次能处理多个写操作,并且具备 Merge 能力。

实现方式

以上的表述比较偏概念性,具体看一下声明式 API 的执行过程可能会清晰一些。

还是以上面的 cronjob 为例,yaml 文件提交给 apiserver 后的执行流程如下:

可见 apiserver 并没有执行“命令”,而只是将对象声明写入了 etcd(经过了各种处理后的)。

调谐(Reconcile)过程的逻辑在 controller 中,这就是大名鼎鼎的“控制器模式”,核心逻辑就是如下的“控制循环”:


for {
  实际状态 := 获取集群中对象X的实际状态(Actual State)
  期望状态 := 获取集群中对象X的期望状态(Desired State)
  if 实际状态 == 期望状态{
    什么都不做
  } else {
    执行编排动作,将实际状态调整为期望状态
  }
}

简而言之,k8s 通过 apiserver 声明对象的期望状态,你可以不断修改期望状态,但是在 apiserver 中不会执行编排动作,而仅仅是将期望的状态写入 etcd;真正执行编排动作的是 controller,通过控制循环不断进行调谐,直到期望状态与实际状态达成一致。

控制器的逻辑运行在 kube-controller-manager 中,实现代码在kubernetes/tree/master/pkg/controller中,控制循环的逻辑看似简单,但是实现的细节很多,要处理的情况很复杂。

2. API 扩展

自定义资源

k8s 原生提供了很丰富的 API 资源类型,比如说 Deployment、StatefulSet、DaemonSet 等,每种应对不同的场景,但是总有一些场景是这些通用的类型无法完美支持的。

此时怎么办呢?需要扩展一个新的 API 资源类型。在这里 k8s 又提供了很便捷的插件机制:CRD(Custom Resource Definition)。

以课程中的 Network 为例:

apiVersion: apiextensions.k8s.io/v1beta1
kind: CustomResourceDefinition
metadata:
  name: networks.samplecrd.k8s.io
spec:
  group: samplecrd.k8s.io
  version: v1
  names:
    kind: Network
    plural: networks
  scope: Namespaced

这个 CRD apply 给 apiserver 之后就能声明 Network 资源类型的 API 对象了,比如说声明一个 example-network:

apiVersion: samplecrd.k8s.io/v1
kind: Network
metadata:
  name: example-network
spec:
  cidr: "192.168.0.0/16"
  gateway: "192.168.0.1"

此时通过 kubectl get networks 就能查询到声明的对象,但是没有对应的 controller,所以对集群没有任何的操作。

自定义控制器

自定义控制器的代码可以分为两部分:事件处理模板代码和调谐代码。

事件处理模板代码

其中大部分代码都可以通过kubernetes/code-generator生成。

调谐代码

调谐代码就是具体的编排动作了,知易行难,特别是看了coreos/etcd-operator之后,要处理各种很微妙的场景,但是一旦完善了,就是云原生的完美状态了。

3. Operator

Operator 是管理“有状态应用”的一个解决方案。

听这个名字感觉比较高深,实际上 Operator 就是以 Deployment 类型部署的自定义控制器,在启动时自动声明待编排的自定义资源。

对于构建 Operator,现在有很多封装的很好的工具,比如KubeBuilder 和 OperatorSDK。

你可能感兴趣的:(《深入剖析Kubernetes》学习笔记 —— Custom Resource Definition)