目录
一、Pod控制器介绍
二、ReplicaSet(RS)
1、介绍
2、创建ReplicaSet
3、扩缩容
4、镜像升级
5、删除ReplicaSet
三、Deployment(Deploy)
1、基础
2、创建deployment
3、扩缩容
4、镜像更新
5、版本回退
6、金丝雀发布
四、HPA
1、安装metrics-server
2、准备deployment和service
3、部署HPA
五、DaemonSet(DS)
1、介绍和适用场景
2、DaemonSet资源清单
3、实例演示
六、Job
1、Job介绍
2、Job资源清单文件
3、实例演示
七、CronJob(CJ)
1、介绍
2、CronJob资源清单
3、实例演示
Pod是kubernetes的最小管理单元,在kubernetes中,按照pod的创建方式可以将其分为两类:
自主式pod:kubernetes直接创建出来的Pod,这种pod删除后就没有了,也不会重建
控制器创建的pod:kubernetes通过控制器创建的pod,这种pod删除了之后还会自动重建
什么是Pod控制器?
Pod控制器是管理pod的中间层,使用Pod控制器之后,只需要告诉Pod控制器,想要多少个什么样的Pod就可以了,它会创建出满足条件的Pod并确保每一个Pod资源处于用户期望的目标状态。如果Pod资源在运行中出现故障,它会基于指定策略重新编排Pod。
在kubernetes中,有很多类型的pod控制器,每种都有自己的适合的场景,常见的Pod控制器类型有下面这些:
ReplicationController:比较原始的pod控制器,已经被废弃,由ReplicaSet替代
ReplicaSet:保证副本数量一直维持在期望值,并支持pod数量扩缩容,镜像版本升级
Deployment:通过控制ReplicaSet来控制Pod,并支持滚动升级、回退版本
Horizontal Pod Autoscaler:可以根据集群负载自动水平调整Pod的数量,实现削峰填谷
DaemonSet:在集群中的指定Node上运行且仅运行一个副本,一般用于守护进程类的任务
Job:它创建出来的pod只要完成任务就立即退出,不需要重启或重建,用于执行一次性任务
Cronjob:它创建的Pod负责周期性任务控制,不需要持续后台运行,用于执行周期性任务
StatefulSet:管理有状态应用
ReplicaSet的主要作用是保证一定数量的pod正常运行,它会持续监听这些Pod的运行状态,一旦Pod发生故障,就会重启或重建。同时它还支持对pod数量的扩缩容和镜像版本的升降级。
ReplicaSet的资源清单文件:
apiVersion: apps/v1 # 版本号
kind: ReplicaSet # 类型
metadata: # 元数据
name: # rs名称
namespace: # 所属命名空间
labels: #标签
controller: rs
spec: # 详情描述
replicas: 3 # 副本数量
selector: # 选择器,通过它指定该控制器管理哪些pod
matchLabels: # Labels匹配规则
app: nginx-pod
matchExpressions: # Expressions匹配规则
- {key: app, operator: In, values: [nginx-pod]}
template: # 模板,当副本数量不足时,会根据下面的模板创建pod副本
metadata:
labels:
app: nginx-pod
spec:
containers:
- name: nginx
image: nginx:1.17.1
ports:
- containerPort: 80
在这里面,需要新了解的配置项就是spec
下面几个选项:
replicas:指定副本数量,其实就是当前rs创建出来的pod的数量,默认为1
selector:选择器,它的作用是建立pod控制器和pod之间的关联关系,采用的Label Selector机制
在pod模板上定义label,在控制器上定义选择器,就可以表明当前控制器能管理哪些pod了
template:模板,就是当前控制器创建pod所使用的模板板,里面其实就是前面学过的pod的定义
如上资源清单可以分为三个部分:
创建pc-replicaset.yaml文件,内容如下:
apiVersion: apps/v1
kind: ReplicaSet
metadata:
name: pc-replicaset
namespace: dev
spec:
replicas: 3
selector:
matchLabels:
app: nginx-pod
template:
metadata:
labels:
app: nginx-pod
spec:
containers:
- name: nginx
image: nginx:1.17.1
创建rs:
kubectl create -f pc-replicaset.yaml
查看rs信息:
# DESIRED:期望副本数量
# CURRENT:当前副本数量
# READY:已经准备好提供服务的副本数量
kubectl get rs pc-replicaset -n dev -o wide
查看当前控制器创建出来的pod:
# 这里发现控制器创建出来的pod的名称是在控制器名称后面拼接了-xxxxx随机码
kubectl get pod -n dev
方法1:
编辑rs副本数量,修改spec:replicas: 6即可
kubectl edit rs pc-replicaset -n dev
查看pod:
kubectl get pods -n dev
方法2:
可以直接使用命令实现
使用scale命令实现扩缩容, 后面--replicas=n直接指定目标数量即可
kubectl scale rs pc-replicaset --replicas=2 -n dev
查看pod:
kubectl get pods -n dev
方法1:
编辑rs的容器镜像 - image: nginx:1.17.2
kubectl edit rs pc-replicaset -n dev
再次查看,发现镜像版本已经变更了
kubectl get rs -n dev -o wide
方法2:
同样,也可以使用命令完成这个工作
格式:kubectl set image rs rs名称 容器=镜像版本 -n namespace
kubectl set image rs pc-replicaset nginx=nginx:1.17.1 -n dev
查看Pod:
kubectl get rs -n dev -o wide
使用kubectl delete命令会删除此RS以及它管理的Pod
在kubernetes删除RS前,会将RS的replicasclear调整为0,等待所有的Pod被删除后,在执行RS对象的删除
kubectl delete rs pc-replicaset -n dev
kubectl get pod -n dev -o wide
如果希望仅仅删除RS对象(保留Pod),可以使用kubectl delete命令时添加--cascade=false选项,即只删除控制器,不删除Pod(此方式不推荐,因为pod就是管理容器的,应该一起删):
kubectl delete rs pc-replicaset -n dev --cascade=false
也可以使用yaml直接删除(推荐):
kubectl delete -f pc-replicaset.yaml
为了更好的解决服务编排的问题,kubernetes在V1.2版本开始,引入了Deployment控制器。值得一提的是,这种控制器并不直接管理pod,而是通过管理ReplicaSet来简介管理Pod,即:Deployment管理ReplicaSet,ReplicaSet管理Pod。所以Deployment比ReplicaSet功能更加强大。
Deployment主要功能有下面几个:
支持ReplicaSet的所有功能
支持发布的停止、继续
支持滚动升级和回滚版本
Deployment的资源清单文件:
apiVersion: apps/v1 # 版本号
kind: Deployment # 类型
metadata: # 元数据
name: # rs名称
namespace: # 所属命名空间
labels: #标签
controller: deploy
spec: # 详情描述
replicas: 3 # 副本数量
revisionHistoryLimit: 3 # 保留历史版本,默认是10,用于版本回退时使用
paused: false # 暂停部署,默认是false,即deployment创建好后是否立即开始部署和创建pod
progressDeadlineSeconds: 600 # 部署超时时间(s),默认是600
strategy: # 策略
type: RollingUpdate # 滚动更新策略
rollingUpdate: # 滚动更新
maxSurge: 30% # 最大额外可以存在的副本数,可以为百分比,也可以为整数
maxUnavailable: 30% # 最大不可用状态的 Pod 的最大值,可以为百分比,也可以为整数
selector: # 选择器,通过它指定该控制器管理哪些pod
matchLabels: # Labels匹配规则
app: nginx-pod
matchExpressions: # Expressions匹配规则
- {key: app, operator: In, values: [nginx-pod]}
template: # 模板,当副本数量不足时,会根据下面的模板创建pod副本
metadata:
labels:
app: nginx-pod
spec:
containers:
- name: nginx
image: nginx:1.17.1
ports:
- containerPort: 80
同样,上述资源清单可以分为三部分,spec以上是deployment信息;spec的replicas到selector是副本数量、镜像更新策略、标签选择器(会和下面的Pod做关联)等;template及以下是Pod配置信息。
创建pc-deployment.yaml,内容如下:
apiVersion: apps/v1
kind: Deployment
metadata:
name: pc-deployment
namespace: dev
spec:
replicas: 3
selector:
matchLabels:
app: nginx-pod
template:
metadata:
labels:
app: nginx-pod
spec:
containers:
- name: nginx
image: nginx:1.17.1
创建deployment
kubectl create -f pc-deployment.yaml
查看deployment:
# READY 当前可用pod数/总pod数
# UP-TO-DATE 最新版本的pod的数量
# AVAILABLE 当前可用的pod的数量
kubectl get deploy pc-deployment -n dev
查看rs:
发现rs的名称是在原来deployment的名字后面添加了一个10位数的随机串,可以证明deployment是通过控制ReplicaSet来控制Pod:
kubectl get rs -n dev
查看pod:
对比上面查看rs的name可以看到,下面的pod是在rs名称后面又加了个随机串:
kubectl get pods -n dev
方法1:命令方式
# 变更副本数量为5个
kubectl scale deploy pc-deployment --replicas=5 -n dev
#查看deployment
kubectl get deploy pc-deployment -n dev
查看pod:
kubectl get pods -n dev
方法2:编辑deploy方式
编辑deployment的副本数量,修改spec:replicas: 4即可
kubectl edit deploy pc-deployment -n dev
查看pod:
kubectl get pods -n dev
deployment支持两种更新策略:重建更新
和滚动更新
:
可以通过strategy
指定策略类型,支持两个属性:
strategy:指定新的Pod替换旧的Pod的策略, 支持两个属性:
type:指定策略类型,支持两种策略
Recreate:重建更新,在创建出新的Pod之前会先杀掉所有已存在的Pod
RollingUpdate:滚动更新,就是杀死一部分,就启动一部分,在更新过程中,存在两个版本Pod
rollingUpdate:当type为RollingUpdate时生效(如果是重建更新则不需要此参数),用于为RollingUpdate设置参数,支持两个属性:
maxUnavailable:用来指定在升级过程中不可用Pod的最大数量,默认为25%。即如果有8个Pod,先干掉8x25%=2个。
maxSurge: 用来指定在升级过程中可以超过期望的Pod的最大数量,默认为25%。即如果有8个Pod,先升级8x25%=2个。
4.1、重建更新
编辑pc-deployment.yaml,在spec节点下添加更新策略:
spec:
strategy: # 策略
type: Recreate # 重建更新
变更后完整yaml文件如下:
apiVersion: apps/v1
kind: Deployment
metadata:
name: pc-deployment
namespace: dev
spec:
strategy: #镜像更新策略
type: Recreate #重建更新策略
replicas: 3
selector:
matchLabels:
app: nginx-pod
template:
metadata:
labels:
app: nginx-pod
spec:
containers:
- name: nginx
image: nginx:1.17.1
提交镜像更新策略:
kubectl apply -f pc-deployment.yaml
为方便更好观察,再打开一个master终端,用于Pod持续监控(在node1节点执行如下命令):
kubectl get pods -n dev -w
然后回到原终端,进行镜像更新(下面采用命令更新方式,两种方式都可以):
kubectl set image deploy pc-deployment nginx=nginx:1.17.2 -n dev
然后回到持续查看终端的Pod变化:
如上图可以看到,是一次性先删除全部老版本Pod,然后立即创建同等数量的新版本Pod。
4.2、滚动更新
编辑pc-deployment.yaml,在spec节点下添加更新策略:
spec:
strategy: # 策略
type: RollingUpdate # 滚动更新策略
rollingUpdate:
maxSurge: 25%
maxUnavailable: 25%
变更后完整yaml文件如下:
apiVersion: apps/v1
kind: Deployment
metadata:
name: pc-deployment
namespace: dev
spec:
strategy: #镜像更新策略
type: RollingUpdate #滚动更新策略
rollingUpdate:
maxSurge: 25%
maxUnavailable: 25%
replicas: 3
selector:
matchLabels:
app: nginx-pod
template:
metadata:
labels:
app: nginx-pod
spec:
containers:
- name: nginx
image: nginx:1.17.1
提交变更后的yaml配置:
kubectl apply -f pc-deployment.yaml
同样另起终端,监控Pod变化:
kubectl get pods -n dev -w
回到原终端,进行镜像更新(下面采用命令更新方式,两种方式都可以):
kubectl set image deploy pc-deployment nginx=nginx:1.17.3 -n dev
可以看到,是先删除一个旧版本,再立即创建新版本,然后再删除一个旧版本,再创建一个新版本,以此类推。
滚动更新的过程:
镜像更新中rs的变化:
# 查看rs,发现原来的rs的依旧存在,只是pod数量变为了0,而后又新产生了一个rs,pod数量为3
# 其实这就是deployment能够进行版本回退的奥妙所在,后面会详细解释
# 更新的过程是先生成一个新版本的rs控制器,然后在新版本rs控制器下新创建新版本Pod,滚动更新替换老rs
# 控制器下的老版本Pod,直至全部替换,但是老版本的rs控制器不会删除,依然存在,用于版本回退
kubectl get rs -n dev
deployment支持版本升级过程中的暂停、继续功能以及版本回退等诸多功能,下面具体来看.
kubectl rollout: 版本升级相关功能,支持下面的选项:
status 显示当前升级状态
history 显示 升级历史记录
pause 暂停版本升级过程
resume 继续已经暂停的版本升级过程
restart 重启版本升级过程
undo 回滚到上一级版本(可以使用--to-revision回滚到指定版本)
下面演示一下status、history、undo选项,使用上面的pc-deployment.yaml重新创建:
# 先删除
kubectl delete -f pc-deployment.yaml
# 创建,--record参数是指记录变更状态,如果不加下面kubectl rollout status会看不到变更详情
kubectl create -f pc-deployment.yaml --record
#升级
kubectl set image deploy pc-deployment nginx=nginx:1.17.2 -n dev
查看当前升级版本的状态:
kubectl rollout status deploy pc-deployment -n dev
查看升级历史记录:
kubectl rollout history deploy pc-deployment -n dev
如上图,可以发现有2次版本记录,说明完成过1次升级,其中第一列是版本号。
版本回滚:
回滚之前先看下当前nginx版本:
kubectl get deploy -n dev -o wide
开始回退,这里直接使用--to-revision=1回滚到了1版本, 如果省略这个选项,就是回退到上个版本,就是1版本:
#回退至1版本
kubectl rollout undo deployment pc-deployment --to-revision=1 -n dev
#查看回退后的版本
kubectl get deploy -n dev -o wide
再次查看历史升级记录:
kubectl rollout history deploy pc-deployment -n dev
如上图可以看到,1版本已经没有了,因为刚刚已经回退至1版本,现在的版本3就是之前的版本1
Deployment控制器支持控制更新过程中的控制,如“暂停(pause)”或“继续(resume)”更新操作。
比如有一批新的Pod资源创建完成后立即暂停更新过程,此时,仅存在一部分新版本的应用,主体部分还是旧的版本。然后,再筛选一小部分的用户请求路由到新版本的Pod应用,继续观察能否稳定地按期望的方式运行。确定没问题之后再继续完成余下的Pod资源滚动更新,否则立即回滚更新操作。这就是所谓的金丝雀发布。
下面开始具体操作:
a、更新deployment的版本,并配置暂停deployment
kubectl set image deploy pc-deployment nginx=nginx:1.17.3 -n dev && kubectl rollout pause deployment pc-deployment -n dev
b、 观察状态
# 观察rs状态
kubectl get rs -n dev
如上图可以看到,老版本rs上还是3个,新版本rs控制器已经有新创建的一组Pod,但是并不会删除被替换的Pod,就是因为使用了pause暂停命令。
查看更新状态:
kubectl rollout status deploy pc-deployment -n dev
如上图可以看到,处于正在等待更新状态,而且目前已经有1个更新完毕,一共有3个需要更新。这时候就会有一部分流量往完成更新的pod上访问。
c、如果没有问题,那就可以继续更新:
kubectl rollout resume deploy pc-deployment -n dev
可以看到更新过程如下,已经完成全部更新:
d、查看全部更新后状态
kubectl get rs -n dev
kubectl get deploy -n dev -o wide
最后如果需要删除deployment:
kubectl delete -f pc-deployment.yaml
在前面的介绍中,我们已经可以实现通过手工执行kubectl scale
命令实现Pod扩容或缩容,但是这显然不符合Kubernetes的定位目标--自动化、智能化。 Kubernetes期望可以实现通过监测Pod的使用情况,实现pod数量的自动调整,于是就产生了Horizontal Pod Autoscaler(HPA)这种控制器。
HPA可以获取每个Pod利用率,然后和HPA中定义的指标进行对比,同时计算出需要伸缩的具体值,最后实现Pod的数量的调整。其实HPA与之前的Deployment一样,也属于一种Kubernetes资源对象,它通过追踪分析RC控制的所有目标Pod的负载变化情况,来确定是否需要针对性地调整目标Pod的副本数,这是HPA的实现原理。
下面进行实例演示:
# 安装git
yum install git -y
# 获取metrics-server, 注意使用的版本
git clone -b v0.3.6 https://github.com/kubernetes-incubator/metrics-server
如果github无法打开或者下载失败,可以从如下百度云链接下载:
链接:https://pan.baidu.com/s/15mUL8wr59rXaAYWtByDIpg?pwd=1234
提取码:1234
将metrics-server-0.3.6.zip文件下载到master节点并解压。
cd /root/metrics-server-0.3.6/deploy/1.8+/
vim metrics-server-deployment.yaml
按途中添加或修改下面选项:
hostNetwork: true
image: registry.cn-hangzhou.aliyuncs.com/google_containers/metrics-server-amd64:v0.3.6
args:
- --kubelet-insecure-tls
- --kubelet-preferred-address-types=InternalIP,Hostname,InternalDNS,ExternalDNS,ExternalIP
追加和更改的地方已标注在下图:
修改完成后,开始安装metrics-server:
# 在/root/metrics-server-0.3.6/deploy/1.8+ 目录下执行
kubectl apply -f ./
查看Pod运行情况:
kubectl get pod -n kube-system
使用kubectl top node 查看资源使用情况(需要稍微等待一会再执行):
kubectl top node
查看Pod资源使用情况:
kubectl top pod -n kube-system
至此,metrics-server安装完成
准备service是为了后面的压力测试,外部流量访问需要通过service将请求转发到Pod
创建pc-hpa-pod.yaml:
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx
namespace: dev
spec:
strategy: # 策略
type: RollingUpdate # 滚动更新策略
replicas: 1
selector:
matchLabels:
app: nginx-pod
template:
metadata:
labels:
app: nginx-pod
spec:
containers:
- name: nginx
image: nginx:1.17.1
resources: # 资源配额
limits: # 限制资源(上限)
cpu: "1" # CPU限制,单位是core数
requests: # 请求资源(下限)
cpu: "100m" # CPU限制,单位是core数
创建deployment:
kubectl create -f pc-hpa-pod.yaml
创建service:
# --type-NodePort类型表示集群外部节点也可以访问
kubectl expose deployment nginx --type=NodePort --port=80 -n dev
查看创建的deploy和pod
kubectl get deploy,pod,svc -n dev
创建pc-hpa.yaml文件,内容如下:
apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
name: pc-hpa
namespace: dev
spec:
minReplicas: 1 #最小pod数量
maxReplicas: 10 #最大pod数量
targetCPUUtilizationPercentage: 3 # CPU使用率指标
scaleTargetRef: # 指定要控制的nginx信息
apiVersion: /v1
kind: Deployment
name: nginx
yaml文件参数说明:上述文件可分为2个部分,apiVersion到metadata是hpa自身信息设置部分,下面是spec部分,其中minReplicas和maxReplicas是Pod数量的上下限设置部分,targetCPUUtilizationPercentage是pod的cpu使用率指标,超过设置的指标,hpa会执行pod增加动作,来减少pod总体cpu使用率,scaleTargetRef表示当前要操作的伸缩对象是谁,即hpa要控制的是叫nginx的Deployment下面的,即hpa通过控制Deployment来控制Pod。
创建hpa:
kubectl create -f pc-hpa.yaml
查看hpa:
kubectl get hpa -n dev
如上图,MINPODS和MAXPODS显示的是最小和最大Pod数量,TARGETS后面的3%是设置的cpu指标,超过这个指标hpa会增加pod,前面的
测试:
在发起压测测试前另起几个终端进行监视:
kubectl get pods -n dev -w
kubect get hpa -n dev -w
kubectl get deployment -n dev -w
然后使用postman对10.104.100.76:32043发起10000条访问请求,并观察pod情况:
hpa变化:
deployment变化:
pod变化:
如上图可以看到随着pod的cpu占用率的增加,pod的数量也随之增加,当停止postman访问后,过一段时间后hpa检测到cpu占用率下降,会逐渐减少pod数量。
DaemonSet类型的控制器可以保证在集群中的每一台(或指定)节点上都运行一个副本。一般适用于日志收集、节点监控等场景。也就是说,如果一个Pod提供的功能是节点级别的(每个节点都需要且只需要一个),那么这类Pod就适合使用DaemonSet类型的控制器创建。
DaemonSet控制器的特点:
每当向集群中添加一个节点时,指定的 Pod 副本也将添加到该节点上
当节点从集群中移除时,Pod 也就被垃圾回收了
apiVersion: apps/v1 # 版本号
kind: DaemonSet # 类型
metadata: # 元数据
name: # rs名称
namespace: # 所属命名空间
labels: #标签
controller: daemonset
spec: # 详情描述
revisionHistoryLimit: 3 # 保留历史版本
updateStrategy: # 更新策略
type: RollingUpdate # 滚动更新策略
rollingUpdate: # 滚动更新
maxUnavailable: 1 # 最大不可用状态的 Pod 的最大值,可以为百分比,也可以为整数
selector: # 选择器,通过它指定该控制器管理哪些pod
matchLabels: # Labels匹配规则
app: nginx-pod
matchExpressions: # Expressions匹配规则
- {key: app, operator: In, values: [nginx-pod]}
template: # 模板,当副本数量不足时,会根据下面的模板创建pod副本
metadata:
labels:
app: nginx-pod
spec:
containers:
- name: nginx
image: nginx:1.17.1
ports:
- containerPort: 80
如上,同样可以分为3部分,apiVersion到metadata是DaemonSet自身的信息;spec包含一些更新策略、标签选择器等;template是要控制的Pod的模板信息。
创建pc-daemonset.yaml,内容如下:
apiVersion: apps/v1
kind: DaemonSet
metadata:
name: pc-daemonset
namespace: dev
spec:
selector:
matchLabels:
app: nginx-pod
template:
metadata:
labels:
app: nginx-pod
spec:
containers:
- name: nginx
image: nginx:1.17.1
创建daemonset:
kubectl create -f pc-daemonset.yaml
查看daemonset:
kubectl get ds -n dev -o wide
查看Pod,发现在每个node上都运行一个pod:
kubectl get pods -n dev -o wide
删除daemonset:
kubectl delete -f pc-daemonset.yaml
Job,主要用于负责批量处理(一次要处理指定数量任务)短暂的一次性(每个任务仅运行一次就结束)任务。Job特点如下:
当Job创建的pod执行成功结束时,Job将记录成功结束的pod数量
当成功结束的pod达到指定的数量时,Job将完成执行
(上面2个特点的意思总结就是job可以控制指定数量的一次性任务执行完成,执行一个一次性任务就需要创建一个Pod,即执行多少个任务,Job就会创建运行多少个pod)
apiVersion: batch/v1 # 版本号
kind: Job # 类型
metadata: # 元数据
name: # rs名称
namespace: # 所属命名空间
labels: #标签
controller: job
spec: # 详情描述
completions: 1 # 指定job需要成功运行Pods的次数。默认值: 1,即需要运行多少个任务(1个任务1个pod)
parallelism: 1 # 指定job在任一时刻应该并发运行Pods的数量。默认值: 1,比如一共需要6个pod,这里设置为3,即一次运行3个,分为2轮运行完毕
activeDeadlineSeconds: 30 # 指定job可运行的时间期限,超过时间还未结束,系统将会尝试进行终止。
backoffLimit: 6 # 指定job失败后进行重试的次数。默认是6
manualSelector: true # 是否可以使用selector选择器选择pod,默认是false
selector: # 选择器,通过它指定该控制器管理哪些pod
matchLabels: # Labels匹配规则
app: counter-pod
matchExpressions: # Expressions匹配规则
- {key: app, operator: In, values: [counter-pod]}
template: # 模板,当副本数量不足时,会根据下面的模板创建pod副本
metadata:
labels:
app: counter-pod
spec:
restartPolicy: Never # 重启策略只能设置为Never或者OnFailure
containers:
- name: counter
image: busybox:1.30
command: ["bin/sh","-c","for i in 9 8 7 6 5 4 3 2 1; do echo $i;sleep 2;done"]
关于重启策略设置的说明:
如果指定为OnFailure,则job会在pod出现故障时重启容器,而不是创建pod,failed次数不变
如果指定为Never,则job会在pod出现故障时创建新的pod,并且故障pod不会消失,也不会重启,failed次数加1
如果指定为Always的话,就意味着一直重启,意味着job任务会重复去执行了,当然不对,所以不能设置为Always
创建pc-job.yaml,内容如下:
apiVersion: batch/v1
kind: Job
metadata:
name: pc-job
namespace: dev
spec:
manualSelector: true
selector:
matchLabels:
app: counter-pod
template:
metadata:
labels:
app: counter-pod
spec:
restartPolicy: Never
containers:
- name: counter
image: busybox:1.30
command: ["bin/sh","-c","for i in 9 8 7 6 5 4 3 2 1; do echo $i;sleep 3;done"]
创建job:
kubectl create -f pc-job.yaml
另起两个终端分别观察job和pod:
kubectl get job -n dev -o wide -w
kubectl get pods -n dev -w
如上2图可以看到,job状态截图中,COMPLETIONS的前面数字是已完成的任务次数,后面的数字是总任务次数,在pod状态截图中可以看到任务在第1秒运行,第28秒运行完毕。
接下来,调整下pod运行的总数量和并行数量 即:修改pc-job.yaml,在spec下设置下面两个选项
completions: 6 # 指定job需要成功运行Pods的次数为6
parallelism: 3 # 指定job并发运行Pods的数量为3
然后重新运行job,观察效果,此时会发现,job会每次运行3个pod,总共执行了6个pod
apiVersion: batch/v1
kind: Job
metadata:
name: pc-job
namespace: dev
spec:
manualSelector: true
completions: 6 #一共创建6个一次性任务,即6个pod
parallelism: 3 #允许3个并行执行
selector:
matchLabels:
app: counter-pod
template:
metadata:
labels:
app: counter-pod
spec:
restartPolicy: Never
containers:
- name: counter
image: busybox:1.30
command: ["bin/sh","-c","for i in 9 8 7 6 5 4 3 2 1; do echo $i;sleep 3;done"]
删除原来创建的:
kubectl delete -f pc-job.yaml
重新创建并打开监控:
如上可以看到,3个为一轮创建一共6个任务
CronJob控制器以 Job控制器资源为其管控对象,并借助它管理pod资源对象,Job控制器定义的作业任务在其控制器资源创建之后便会立即执行,但CronJob可以以类似于Linux操作系统的周期性任务作业计划的方式控制其运行时间点及重复运行的方式。也就是说,CronJob可以在特定的时间点(反复的)去运行job任务。
apiVersion: batch/v1beta1 # 版本号
kind: CronJob # 类型
metadata: # 元数据
name: # rs名称
namespace: # 所属命名空间
labels: #标签
controller: cronjob
spec: # 详情描述
schedule: # cron格式的作业调度运行时间点,用于控制任务在什么时间执行
concurrencyPolicy: # 并发执行策略,用于定义前一次作业运行尚未完成时是否以及如何运行后一次的作业
failedJobHistoryLimit: # 为失败的任务执行保留的历史记录数,默认为1
successfulJobHistoryLimit: # 为成功的任务执行保留的历史记录数,默认为3
startingDeadlineSeconds: # 启动作业错误的超时时长
jobTemplate: # job控制器模板,用于为cronjob控制器生成job对象(crontabjob是通过job去管理的);下面其实就是job的定义
metadata:
spec:
completions: 1
parallelism: 1
activeDeadlineSeconds: 30
backoffLimit: 6
manualSelector: true
selector:
matchLabels:
app: counter-pod
matchExpressions: 规则
- {key: app, operator: In, values: [counter-pod]}
template:
metadata:
labels:
app: counter-pod
spec:
restartPolicy: Never
containers:
- name: counter
image: busybox:1.30
command: ["bin/sh","-c","for i in 9 8 7 6 5 4 3 2 1; do echo $i;sleep 20;done"]
参数解释:
需要重点解释的几个选项:
schedule: cron表达式,用于指定任务的执行时间
*/1 * * * *
<分钟> <小时> <日> <月份> <星期>
分钟 值从 0 到 59.
小时 值从 0 到 23.
日 值从 1 到 31.
月 值从 1 到 12.
星期 值从 0 到 6, 0 代表星期日
多个时间可以用逗号隔开; 范围可以用连字符给出;*可以作为通配符; /表示每...
concurrencyPolicy:
Allow: 允许Jobs并发运行(默认)
Forbid: 禁止并发运行,如果上一次运行尚未完成,则跳过下一次运行
Replace: 替换,取消当前正在运行的作业并用新作业替换它
创建pc-cronjob.yaml,内容如下:
apiVersion: batch/v1beta1
kind: CronJob
metadata:
name: pc-cronjob
namespace: dev
labels:
controller: cronjob
spec:
schedule: "*/1 * * * *" #每分钟执行一次
jobTemplate:
metadata:
spec:
template:
spec:
restartPolicy: Never
containers:
- name: counter
image: busybox:1.30
command: ["bin/sh","-c","for i in 9 8 7 6 5 4 3 2 1; do echo $i;sleep 3;done"]
创建cronjob:
kubectl create -f pc-cronjob.yaml
查看cronjob
kubectl get cronjobs -n dev -w
查看job:
kubectl get jobs -n dev -w
查看pod:
kubectl get pods -n dev -w
对比上面的job介绍可以看到,job是一次性任务,cronjob是在指定时间点可以多次执行的周期性重复任务。