Pod生命周期和探针

Pod的状态

https://kubernetes.io/zh/docs/concepts/workloads/pods/pod-lifecycle/

image

第一阶段:

  • Pending:

    正在创建Pod但是Pod中的容器还没有全部被创建完成,处于此状态的Pod应该检查Pod依赖的存储是否有权限挂载、镜像是否可以下载、调度是否正常等。

  • Failed

    Pod中有容器启动失败而导致pod工作异常。

  • Unknown

    由于某种原因无法获得pod的当前状态,通常是由于与pod所在的node节点通信错误。

  • Succeeded

    Pod中的所有容器都被成功终止即pod里所有的containers均已terminated。

第二阶段:

  • Unschedulable:

    Pod不能被调度,kube-scheduler没有匹配到合适的node节点

  • PodScheduled

    pod正处于调度中,在kube-scheduler刚开始调度的时候,还没有将pod分配到指定的pid,在筛选出合适的节点后就会更新etcd数据,将pod分配到指定的pod

  • Initialized

    所有pod中的初始化容器已经完成了

  • ImagePullBackOff:

    Pod所在的node节点下载镜像失败

  • Running

    Pod内部的容器已经被创建并且启动。

  • Ready

    表示pod中的容器已经可以提供访问服务

容器重启策略

Pod 的 spec 中包含一个 restartPolicy 字段,其可能取值包括 Always、OnFailure 和 Never。默认值是 Always。

restartPolicy:

* Always:当容器异常时,k8s自动重启该容器,ReplicationController/Replicaset/Deployment。
* OnFailure:当容器失败时(容器停止运行且退出码不为0),k8s自动重启该容器。
* Never:不论容器运行状态如何都不会重启该容器,Job或CronJob。

restartPolicy 适用于 Pod 中的所有容器。restartPolicy 仅针对同一节点上 kubelet 的容器重启动作。当 Pod 中的容器退出时,kubelet 会按指数回退 方式计算重启的延迟(10s、20s、40s、...),其最长延迟为 5 分钟。 一旦某容器执行了 10 分钟并且没有出现问题,kubelet 对该容器的重启回退计时器执行 重置操作。

containers:
    - name: magedu-tomcat-app1-container
        image: harbor.magedu.local/magedu/tomcat-app1:v1
        #command: ["/apps/tomcat/bin/run_tomcat.sh"]
        #imagePullPolicy: IfNotPresent
        imagePullPolicy: Always
        ports:
        - containerPort: 8080
            protocol: TCP
            name: http
        env:
        - name: "password"
            value: "123456"
        - name: "age"
            value: "18"
        resources:
            limits:
                cpu: 1
                memory: "512Mi"
            requests:
                cpu: 500m
                memory: "512Mi"
restartPolicy: Always

容器探针

探针类型

  • livenessProbe

    存活探针,检测容器容器是否正在运行,如果存活探测失败,则kubelet会杀死容器,并且容器将受到其重启策略的影响,如果容器不提供存活探针,则默认状态为 Success,livenessProbe用户控制是否重启pod。

  • readinessProbe

    就绪探针,如果就绪探测失败,端点控制器将从与Pod匹配的所有Service的端点中删除该Pod的IP地址,初始延迟之前的就绪状态默认为Failure,如果容器不提供就绪探针,则默认状态为 Success,readinessProbe用于控制pod是否添加至service。

探针配置

https://kubernetes.io/zh/docs/tasks/configure-pod-container/configure-liveness-readiness-startup-probes/

探针有很多配置字段,可以使用这些字段精确的控制存活和就绪检测的行为:

  • initialDelaySeconds: 120

    初始化延迟时间,告诉kubelet在执行第一次探测前应该等待多少秒,默认是0秒,最小值是0

  • periodSeconds: 60

    探测周期间隔时间,指定了kubelet应该每多少秒执行一次存活探测,默认是 10 秒。最小值是 1

  • timeoutSeconds: 5

    单次探测超时时间,探测的超时后等待多少秒,默认值是1秒,最小值是1。

  • successThreshold: 1

    从失败转为成功的重试次数,探测器在失败后,被视为成功的最小连续成功数,默认值是1,存活探测的这个值必须是1,最小值是 1。

  • failureThreshold: 3

    从成功转为失败的重试次数,当Pod启动了并且探测到失败,Kubernetes的重试次数,存活探测情况下的放弃就意味着重新启动容器,就绪探测情况下的放弃Pod 会被打上未就绪的标签,默认值是3,最小值是1。

HTTP 探测器可以在 httpGet 上配置额外的字段:

  • host:

    连接使用的主机名,默认是Pod的 IP,也可以在HTTP头中设置 “Host” 来代替。

  • scheme: http

    用于设置连接主机的方式(HTTP 还是 HTTPS),默认是 HTTP。

  • path: /monitor/index.html

    访问 HTTP 服务的路径。

  • httpHeaders:

    请求中自定义的 HTTP 头,HTTP 头字段允许重复。

  • port: 80

    访问容器的端口号或者端口名,如果数字必须在 1 ~ 65535 之间。

livenessProbe和readinessProbe的对比

配置参数一样
livenessProbe #连续探测失败会重启、重建pod,readinessProbe不会执行重启或者重建Pod操作
livenessProbe #连续检测指定次数失败后会将容器置于(Crash LoopBackOff)切不可用,readinessProbe不会
readinessProbe #连续探测失败会从service的endpointd中删除该Pod,livenessProbe不具备此功能,但是会将容器挂起livenessProbe
livenessProbe用户控制是否重启pod,readinessProbe用于控制pod是否添加至service
建议:
两个探针都配置

HTTP探针示例
#apiVersion: extensions/v1beta1
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx-deployment
spec:
replicas: 1
selector:
    matchLabels: #rs or deployment
        app: ng-deploy-80
        #matchExpressions:
        # - {key: app, operator: In, values: [ng-deploy-80,ng-rs-81]}
template:
    metadata:
        labels:
            app: ng-deploy-80
    spec:
        containers:
            - name: ng-deploy-80
            image: nginx:1.17.5
            ports:
                - containerPort: 80
            #readinessProbe:
            livenessProbe:
                httpGet:
                    #path: /monitor/monitor.html
                    path: /index.html
                    port: 80
                initialDelaySeconds: 5
                periodSeconds: 3
                timeoutSeconds: 5
                successThreshold: 1
                failureThreshold: 3
---
apiVersion: v1
kind: Service
metadata:
name: ng-deploy-80
spec:
ports:
    - name: http
    port: 81
    targetPort: 80
    nodePort: 40012
    protocol: TCP
type: NodePort
selector:
    app: ng-deploy-80
TCP探针示例
#apiVersion: extensions/v1beta1
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx-deployment
spec:
replicas: 1
selector:
    matchLabels: #rs or deployment
        app: ng-deploy-80
        #matchExpressions:
        # - {key: app, operator: In, values: [ng-deploy-80,ng-rs-81]}
template:
    metadata:
        labels:
            app: ng-deploy-80
    spec:
        containers:
            - name: ng-deploy-80
            image: nginx:1.17.5
            ports:
                - containerPort: 80
            livenessProbe:
                tcpSocket:
                    port: 80
                    #port: 8080
                initialDelaySeconds: 5
                periodSeconds: 3
                timeoutSeconds: 5
                successThreshold: 1
                failureThreshold: 3
            #readinessProbe:
        
---
apiVersion: v1
kind: Service
metadata:
name: ng-deploy-80
spec:
ports:
    - name: http
    port: 81
    targetPort: 80
    nodePort: 40012
    protocol: TCP
type: NodePort
selector:
    app: ng-deploy-80
ExecAction探针
# 可以基于指定的命令对Pod进行特定的状态检查。
#apiVersion: extensions/v1beta1
apiVersion: apps/v1
kind: Deployment
metadata:
name: redis-deployment
spec:
replicas: 1
selector:
    matchLabels: #rs or deployment
        app: redis-deploy-6379
        #matchExpressions:
        # - {key: app, operator: In, values: [redis-deploy-6379,ng-rs-81]}
template:
    metadata:
        labels:
            app: redis-deploy-6379
    spec:
        containers:
            - name: redis-deploy-6379
            image: redis
            ports:
                - containerPort: 6379
            livenessProbe:
                exec:
                    command:
                        #- /apps/redis/bin/redis-cli
                        - /usr/local/bin/redis-cli
                        - quit
                initialDelaySeconds: 5
                periodSeconds: 3
                timeoutSeconds: 5
                successThreshold: 1
                failureThreshold: 3
            #readinessProbe:
        
---
apiVersion: v1
kind: Service
metadata:
name: redis-deploy-6379
spec:
ports:
    - name: http
    port: 6379
    targetPort: 6379
    nodePort: 40016
    protocol: TCP
type: NodePort
selector:
    app: redis-deploy-6379

你可能感兴趣的:(Pod生命周期和探针)