咖啡调调。

创建和管理Pod

文章目录

创建和管理Pod

@[toc]

一、什么是Pod

1.Pod 的核心定义

2.Pod 的组成与结构

3.Pod 的生命周期

4.Pod 的使用场景

5.高级特性

二、Pod与容器

1. 为什么使用 Pod 作为 Kubernetes 的最小部署单元？

2. 单一容器 Pod

3. 多容器 Pod

4. 初始化容器（Init Containers）

三、Pod的定义

四、Pod的生命周期

1.Pod 生命周期的阶段

2.关键流程与机制

3.Pod 的重启策略

4.Pod 的状况（Conditions）

5.设计建议与最佳实践

6.示例：完整生命周期配置

五、Pod的健康检查机制

六、创建多容器Pod

七、为Pod及其容器设置资源配额

1.了解资源配额的设置方法

2.为Pod容器设置CPU和内存配额

3.测试资源配额超限

八、实现pod容器的健康检查

Kubernetes将Pod而不是单个容器作为最小的可部署单元。如果要部署应用程序，则必须将它作为容器部署在Pod中。尽管应用程序可以在容器中运行，但在Kubernetes中，容器必须是Pod的一部分。实际使用中很少直接创建Pod，而是使用高层级的负载均衡资源及其控制器来管理Pod副本。但是，工作负载资源使用Pod模板来创建相应的Pod，仍然涉及Pod的配置，因此我们有必要掌握Pod的创建和管理方法。

一、什么是Pod

Pod 是 Kubernetes 中最小的可部署和可管理的计算单元，用于封装一个或多个紧密关联的容器，并为其提供共享的运行环境。以下是关于 Pod 的核心要点：

1.Pod 的核心定义

最小部署单元
Pod 是 Kubernetes 中创建和管理的最小逻辑单元，代表集群中运行的一个应用实例。每个 Pod 包含一个或多个容器（如 Docker 容器），这些容器共享以下资源：
- 网络命名空间：同一 Pod 内的容器共享 IP 地址和端口范围，可通过 localhost 直接通信。
- 存储卷：挂载到 Pod 的存储卷（如 emptyDir、configMap）可被所有容器共享。
- 运行时上下文：包括环境变量、资源配额等。
Pod 与容器的关系
- 单容器 Pod：最常见的模式，将单个容器视为一个独立服务单元。
- 多容器 Pod：适用于需要紧密协作的场景（如主应用容器 + 日志收集 Sidecar 容器），但需谨慎设计以避免过度耦合。

2.Pod 的组成与结构

核心组件
- 容器：运行应用代码的主容器或辅助容器（如 Init 容器）。
- Pause 容器：每个 Pod 启动的第一个容器（又称根容器），负责管理共享命名空间、回收僵尸进程，并为其他容器提供稳定的网络和存储基础。
- 元数据：包括名称、标签（Labels）、命名空间（Namespace）等标识信息。

YAML 定义示例

apiVersion: v1
kind: Pod
metadata:
  name: nginx-pod
  labels:
    app: web
spec:
  containers:
  - name: nginx
    image: nginx:latest
    ports:
    - containerPort: 80
  - name: sidecar
    image: busybox
    command: ["sh", "-c", "tail -f /dev/null"]

通过 kubectl explain pod 可查询字段的详细说明。

3.Pod 的生命周期

阶段与状态
Pod 的生命周期包括以下阶段和状态：

状态	描述
Pending	Pod 已提交但未完成调度或容器镜像下载
Running	容器已创建且至少有一个在运行
Succeeded	所有容器正常终止（退出码为 0）
Failed	至少一个容器异常终止（退出码非 0）
Unknown	无法获取状态（通常因节点通信故障）

关键流程
- 创建流程：用户提交请求 → API Server 存储至 etcd → 调度器分配节点 → kubelet 启动容器。
- 终止流程：发送删除指令 → 执行 preStop 钩子 → 发送 SIGTERM 信号 → 强制终止（宽限期后）。

4.Pod 的使用场景

典型场景
- Web 服务：单容器运行 Nginx、Tomcat 等。
- 批处理任务：通过 Job 或 CronJob 运行一次性任务。
- 微服务协作：多容器协同处理（如主服务 + 监控 Sidecar）。
最佳实践
- 避免直接创建 Pod：通过 Deployment、StatefulSet 等控制器管理 Pod，实现自愈、滚动更新等功能。
- 资源限制：为容器设置 CPU/内存的 requests 和 limits，防止资源争抢。
- 健康检查：配置 livenessProbe 和 readinessProbe 确保应用可用性。

5.高级特性

Init 容器
在应用容器启动前执行初始化任务（如等待数据库就绪），按顺序执行且必须成功。
静态 Pod
由节点上的 kubelet 直接管理，无需通过 API Server，适用于集群组件（如 etcd、kube-apiserver）。
镜像拉取策略
通过 imagePullPolicy 控制镜像更新逻辑（Always、IfNotPresent、Never）。

Pod 是 Kubernetes 编排能力的基石，通过抽象容器间的共享环境简化了复杂应用的部署。理解其生命周期、组成及使用场景，是设计高可用、可扩展服务的关键。

二、Pod与容器

以下是关于 Pod 与容器 的简要介绍，基于您提出的四个方面：

1. 为什么使用 Pod 作为 Kubernetes 的最小部署单元？

抽象容器间的共享环境：Pod 封装多个容器并共享网络、存储等资源，解决容器间需要协作的场景（如直接通过 localhost 通信）。
简化调度：Kubernetes 以 Pod 为粒度调度到节点，避免直接管理单个容器带来的复杂性。
生命周期一致性：Pod 内所有容器同时启停，确保关联服务（如主应用和日志收集 Sidecar）的协同运行。

2. 单一容器 Pod

场景：适用于单个容器即可完成任务的简单应用（如运行一个 Nginx Web 服务器）。
优势：部署简单，资源占用少，是 Kubernetes 最常见的使用模式。

示例

apiVersion: v1
kind: Pod
metadata:
  name: nginx
spec:
  containers:
  - name: nginx
    image: nginx:latest

3. 多容器 Pod

场景

：需要紧密协作的容器组，例如：
- 主应用 + Sidecar：主容器处理业务逻辑，Sidecar 负责日志收集、监控或代理（如 Istio 的服务网格）。
- 数据共享：多个容器挂载同一存储卷，处理同一批数据（如处理文件的转换器与上传器）。
优势：共享网络和存储，减少跨容器通信开销。

示例

spec:
  containers:
  - name: app
    image: my-app
  - name: log-agent
    image: fluentd
    volumeMounts:
    - name: logs
      mountPath: /var/log
  volumes:
  - name: logs
    emptyDir: {}

4. 初始化容器（Init Containers）

作用：在主容器启动前执行初始化任务（如下载依赖、等待数据库就绪），且必须成功退出后才会启动主容器。
特点
- 按顺序执行，前一个 Init 容器成功后才执行下一个。
- 与主容器隔离，不共享文件系统（需通过 Volume 显式共享）。

示例

spec:
  initContainers:
  - name: init-db
    image: busybox
    command: ['sh', '-c', 'until nslookup mysql-service; do echo waiting; sleep 2; done']
  containers:
  - name: app
    image: my-app

Pod 作为最小单元：提供容器间的资源共享与协同管理能力。
单容器 Pod：简单应用的首选。
多容器 Pod：适用于需紧密协作的复杂场景。
初始化容器：确保主容器启动前的依赖条件就绪。

三、Pod的定义

以下是基于 YAML 配置文件 的 Pod 定义详解：

Pod 的 YAML 定义核心字段

apiVersion: v1           # Kubernetes API 版本（Pod 属于核心 API，固定为 v1）
kind: Pod               # 资源类型标识，此处为 Pod
metadata:               # 元数据，描述 Pod 的标识信息
  name: my-pod          # Pod 名称（同一命名空间内唯一）
  namespace: default    # 所属命名空间（默认为 default）
  labels:               # 标签，用于资源筛选和关联
    app: web
    env: dev
spec:                   # Pod 的具体配置规则
  containers:           # 容器列表（必填，至少一个容器）
  - name: nginx         # 容器名称（Pod 内唯一）
    image: nginx:1.25   # 容器镜像地址（必填）
    imagePullPolicy: IfNotPresent  # 镜像拉取策略（Always/Never/IfNotPresent）
    ports:              # 容器暴露的端口（可选，仅用于文档说明，不实际控制端口开放）
    - containerPort: 80
      protocol: TCP
    resources:          # 资源限制与请求
      requests:
        memory: "128Mi"
        cpu: "0.5"
      limits:
        memory: "256Mi"
        cpu: "1"
    volumeMounts:       # 挂载存储卷到容器内路径
    - name: logs-volume
      mountPath: /var/log/nginx
  volumes:              # 定义 Pod 级别的存储卷（供所有容器挂载）
  - name: logs-volume
    emptyDir: {}        # 使用临时空目录作为存储卷

关键字段说明

metadata（元数据）

name：Pod 的唯一名称（命名规则：小写字母、数字或 -，不能以数字开头）。
namespace：Pod 所属的命名空间（默认 default）。
labels：键值对标签，用于筛选和管理 Pod（如 kubectl get pods -l app=web）。

spec（规格配置）

containers

：定义 Pod 中的容器列表（核心配置）：
- name：容器名称（同一 Pod 内唯一）。
- image：容器镜像地址（如 nginx:latest、my-registry/app:v1）。
- imagePullPolicy
  
  ：镜像拉取策略：
  - Always：总是从仓库拉取（默认策略，当镜像标签为 latest 时）。
  - IfNotPresent：本地不存在时拉取。
  - Never：仅使用本地镜像。
- ports：声明容器监听的端口（仅用于文档，实际端口由容器进程决定）。
- resources
  
  ：资源配额（避免资源争抢）：
  - requests：容器启动的最低资源需求（调度依据）。
  - limits：容器运行时的资源上限（超过会被终止或限制）。

volumes 与 volumeMounts

volumes：定义 Pod 级别的存储卷（如 emptyDir、configMap、persistentVolumeClaim）。
volumeMounts：将存储卷挂载到容器的指定路径（如日志目录、配置文件）。

完整示例：多容器 Pod

apiVersion: v1
kind: Pod
metadata:
  name: web-app
  labels:
    app: frontend
spec:
  containers:
  - name: nginx
    image: nginx:1.25
    ports:
    - containerPort: 80
    volumeMounts:
    - name: config
      mountPath: /etc/nginx/conf.d
  - name: log-collector
    image: fluentd:latest
    volumeMounts:
    - name: logs
      mountPath: /var/log/nginx
  volumes:
  - name: config
    configMap:          # 使用 ConfigMap 存储 Nginx 配置
      name: nginx-config
  - name: logs
    emptyDir: {}       # 临时存储卷（Pod 删除后数据丢失）

操作步骤

保存配置到文件（如 pod.yaml）。
创建 Pod：
```
kubectl apply -f pod.yaml
```

查看 Pod 状态：

kubectl get pods -o wide
kubectl describe pod web-app

注意事项

避免直接创建 Pod：推荐使用 Deployment 或 StatefulSet 管理 Pod（支持滚动更新、自愈）。
调试工具：使用 kubectl explain pod 查看字段详细说明。

四、Pod的生命周期

Pod 是 Kubernetes 中最小的可调度单元，其生命周期从创建到终止涉及多个关键阶段和机制。以下是 Pod 生命周期的核心要点及详细说明：

1.Pod 生命周期的阶段

Pod 的状态通过 Phase 字段描述，主要分为以下五个阶段：

阶段	描述
Pending	Pod 已提交但未完成调度或容器镜像下载，可能因资源不足、调度延迟或节点故障导致。
Running	Pod 已调度到节点，且至少有一个容器正在运行（包括初始化容器完成后的主容器）。
Succeeded	所有容器正常终止（退出码为 0），适用于一次性任务（如批处理作业）。
Failed	至少有一个容器异常终止（退出码非 0 或资源耗尽），且不再重启。
Unknown	无法获取 Pod 状态，通常因节点通信故障或 API Server 不可达。

2.关键流程与机制

创建流程

调度与绑定
- API Server 接收创建请求后，由调度器（Scheduler）选择合适节点并绑定。
- 调度门控（SchedulingGates）：通过 .spec.schedulingGates 可延迟调度，直到条件满足（如依赖资源就绪）。
容器初始化
- Init 容器：按顺序执行且必须成功，用于预加载数据、等待依赖服务等。
- 网络与存储准备：创建沙箱环境（Pause 容器），挂载存储卷并配置网络。

运行阶段

主容器启动
- PostStart 钩子：在容器启动后执行（如写入日志或初始化脚本）。
- 探针机制
  - Liveness Probe：检测容器是否存活，失败则重启容器。
  - Readiness Probe：检测容器是否就绪，失败则从服务端点（Endpoint）移除流量。
资源管理
- 通过 resources 字段设置 CPU/内存的请求（requests）和上限（limits），防止资源争抢。

终止流程

优雅终止
1. SIGTERM 信号：通知容器执行清理操作（如关闭数据库连接）。
2. 宽限期：默认 30 秒（可配置 terminationGracePeriodSeconds），超时后强制终止。
3. SIGKILL 信号：强制终止未响应的容器并释放资源（如网络端口、存储卷）。
垃圾回收：删除 Pod 后，关联资源（如临时存储卷）由 Kubernetes 自动清理。

3.Pod 的重启策略

通过 .spec.restartPolicy 定义容器异常退出时的处理方式：

策略	描述
Always	始终重启容器（默认策略，适用于长期运行的服务）
OnFailure	仅在容器异常退出（非零状态码）时重启，适用于任务型作业
Never	不重启容器，依赖上层控制器（如 Deployment）管理 Pod 生命周期

示例配置：

spec:
  restartPolicy: OnFailure
  containers:
  - name: app
    image: my-app

4.Pod 的状况（Conditions）

Pod 的详细状态通过 Conditions 字段细化：

状况类型	描述
PodScheduled	Pod 已成功调度到节点
Initialized	所有 Init 容器执行完毕
ContainersReady	所有主容器已就绪
Ready	Pod 可接收流量（需 `Readiness Probe` 通过）

5.设计建议与最佳实践

避免直接管理 Pod：使用控制器（如 Deployment、StatefulSet）实现自愈、滚动更新和扩缩容。
合理使用探针
- Liveness Probe 防止僵尸进程，Readiness Probe 避免流量涌入未就绪的容器。
优化资源配额：设置 requests 和 limits 避免资源争抢，提升集群稳定性。
优雅终止配置：通过 preStop 钩子确保服务平滑下线（如通知注册中心）。

6.示例：完整生命周期配置

apiVersion: v1
kind: Pod
metadata:
  name: lifecycle-demo
spec:
  initContainers:
  - name: init-db
    image: busybox
    command: ["sh", "-c", "until nslookup mysql; do sleep 2; done"]
  containers:
  - name: nginx
    image: nginx:latest
    lifecycle:
      postStart:
        exec:
          command: ["/bin/sh", "-c", "echo 'Started at $(date)' > /usr/share/nginx/html/start.html"]
      preStop:
        exec:
          command: ["nginx", "-s", "quit"]
    readinessProbe:
      httpGet:
        path: /
        port: 80
      initialDelaySeconds: 5
      periodSeconds: 10
    livenessProbe:
      tcpSocket:
        port: 80
      initialDelaySeconds: 15
      periodSeconds: 20
  terminationGracePeriodSeconds: 60

Pod 的生命周期管理是 Kubernetes 编排能力的核心，涵盖调度、初始化、健康检查、优雅终止等关键机制。理解各阶段的触发条件和配置方法，能够有效提升应用的稳定性和可维护性。实际应用中需结合控制器和探针机制，实现自动化运维和故障恢复。

五、Pod的健康检查机制

探针类型	作用	失败处理	探测方式（示例）	关键参数（示例）
Liveness Probe	检测容器是否存活（如进程崩溃、死锁）。	重启容器	`httpGet`、`exec`、`tcpSocket`	`initialDelaySeconds: 15` `periodSeconds: 10` `failureThreshold: 3`
Readiness Probe	检测容器是否就绪（可接收流量）。	从 Service 流量中移除该 Pod	`httpGet: path=/ready`	`successThreshold: 1` `timeoutSeconds: 5`
Startup Probe	检测应用是否完成启动（允许启动慢的服务）。	重启容器，直到成功后才执行其他探针	`tcpSocket: port=8080`	`failureThreshold: 30` `periodSeconds: 5`（允许最长 30×5=150秒启动时间）

补充说明

优先级：Startup Probe > Liveness Probe & Readiness Probe。
参数默认值
- initialDelaySeconds: 0（立即探测）
- periodSeconds: 10（每10秒探测一次）
- timeoutSeconds: 1（超时1秒视为失败）
- failureThreshold: 3（连续失败3次标记为异常）
适用场景
- Liveness Probe：防止僵尸进程（如应用死锁但进程仍在运行）。
- Readiness Probe：避免流量涌入未初始化完成的容器（如数据库连接未建立）。
- Startup Probe：为启动缓慢的应用（如 Java 服务）预留足够初始化时间。

六、创建多容器Pod

下面创建一个包含两个容器的pod，两个容器共享一个用于它们之间通信的卷。

（1）创建pod配置文件

[root@master ~]# vim two-containers-pod.yaml
[root@master ~]# cat two-containers-pod.yaml
apiVersion: v1
kind: Pod
metadata:
  name: two-containers-pod
spec:
   # Pod级配置
  restartPolicy: Never
  volumes:                        # 定义共享数据的卷
  - name: shared-data
    emptyDir: {}
  containers:
   # 第1个容器配置
  - name: nginx-container
    image: nginx
    volumeMounts:                # 挂载共享卷
    - name: shared-data
      mountPath: /usr/share/nginx/html   # 挂载路径
   # 第2个容器配置
  - name: busybox-container
    image: busybox
    volumeMounts:                # 挂载共享卷
    - name: shared-data
      mountPath: /pod-data      # 挂载路径
    # 容器启动命令及参数
    command: ["/bin/sh"] 
    args: ["-c", "echo Hello from the busybox container > /pod-data/index.html"]
[root@master ~]#

该配置文件中为pod定义了一个名为shared-data的共享卷，这是emptyDir类型的卷，只要Pod存在，该卷就一直存在，只有Pod被删除时改卷才会被删除。

两个容器都挂载该卷。第1个容器运行nginx服务器，共享卷的挂载路径是/usr/share/nginx/html；

第2个容器运行BusyBox系统，共享卷挂载路径是/pod-data。

需要注意的是，第2个容器运行容器启动命令，将消息写入指定的index.html文件后会终止运行。由于与第1个容器共享卷，该文件会被写入nginx服务器的根目录下。

（2）基于上述配置文件创建Pod。

[root@master ~]# kubectl apply -f two-containers-pod.yaml 
pod/two-containers-pod created

（3）查看Pod及其容器的信息，以YAML格式输出

[root@master ~]# kubectl get pod two-containers-pod --output=yaml
apiVersion: v1
kind: Pod
metadata:
  annotations:
    cni.projectcalico.org/containerID: 105c87f280ac172e6204ec63850269d8fe691d1588220ad58cec5c515eef2fcf
    cni.projectcalico.org/podIP: 10.244.166.142/32
    cni.projectcalico.org/podIPs: 10.244.166.142/32
    kubectl.kubernetes.io/last-applied-configuration: |
      {"apiVersion":"v1","kind":"Pod","metadata":{"annotations":{},"name":"two-containers-pod","namespace":"default"},"spec":{"containers":[{"image":"nginx","name":"nginx-container","volumeMounts":[{"mountPath":"/usr/share/nginx/html","name":"shared-data"}]},{"args":["-c","echo Hello from the busybox container \u003e /pod-data/index.html"],"command":["/bin/sh"],"image":"busybox","name":"busybox-container","volumeMounts":[{"mountPath":"/pod-data","name":"shared-data"}]}],"restartPolicy":"Never","volumes":[{"emptyDir":{},"name":"shared-data"}]}}
  creationTimestamp: "2025-03-30T11:52:36Z"
  name: two-containers-pod
  namespace: default
  resourceVersion: "23136"
  uid: b8fb5a02-6fe9-4dfc-a096-c1e4d2a49370
spec:
  containers:
  - image: nginx
    imagePullPolicy: Always
    name: nginx-container
    resources: {}
    terminationMessagePath: /dev/termination-log
    terminationMessagePolicy: File
    volumeMounts:
    - mountPath: /usr/share/nginx/html
      name: shared-data
    - mountPath: /var/run/secrets/kubernetes.io/serviceaccount
      name: kube-api-access-mr94t
      readOnly: true
  - args:
    - -c
    - echo Hello from the busybox container > /pod-data/index.html
    command:
    - /bin/sh
    image: busybox
    imagePullPolicy: Always
    name: busybox-container
    resources: {}
    terminationMessagePath: /dev/termination-log
    terminationMessagePolicy: File
    volumeMounts:
    - mountPath: /pod-data
      name: shared-data
    - mountPath: /var/run/secrets/kubernetes.io/serviceaccount
      name: kube-api-access-mr94t
      readOnly: true
  dnsPolicy: ClusterFirst
  enableServiceLinks: true
  nodeName: node1
  preemptionPolicy: PreemptLowerPriority
  priority: 0
  restartPolicy: Never
  schedulerName: default-scheduler
  securityContext: {}
  serviceAccount: default
  serviceAccountName: default
  terminationGracePeriodSeconds: 30
  tolerations:
  - effect: NoExecute
    key: node.kubernetes.io/not-ready
    operator: Exists
    tolerationSeconds: 300
  - effect: NoExecute
    key: node.kubernetes.io/unreachable
    operator: Exists
    tolerationSeconds: 300
  volumes:
  - emptyDir: {}
    name: shared-data
  - name: kube-api-access-mr94t
    projected:
      defaultMode: 420
      sources:
      - serviceAccountToken:
          expirationSeconds: 3607
          path: token
      - configMap:
          items:
          - key: ca.crt
            path: ca.crt
          name: kube-root-ca.crt
      - downwardAPI:
          items:
          - fieldRef:
              apiVersion: v1
              fieldPath: metadata.namespace
            path: namespace
status:
  conditions:
  - lastProbeTime: null
    lastTransitionTime: "2025-03-30T11:52:36Z"
    status: "True"
    type: Initialized
  - lastProbeTime: null
    lastTransitionTime: "2025-03-30T11:52:36Z"
    message: 'containers with unready status: [busybox-container]'
    reason: ContainersNotReady
    status: "False"
    type: Ready
  - lastProbeTime: null
    lastTransitionTime: "2025-03-30T11:52:36Z"
    message: 'containers with unready status: [busybox-container]'
    reason: ContainersNotReady
    status: "False"
    type: ContainersReady
  - lastProbeTime: null
    lastTransitionTime: "2025-03-30T11:52:36Z"
    status: "True"
    type: PodScheduled
  containerStatuses:
  - containerID: docker://7ac5b9a00e3b01b3f15cd8c3f4c234f02fc39152aa393a13d86cb43a92a09dd8
    image: busybox:latest
    imageID: docker-pullable://busybox@sha256:37f7b378a29ceb4c551b1b5582e27747b855bbfaa73fa11914fe0df028dc581f
    lastState: {}
    name: busybox-container
    ready: false
    restartCount: 0
    started: false
    state:
      terminated:			//终止
        containerID: docker://7ac5b9a00e3b01b3f15cd8c3f4c234f02fc39152aa393a13d86cb43a92a09dd8
        exitCode: 0
        finishedAt: "2025-03-30T11:52:52Z"
        reason: Completed
        startedAt: "2025-03-30T11:52:52Z"
  - containerID: docker://0bce9a982c62efc5d22ca94d4a770a3690d1a62b2cb98c35141986b8b9d4f4b5
    image: nginx:latest
    imageID: docker-pullable://nginx@sha256:124b44bfc9ccd1f3cedf4b592d4d1e8bddb78b51ec2ed5056c52d3692baebc19
    lastState: {}
    name: nginx-container
    ready: true
    restartCount: 0
    started: true
    state:
      running:			//正在运行
        startedAt: "2025-03-30T11:52:39Z"
  hostIP: 192.168.10.31
  phase: Running
  podIP: 10.244.166.142
  podIPs:
  - ip: 10.244.166.142
  qosClass: BestEffort
  startTime: "2025-03-30T11:52:36Z"

可以发现，busybox容器已经被终止，而nginx容器依然在运行

（4）进入nginx容器的Shell环境，使用curl命令向nginx服务器发起请求

[root@master ~]# kubectl exec -it two-containers-pod -c nginx-container -- /bin/bash
root@two-containers-pod:/# curl localhost
Hello from the busybox container
root@two-containers-pod:/# exit
exit

由于busybox容器在nginx容器的根目录下创建了index.html文件，所以这里能够访问该文件。

（5）使用curl命令向Pod的IP地址发起请求，也能访问该index.html文件。

[root@master ~]# curl 10.244.166.142
Hello from the busybox container
[root@master ~]#

（6）执行kubectl delete -f命令删除该pod

[root@master ~]# kubectl delete -f two-containers-pod.yaml 
pod "two-containers-pod" deleted
[root@master ~]# kubectl get pod two-containers-pod --output=yaml
Error from server (NotFound): pods "two-containers-pod" not found

七、为Pod及其容器设置资源配额

定义Pod时可以根据需要为每个容器设置所需要的资源数量，也就是资源配额，以免容器占用大量资源导致其他容器无法运行。

1.了解资源配额的设置方法

Kubermetes 使用.spec.resources字段为容器设置资源配额，该字段包括以下两个子字段，用于设置资源配额的上下限。

requests:设置容器需要的资源的最小值(请求资源),如果环境资源不够,容器将无法启动
limits:限制容器运行时可用资源的最大值(限制资源)，当容器占用的资源超过该值时会被终止，并重启。

实际应用中主要设置CPU和内存这两种资源。CPU资源以CPU为单位，1个CPU等于个物理 CPU核或者一个虚拟核。CPU资源的CPU数可以是整数和小数，也可以用毫核(m)为单位表示。1个CPU等于1000m，Kuberetes不允许设置精度小于1m的CPU资源。内存资源以字节为单位，可以使用普通的整数，或者带有E、P、T、G、M、k等数量单位的数;也可以使用对应的2的幂数，如Ei、Pi、Ti、Gi、Mi、Ki。

2.为Pod容器设置CPU和内存配额

下面创建两个容器的pod，并为每个容器分别设置CPU和内存配额，其中第2个容器使用stress程序做压力测试。stress是Linux的一个压力测试工具，可以对CPU、内存、磁盘等做压力测试。

（1）创建pod配置文件

[root@master ~]# vim resources-limit-pod.yaml
[root@master ~]# cat resources-limit-pod.yaml 
apiVersion: v1
kind: Pod
metadata:
  name: resources-limit-pod  
spec:
  containers:
  - name: nginx
    image: nginx
    resources:           # 资源配额
      limits:             # 限制资源(上限)
        cpu: 200m         # CPU限制
        memory: 400Mi     # 内存限制
      requests:       # 请求资源(下限)
        cpu: 100m
        memory: 200Mi
  - name: stress
    image: polinux/stress
    resources:               # 资源配额
      limits:                 # 限制资源(上限)
        memory: "200Mi"
      requests:              # 请求资源(下限)
        memory: "100Mi"
    command: ["stress"]
    args: ["--vm", "1", "--vm-bytes", "150M", "--vm-hang", "1"]

最后两行是第2个容器的启动命令，表示执行stress命令压满150MB内存。–vm选项用于指定进程数量，–vm-bytes选项表示分配的内存量，–vm-hang选项表示内存分配多长时间后释放掉，单位是秒。

（2）基于该配置文件创建pod

[root@master ~]# kubectl apply -f resources-limit-pod.yaml 
pod/resources-limit-pod created

（3）验证pod中的容器是否已经运行，可以发现两个容器都能正常运行

[root@master ~]# kubectl get pod
NAME                  READY   STATUS    RESTARTS   AGE
resources-limit-pod   2/2     Running   0          3m15s

（4）查看pod相关详细信息，可以发现，两个容器的cpu和内存配置限制与定义相同。

[root@master ~]# kubectl get pod resources-limit-pod --output=yaml
apiVersion: v1
kind: Pod
metadata:
  annotations:
    cni.projectcalico.org/containerID: 0132686d82d318297fc120bdc1aa9eb0b9220c6bdd8671e58a96df1c52c4ddb5
    cni.projectcalico.org/podIP: 10.244.166.143/32
    cni.projectcalico.org/podIPs: 10.244.166.143/32
    kubectl.kubernetes.io/last-applied-configuration: |
      {"apiVersion":"v1","kind":"Pod","metadata":{"annotations":{},"name":"resources-limit-pod","namespace":"default"},"spec":{"containers":[{"image":"nginx","name":"nginx","resources":{"limits":{"cpu":"200m","memory":"400Mi"},"requests":{"cpu":"100m","memory":"200Mi"}}},{"args":["--vm","1","--vm-bytes","150M","--vm-hang","1"],"command":["stress"],"image":"polinux/stress","name":"stress","resources":{"limits":{"memory":"200Mi"},"requests":{"memory":"100Mi"}}}]}}
  creationTimestamp: "2025-03-30T12:15:00Z"
  name: resources-limit-pod
  namespace: default
  resourceVersion: "25229"
  uid: 43751441-ee62-465b-80e8-85e9f5f693fd
spec:
  containers:
  - image: nginx
    imagePullPolicy: Always
    name: nginx
    resources:
      limits:
        cpu: 200m
        memory: 400Mi
      requests:
        cpu: 100m
        memory: 200Mi
    terminationMessagePath: /dev/termination-log
    terminationMessagePolicy: File
    volumeMounts:
    - mountPath: /var/run/secrets/kubernetes.io/serviceaccount
      name: kube-api-access-lsjhl
      readOnly: true
  - args:
    - --vm
    - "1"
    - --vm-bytes
    - 150M
    - --vm-hang
    - "1"
    command:
    - stress
    image: polinux/stress
    imagePullPolicy: Always
    name: stress
    resources:
      limits:
        memory: 200Mi
      requests:
        memory: 100Mi
    terminationMessagePath: /dev/termination-log
    terminationMessagePolicy: File
    volumeMounts:
    - mountPath: /var/run/secrets/kubernetes.io/serviceaccount
      name: kube-api-access-lsjhl
      readOnly: true
  dnsPolicy: ClusterFirst
  enableServiceLinks: true
  nodeName: node1
  preemptionPolicy: PreemptLowerPriority
  priority: 0
  restartPolicy: Always
  schedulerName: default-scheduler
  securityContext: {}
  serviceAccount: default
  serviceAccountName: default
  terminationGracePeriodSeconds: 30
  tolerations:
  - effect: NoExecute
    key: node.kubernetes.io/not-ready
    operator: Exists
    tolerationSeconds: 300
  - effect: NoExecute
    key: node.kubernetes.io/unreachable
    operator: Exists
    tolerationSeconds: 300
  volumes:
  - name: kube-api-access-lsjhl
    projected:
      defaultMode: 420
      sources:
      - serviceAccountToken:
          expirationSeconds: 3607
          path: token
      - configMap:
          items:
          - key: ca.crt
            path: ca.crt
          name: kube-root-ca.crt
      - downwardAPI:
          items:
          - fieldRef:
              apiVersion: v1
              fieldPath: metadata.namespace
            path: namespace
status:
  conditions:
  - lastProbeTime: null
    lastTransitionTime: "2025-03-30T12:15:00Z"
    status: "True"
    type: Initialized
  - lastProbeTime: null
    lastTransitionTime: "2025-03-30T12:15:50Z"
    status: "True"
    type: Ready
  - lastProbeTime: null
    lastTransitionTime: "2025-03-30T12:15:50Z"
    status: "True"
    type: ContainersReady
  - lastProbeTime: null
    lastTransitionTime: "2025-03-30T12:15:00Z"
    status: "True"
    type: PodScheduled
  containerStatuses:
  - containerID: docker://6b98d30bc2f6a52f5902b68125adacb9efe76bfd15651ffc8549fc9fe57299b3
    image: nginx:latest
    imageID: docker-pullable://nginx@sha256:124b44bfc9ccd1f3cedf4b592d4d1e8bddb78b51ec2ed5056c52d3692baebc19
    lastState: {}
    name: nginx
    ready: true
    restartCount: 0
    started: true
    state:
      running:
        startedAt: "2025-03-30T12:15:06Z"
  - containerID: docker://799b744bea3112ae168924495b22689d54c3133f2393c9217f4f9d53f8e6e974
    image: polinux/stress:latest
    imageID: docker-pullable://polinux/stress@sha256:b6144f84f9c15dac80deb48d3a646b55c7043ab1d83ea0a697c09097aaad21aa
    lastState: {}
    name: stress
    ready: true
    restartCount: 0
    started: true
    state:
      running:
        startedAt: "2025-03-30T12:15:50Z"
  hostIP: 192.168.10.31
  phase: Running
  podIP: 10.244.166.143
  podIPs:
  - ip: 10.244.166.143
  qosClass: Burstable
  startTime: "2025-03-30T12:15:00Z"
[root@master ~]#

（5）删除该pod以恢复实验环境

[root@master ~]# kubectl delete -f resources-limit-pod.yaml 
pod "resources-limit-pod" deleted
[root@master ~]# kubectl get pod
No resources found in default namespace.
[root@master ~]# kubectl get pod resources-limit-pod --output=yaml
Error from server (NotFound): pods "resources-limit-pod" not found

3.测试资源配额超限

当节点拥有足够多的可用资源时，容器可以使用其请求的资源。但是，容器不允许使用超过其限制的资源。如果给容器分配的资源超过其限制，该容器会成为被终止的候选容器。如果容器继续消耗超出其限制的资源，则会被终止。下面进行测试和验证。

（1）修改以上pod配置文件，将最后一行改为

args: ["--vm", "1", "--vm-bytes", "500M", "--vm-hang", "1"]

stress容器会尝试分配500MB的内存，远高于其200MB的限制。

（2）保存该配置文件，重新基于该文件创建pod

[root@master ~]# cp resources-limit-pod.yaml resources-limit-pod-new.yml
[root@master ~]# vi resources-limit-pod-new.yml 
[root@master ~]# cat resources-limit-pod-new.yml 
apiVersion: v1
kind: Pod
metadata:
  name: resources-limit-pod  
spec:
  containers:
  - name: nginx
    image: nginx
    resources:           # 资源配额
      limits:             # 限制资源(上限)
        cpu: 200m         # CPU限制
        memory: 400Mi     # 内存限制
      requests:       # 请求资源(下限)
        cpu: 100m
        memory: 200Mi
  - name: stress
    image: polinux/stress
    resources:               # 资源配额
      limits:                 # 限制资源(上限)
        memory: "200Mi"
      requests:              # 请求资源(下限)
        memory: "100Mi"
    command: ["stress"]
    args: ["--vm", "1", "--vm-bytes", "500M", "--vm-hang", "1"]
[root@master ~]# kubectl apply -f resources-limit-pod-new.yml 
pod/resources-limit-pod created

（3）执行以下命令监视Pod的状态

[root@master ~]# kubectl get pod -w
NAME                  READY   STATUS      RESTARTS      AGE
resources-limit-pod   1/2     OOMKilled   2 (30s ago)   49s
resources-limit-pod   1/2     CrashLoopBackOff   2 (16s ago)   53s
resources-limit-pod   1/2     OOMKilled          3 (31s ago)   68s
resources-limit-pod   1/2     CrashLoopBackOff   3 (16s ago)   84s
resources-limit-pod   1/2     OOMKilled          4 (47s ago)   115s
resources-limit-pod   1/2     CrashLoopBackOff   4 (15s ago)   2m9s
resources-limit-pod   1/2     OOMKilled          5 (95s ago)   3m29s
resources-limit-pod   1/2     CrashLoopBackOff   5 (14s ago)   3m43s
^C[root@master ~]#

等候一段时间，按ctrl+c组合键终止。

输出结果表明，该pod中有一个容器（stress）被终止、重启、再终止、再重启，默认终止的容器可以被重启，就像其他任何类型的容器运行时是吧一样。另一个容器（nginx）始终处于正常运行状态。

（4）查看pod详细信息

[root@master ~]# kubectl describe pod resources-limit-pod
Name:             resources-limit-pod
Namespace:        default
Priority:         0
Service Account:  default
Node:             node1/192.168.10.31
Start Time:       Sun, 30 Mar 2025 20:33:58 +0800
Labels:           <none>
Annotations:      cni.projectcalico.org/containerID: be049fbfabe0d5ecf16f33fa74bbcd5672757e255e0e6a39dbd00a1240f87f7b
                  cni.projectcalico.org/podIP: 10.244.166.144/32
                  cni.projectcalico.org/podIPs: 10.244.166.144/32
Status:           Running
IP:               10.244.166.144
IPs:
  IP:  10.244.166.144
Containers:
  nginx:
    Container ID:   docker://8696e221f38e5a6c771d51831d6ed86d21d21a94714a06d7706ae1cb860b744d
    Image:          nginx
    Image ID:       docker-pullable://nginx@sha256:124b44bfc9ccd1f3cedf4b592d4d1e8bddb78b51ec2ed5056c52d3692baebc19
    Port:           <none>
    Host Port:      <none>
    State:          Running
      Started:      Sun, 30 Mar 2025 20:34:00 +0800
    Ready:          True
    Restart Count:  0
    Limits:
      cpu:     200m
      memory:  400Mi
    Requests:
      cpu:        100m
      memory:     200Mi
    Environment:  <none>
    Mounts:
      /var/run/secrets/kubernetes.io/serviceaccount from kube-api-access-69nzk (ro)
  stress:
    Container ID:  docker://09e63ba04e8a8771bec9b61a0240b1660a99bf8ac42e491e42269b7ea72c9595
    Image:         polinux/stress
    Image ID:      docker-pullable://polinux/stress@sha256:b6144f84f9c15dac80deb48d3a646b55c7043ab1d83ea0a697c09097aaad21aa
    Port:          <none>
    Host Port:     <none>
    Command:
      stress
    Args:
      --vm
      1
      --vm-bytes
      500M
      --vm-hang
      1
    State:          Waiting
      Reason:       CrashLoopBackOff
    Last State:     Terminated
      Reason:       OOMKilled
      Exit Code:    1
      Started:      Sun, 30 Mar 2025 20:37:27 +0800
      Finished:     Sun, 30 Mar 2025 20:37:27 +0800
    Ready:          False
    Restart Count:  5
    Limits:
      memory:  200Mi
    Requests:
      memory:     100Mi
    Environment:  <none>
    Mounts:
      /var/run/secrets/kubernetes.io/serviceaccount from kube-api-access-69nzk (ro)
Conditions:
  Type              Status
  Initialized       True 
  Ready             False 
  ContainersReady   False 
  PodScheduled      True 
Volumes:
  kube-api-access-69nzk:
    Type:                    Projected (a volume that contains injected data from multiple sources)
    TokenExpirationSeconds:  3607
    ConfigMapName:           kube-root-ca.crt
    ConfigMapOptional:       <nil>
    DownwardAPI:             true
QoS Class:                   Burstable
Node-Selectors:              <none>
Tolerations:                 node.kubernetes.io/not-ready:NoExecute op=Exists for 300s
                             node.kubernetes.io/unreachable:NoExecute op=Exists for 300s
Events:
  Type     Reason     Age                    From               Message
  ----     ------     ----                   ----               -------
  Normal   Scheduled  4m32s                  default-scheduler  Successfully assigned default/resources-limit-pod to node1
  Normal   Pulling    4m31s                  kubelet            Pulling image "nginx"
  Normal   Pulled     4m30s                  kubelet            Successfully pulled image "nginx" in 1.209s (1.209s including waiting)
  Normal   Created    4m30s                  kubelet            Created container nginx
  Normal   Started    4m30s                  kubelet            Started container nginx
  Normal   Pulled     4m22s                  kubelet            Successfully pulled image "polinux/stress" in 8.251s (8.251s including waiting)
  Normal   Pulled     4m14s                  kubelet            Successfully pulled image "polinux/stress" in 7.913s (7.913s including waiting)
  Normal   Pulled     3m55s                  kubelet            Successfully pulled image "polinux/stress" in 3.821s (3.821s including waiting)
  Normal   Pulling    3m26s (x4 over 4m30s)  kubelet            Pulling image "polinux/stress"
  Normal   Created    3m24s (x4 over 4m22s)  kubelet            Created container stress
  Normal   Started    3m24s (x4 over 4m22s)  kubelet            Started container stress
  Warning  BackOff    3m24s (x5 over 4m12s)  kubelet            Back-off restarting failed container stress in pod resources-limit-pod_default(f3f8166f-7ba2-4e1a-b967-a406b51430fb)
  Normal   Pulled     3m24s                  kubelet            Successfully pulled image "polinux/stress" in 2.069s (2.069s including waiting)
[root@master ~]#

结果表明它由于内存溢出而被"杀掉"

（5）删除该pod以恢复实验环境

[root@master ~]# kubectl delete -f resources-limit-pod-new.yml 
pod "resources-limit-pod" deleted
[root@master ~]# kubectl get pod
No resources found in default namespace.

八、实现pod容器的健康检查

kubernetes提供的存活探测器用于实现健康检查，通过检测容器的响应是否正常来决定是否重启容器。pod定义存活探测器，可以让kubernetes自动感知pod是否正常运行。这里以HTTP GET方式为例示范pod容器健康检查的实现方法。

（1）创建pod配置文件

[root@master ~]# vim liveness-probe-pod.yaml
[root@master ~]# cat liveness-probe-pod.yaml 
apiVersion: v1
kind: Pod
metadata:
  name: liveness-probe-pod
spec:
  containers:
  - name: liveness-probe
    image: nginx
    livenessProbe:                        # 定义存活探测器
      httpGet:
        path: /
        port: 80
      initialDelaySeconds: 10    # 容器启动后10秒开始探测
      timeoutSeconds: 2           #容器必须在2秒内做出相应反馈给探测器，否则视为探测失败
      periodSeconds: 30           # 探测周期，每30秒探测一次
      successThreshold: 1         # 连续探测1次成功表示成功
      failureThreshold: 3        # 连续探测3次失败表示失败
[root@master ~]#

探测器向容器的80端口发送HTTP GET请求，如果请求不成功，kubernetes会重启容器。文件中对探测器做了定制，容器启动的10秒后开始探测，如果2秒内容器没有做出回应则被认为探测失败。每30秒做一次探测，再连续探测失败3次后重启容器。

（2）基于配置文件创建pod

[root@master ~]# kubectl apply -f liveness-probe-pod.yaml 
pod/liveness-probe-pod created

（3）查看该pod详细信息

[root@master ~]# kubectl get pod
NAME                 READY   STATUS    RESTARTS   AGE
liveness-probe-pod   1/1     Running   0          118s
[root@master ~]# kubectl describe pod liveness-probe-pod
Name:             liveness-probe-pod
Namespace:        default
Priority:         0
Service Account:  default
Node:             node1/192.168.10.31
Start Time:       Sun, 30 Mar 2025 20:47:08 +0800
Labels:           <none>
Annotations:      cni.projectcalico.org/containerID: 711ec9d867e754f658537ac8e0ea66e51a41db795cd55aab978ec7dd8654e502
                  cni.projectcalico.org/podIP: 10.244.166.145/32
                  cni.projectcalico.org/podIPs: 10.244.166.145/32
Status:           Running
IP:               10.244.166.145
IPs:
  IP:  10.244.166.145
Containers:
  liveness-probe:
    Container ID:   docker://6159e1ef29854643decf37b0df2cd4d5d82f6e316e476ae07118bbc7d725178b
    Image:          nginx
    Image ID:       docker-pullable://nginx@sha256:124b44bfc9ccd1f3cedf4b592d4d1e8bddb78b51ec2ed5056c52d3692baebc19
    Port:           <none>
    Host Port:      <none>
    State:          Running
      Started:      Sun, 30 Mar 2025 20:47:11 +0800
    Ready:          True
    Restart Count:  0
    Liveness:       http-get http://:80/ delay=10s timeout=2s period=30s #success=1 #failure=3
    Environment:    <none>
    Mounts:
      /var/run/secrets/kubernetes.io/serviceaccount from kube-api-access-pw9z2 (ro)
Conditions:
  Type              Status
  Initialized       True 
  Ready             True 
  ContainersReady   True 
  PodScheduled      True 
Volumes:
  kube-api-access-pw9z2:
    Type:                    Projected (a volume that contains injected data from multiple sources)
    TokenExpirationSeconds:  3607
    ConfigMapName:           kube-root-ca.crt
    ConfigMapOptional:       <nil>
    DownwardAPI:             true
QoS Class:                   BestEffort
Node-Selectors:              <none>
Tolerations:                 node.kubernetes.io/not-ready:NoExecute op=Exists for 300s
                             node.kubernetes.io/unreachable:NoExecute op=Exists for 300s
Events:
  Type    Reason     Age    From               Message
  ----    ------     ----   ----               -------
  Normal  Scheduled  2m14s  default-scheduler  Successfully assigned default/liveness-probe-pod to node1
  Normal  Pulling    2m14s  kubelet            Pulling image "nginx"
  Normal  Pulled     2m12s  kubelet            Successfully pulled image "nginx" in 2.054s (2.054s including waiting)
  Normal  Created    2m12s  kubelet            Created container liveness-probe
  Normal  Started    2m12s  kubelet            Started container liveness-probe
[root@master ~]#

可以发现，该pod当前处于正常运行状态（running），重启次数（Restart Count）为0，表面目前没有重启，容器一直处于健康状态。如果重启次数大于0，则说明已经重启，容器曾有过"不健康"的历史。

（4）删除该pod以恢复实验环境

[root@master ~]# kubectl delete pod liveness-probe-pod
pod "liveness-probe-pod" deleted
[root@master ~]# kubectl get pod
No resources found in default namespace.

以上示范的是常见的探测方法，其具体机制是向容器发送HTTP GET请求，如果探测器收到“2xx”或“3xx”信息，说明容器是健康的。

环境变量是pod容器运行环境中设定的一个变量，便于对容器进行灵活的配置。创建pod时，可以通过配置文件的.spec.env和.spec.envFrom字段来设置环境变量。

你可能感兴趣的:(kubernetes)

Prometheus系列01-Prometheus的单机版二进制部署 tinychen777 Devops linux 监控程序 centos
作为CNCF中最成功的开源项目之一，Prometheus已经成为了云原生监控的代名词，被广泛应用在Kubernetes和OpenShift等项目中，同时有很多第三方解决方案也会集成Prometheus。随着Kubernetes在容器调度和管理上确定领头羊的地位，Prometheus也成为Kubernetes容器监控的标配。考虑到k8s系统的复杂性和上手难度较高，本文将从最简单最基础的部分开始循序渐
K8s系列之：Kubernetes 的 OLM 快乐骑行^_^ Ansible Docker K8S 服务器相关知识总结 K8s系列 Kubernetes OLM
K8s系列之：Kubernetes的OLM什么是Kubernetes的OLM什么是Kubernetes中的OperatorOLM的功能OLM的核心组件OLM优势OLM的工作原理OLM与OperatorHub的关系OLM示例场景什么是CRDoperator和CRD的关系为什么需要CRD和OperatorCRD定义资源类型DebeziumServer如何使用debeziumoperatorDebezi
K8s系列之：Kubernetes 的 RBAC (Role-Based Access Control) 快乐骑行^_^ Ansible Docker K8S 服务器相关知识总结 K8s系列 Kubernetes RBAC Role-Based Access Control
K8s系列之：Kubernetes的RBACRole-BasedAccessControl认识RBACRBAC的关键概念RoleClusterRoleRoleBindingClusterRoleBindingRBAC的工作机制RBAC配置过程RBAC示例场景RBAC的优点总结认识RBACRBAC（基于角色的访问控制）是Kubernetes中的一种权限管理机制，用于控制用户或服务账户对Kuberne
云原生Kubernetes系列 | etcd3.5集群部署和使用降世神童云原生技术专栏云原生 kubernetes 容器
云原生Kubernetes系列|etcd3.5集群部署和使用1.etcd集群部署2.etcd集群操作3.新增etcd集群节点1.etcd集群部署 etcd3.5官网站点： https://etcd.io/docs/v3.5/op-guide/clustering/ https://etcd.io/docs/v3.5/tutorials/how-to-setup-cluster/[root@l
初试牛刀 - 使用 Chaos Mesh 进行第一次混沌实验 weixin_42587823 混沌混沌工程
初试牛刀-使用ChaosMesh进行第一次混沌实验第一步：准备实验环境我们的“混沌实验室”需要三个核心组件：一个Kubernetes集群、ChaosMesh平台、以及一个用来做实验的应用。A.安装ChaosMesh我们将使用Helm来安装ChaosMesh，这是官方推荐的最简单的方式。添加ChaosMesh的Helm仓库:helmrepoaddchaos-meshhttps://charts.ch
解锁阿里云ACK：开启Kubernetes容器化应用新时代云资源服务商阿里云云计算云原生
引言：云原生时代下的ACK在当今数字化飞速发展的时代，云原生技术正以前所未有的速度改变着软件开发和部署的格局。随着企业对应用敏捷性、弹性扩展以及成本优化的需求日益增长，云原生已成为众多企业实现数字化转型的关键路径。在云原生的技术体系中，容器编排技术无疑是核心之一，而阿里云Kubernetes版（ACK）则是这一领域的佼佼者，为企业提供了强大、高效且易于管理的容器编排解决方案。Kubernetes作
可观测性终局：Pixie自动诊断K8s生产故障
可观测性终局：Pixie自动诊断K8s生产故障摘要针对Kubernetes生产环境“故障定位难、诊断效率低、依赖专家经验”的痛点（某电商平台因内存泄漏排查耗时4小时导致订单量下降30%），本文提出基于Pixie的无人值守诊断方案。通过eBPF技术实时追踪系统调用（如malloc()内存分配），结合BPF地图分析网络行为、LTTng捕获存储IO延迟，实现三大核心故障的自动定位：内存泄漏（定位准确率9
ABP VNext + RediSearch：微服务级全文检索 Kookoos Abp vNext .net 微服务全文检索架构 ABP vNext Redis
ABPVNext+RediSearch：微服务级全文检索目录ABPVNext+RediSearch：微服务级全文检索一、背景与动机️二、环境与依赖2.1DockerCompose启动RedisStack2.2Kubernetes部署（示例Manifest）2.3ABPVNext&NuGet包️三、架构与流程图️四、索引模型与依赖注入4.1模型定义4.2服务注册️五、IndexService&Sea
Kubernetes 资源调度中标签（Label）和选择器（Selector）深入理解 pengdott 云原生 kubernetes java 容器
目录前言：一、什么是标签（Label）二、什么是选择器（Selector）三、标签和选择器的应用四、最佳实践五、总结前言：在Kubernetes中，标签（Label）和选择器（Selector）是资源调度中非常重要的概念。它们帮助我们组织、分类和选择集群中的资源对象。通过标签和选择器，Kubernetes可以轻松地管理和调度Pods、服务（Services）以及其他资源对象。本文将深入探讨Kube
在Amazon EKS中应用Amazon Fargate的Serverless容器化实践 AWS官方合作商 serverless 云原生 aws
本文深度解析如何通过Fargate实现EKS集群的Serverless节点管理，大幅降低K8s运维复杂度一、为什么选择Fargate+EKS？AmazonEKS（ElasticKubernetesService）提供托管式K8s集群，而Fargate作为无服务器计算引擎，二者结合可解决以下痛点：运维简化无需管理WorkerNode（EC2实例）自动处理节点扩缩容/打补丁/安全加固成本优化按Pod资
Kubernetes基于helm部署jenkins lldhsds kubernetes 云计算 kubernetes jenkins devops
Kubernetes基于helm安装jenkinsjenkins支持war包、docker镜像、系统安装包、helm安装等。在Kubernetes上使用Helm安装Jenkins可以简化安装和管理Jenkins的过程。同时借助Kubernetes，jenkins可以实现工作节点的动态调用伸缩，更好的提高资源利用率。通过Jenkins的kubernetes-plugin来实现将Jenkins运行在K
容器与 Kubernetes 基本概念与架构木鱼时刻软件开发 kubernetes 架构容器
文章目录1.典型环境层次结构2.Kubernetes生态三大类2.1核心组件2.2集群管理工具2.3生态辅助工具2.4资源管理关系3.Docker容器技术与实践3.1镜像拉取加速3.2认证与登录3.3常用命令3.4存储挂载方式对比3.5docker-compose启动3.6容器化应用部署示例4.kind快速启动5.参考资料1.典型环境层次结构物理机/宿主机：运行虚拟化或容器化环境的基础硬件。虚拟机
Java容器化核弹级优化：Kubernetes资源调度与性能飙升指南——让Java应用在容器中跑出0.01秒响应！墨夶 Java学习资料5 java kubernetes 开发语言
在云原生时代，Java应用的容器化部署已成为标配，但如何让Java在容器编排中实现资源利用率提升400%、响应时间缩短至毫秒级？本文将揭秘10大核心优化策略，通过**20000行代码级深度解析一、Java容器化资源调度的核心挑战1.1资源争夺的“死亡螺旋”//未优化的Java容器典型问题publicclassResourceStarvation{publicstaticvoidmain(<
ElasticCTR：一键部署的分布式CTR预估解决方案萧桔格Wilbur
ElasticCTR：一键部署的分布式CTR预估解决方案ElasticCTRElasticCTR，即飞桨弹性计算推荐系统，是基于Kubernetes的企业级推荐系统开源解决方案。该方案融合了百度业务场景下持续打磨的高精度CTR模型、飞桨开源框架的大规模分布式训练能力、工业级稀疏参数弹性调度服务，帮助用户在Kubernetes环境中一键完成推荐系统部署，具备高性能、工业级部署、端到端体验的特点，并且
containerd
一、理论Containerd是容器底层运行时，c/s架构。docker运行需要containerd作为容器底层运行时。kubernetes1.24版本之前（不包含1.24版本）支持docker、containerd等容器底层运行时，1.24版本之后（包含1.24版本）默认容器底层运行时就是containerd。containerd由storage、metadata、runtimes三大组件组成st
大规模分布式数据库读写分离架构：一致性、可用性与性能的权衡实践
目录1引言：数据库架构的核心三角2原创架构设计2.1读写分离系统架构2.2读写核心流程3企业级实现代码3.1Python路由服务核心代码3.2TypeScript复制状态监控3.3Kubernetes部署YAML示例4性能对比量化分析5生产级部署与安全方案5.1高可用部署架构5.2安全审计方案6技术前瞻性分析6.1演进路线图6.2关键趋势解读7附录：完整技术图谱结论1引言：数据库架构的核心三角在大
Spring Cloud（微服务部署与监控）白仑色 Spring系列 spring cloud 微服务 spring 微服务部署服务监控健康检查
摘要在微服务架构中，随着服务数量的增长和部署复杂度的提升，如何高效部署、持续监控、快速定位问题并实现自动化运维成为保障系统稳定性的关键。本文将围绕SpringCloud微服务的部署与监控展开，深入讲解：微服务打包与部署方式（JAR/Docker/Kubernetes）如何构建CI/CD流水线服务健康检查与自动恢复机制Prometheus+Grafana实现指标可视化监控ELK实现日志集中管理Sky
Kubernetes Pod 调度基础眠修 kubernetes 容器云原生
目录一、ReplicationController和ReplicaSet1、ReplicationController（复制控制器，RC）（1）编辑ReplicationController文件（2）创建ReplicationController（3）删除一个pod并立即查看pod状态（4）删除ReplicationController2、标签与标签选择器（1）标签（2）标签选择器基于等式的选择器
Kubernetes Pod常见的几种调度方式 Seal^_^ 【云原生】容器化与编排技术持续集成 #Kubernetes kubernetes 容器云原生 K8s Pod Pod的几种调度方式面试
KubernetesPod常见的几种调度方式1、Deployment或ReplicationController(RC)2、NodeSelector（定向调度）3、NodeAffinity（亲和性调度）4、Taints和Tolerations（污点和容忍）TheBegin点点关注，收藏不迷路1、Deployment或ReplicationController(RC)功能：自动部署容器应用的多份副本
Kubernetes Pod调度基础别骂我h 个人笔记容器
目录一、ReplicationController和ReplicaSet1.ReplicationControllerReplicationController的使用示例2.标签与标签选择器标签标签选择器标签与标签选择器举例3.ReplicaSet定义ReplicaSet实例二、无状态应用管理Deployment1.什么是无状态2.无状态服务特点3.无状态服务的应用场景4.创建Deployment
Spring Boot + ONNX Runtime模型部署
文章目录前言一、模型导出二、Java推理引擎选型三、SpringBoot实战3.1核心架构3.2分层架构详细实现1.Controller层-请求入口2.Service层-核心业务流程3.关键组件深度优化四、云原生部署：Docker+Kubernetes总结前言在AI浪潮席卷全球的今天，Java工程师如何守住后端主战场？模型部署正是Java工程师融入AI领域的方向。为什么Java工程师必须掌握模型部
多容器应用与编排——AI教你学Docker LuckyLay AI教你学Docker 人工智能 docker 容器
2.2多容器应用与编排现代应用通常由多个服务（如Web、数据库、缓存等）组成，每个服务运行在独立的容器里。如何高效管理、协调、扩展、升级这些多容器应用，成为容器化实践的核心。容器编排工具（如DockerCompose、Swarm、Kubernetes）正是为此而生。一、Compose：本地/开发环境多容器编排1.概述DockerCompose是用于定义和运行多容器Docker应用的工具。通过doc
低代码平台架构设计 LINGYI_WEN 低代码前端开发语言
1.整体架构概述1.1技术栈选择前端：React+Redux/Vue+Vuex后端：Node.js+Express/SpringBoot数据库：MySQL/PostgreSQL/MongoDB云服务：AWS/Azure/GoogleCloud容器化：Docker+Kubernetes1.2模块划分前端模块：可视化编辑器：用于拖拽和配置组件预览器：实时预览页面效果发布器：将设计好的页面发布到生产环境
【Kubernetes】ReplicaSet 如何选择要删除的 Pod - 缩容优先级深度解析 showyoui 云原生开源 kubernetes 容器云原生
文章目录概述核心问题：控制器如何在自己的Pod中做选择？ReplicaSet的删除优先级排序特殊情况：StatefulSet决策流程图关键应用：使用`pod-deletion-cost`总结概述当您缩减一个Deployment或ReplicaSet的副本数时，控制器必须从其管理的众多Pod中做出选择：删除哪一个？这是一个在应用更新和弹性伸缩中频繁发生的操作。与因节点资源不足而引发的"被动"驱逐不同
Kubernetes第八章--存储类型运维小贺 kubernetes 容器云计算云原生运维
k8s存储概述在Kubernetes（K8s）中，存储系统是一个关键的组成部分，用于管理容器化应用的数据持久性和共享性。K8s的存储分类可以从多个维度进行理解，但主要分为两大类：临时存储和持久存储。关于元数据和真实数据的分类，虽然这两个概念在存储系统中普遍存在，但在K8s的存储分类中，它们并不是直接用于分类存储类型的标准。不过，可以从K8s存储类型如何管理和使用这些数据的角度来探讨。k8s支持的卷
Kubernetes第七章--Service详解 (纯干货) 运维小贺 kubernetes 容器云原生 docker etcd
Service存在的意义？引入Service主要是解决Pod的动态变化，通过创建Service，可以为一组具有相同功能的容器应用提供一个统一的入口地址，并且将请求负载分发到后端的各个容器应用上。若提供服务的容器应用是分布式，所以存在多个pod副本，而Pod副本数量可能在运行过程中动态改变，比如水平扩缩容，或者服务器发生故障Pod的IP地址也有可能发生变化。当pod的地址端口发生改变后，客户端再想连
Kubernetes Pod 调度基础
目录一、ReplicationController与ReplicaSet：Pod副本数的守护者1.1ReplicationController：确保Pod副本数的基础机制1.1.1ReplicationController实践示例1.2标签与标签选择器：Kubernetes对象管理的核心机制1.2.1标签（Label）的定义与规范1.2.2标签选择器（LabelSelector）的类型与用法1.2
16.6 《3分钟扩容20实例！LanguageMentor容器化部署实战：高并发下的负载均衡与自动扩展方案》少林码僧负载均衡运维人工智能语言模型机器学习 langchain llama
LanguageMentorAgent容器化部署与发布：高并发场景下的负载均衡与自动扩展关键词：KubernetesHPA,AWSAutoScaling,会话亲和性,监控指标,滚动更新1.高并发场景下的架构挑战LanguageMentor作为对话式Agent需要处理多用户同时在线会话，容器化部署需解决两个核心问题：
如何在宝塔面板中配置SSL证书？奔跑吧邓邓子高效运维 ssl 服务器网络协议
提示：“奔跑吧邓邓子”的高效运维专栏聚焦于各类运维场景中的实际操作与问题解决。内容涵盖服务器硬件（如IBMSystem3650M5）、云服务平台（如腾讯云、华为云）、服务器软件（如Nginx、Apache、GitLab、Redis、Elasticsearch、Kubernetes、Docker等）、开发工具（如Git、HBuilder）以及网络安全（如挖矿病毒排查、SSL证书配置）等多个方面。无论
一文读懂Kubernetes：架构、优势与应用 t0_54program 大数据与人工智能 kubernetes 架构容器个人开发
在当今的云原生计算领域，容器和Kubernetes的应用极为广泛。尽管Kubernetes是一项相对较新的技术，但众多全球企业已在生产环境中用它来管理关键业务应用程序。它之所以广受欢迎，得益于其一系列强大的功能，如增强的安全性、更出色的微服务管理能力、更高的可观测性，以及更高效的扩展和资源利用。什么是Kubernetes？Kubernetes，常简称为k8s，是谷歌实验室于2014年开发的开源容器
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的