神奇的海马体

Prometheus+Grafana监控K8S集群(基于K8S环境部署)

文章目录

- 一、环境信息
- 二、部署前准备工作
- 三、部署Prometheus监控系统
- 四、部署Node_exporter组件
- 五、部署Kube_state_metrics组件
- 六、部署Grafana可视化平台
- 七、Grafana可视化显示Prometheus收集数据
- 八、Grafana添加监控模板
- 九、拓展

Prometheus+Grafana监控K8S集群(基于K8S环境部署)_第1张图片

一、环境信息

1、服务器及K8S版本信息：

IP地址	主机名称	角色	K8S版本
16.32.15.200	master-1	Master节点	v1.23.0
16.32.15.201	node-1	Node节点	v1.23.0
16.32.15.202	node-2	Node节点	v1.23.0

2、部署组件版本：

序号	名称	版本	作用
1	Prometheus	v2.33.5	收集、存储和处理指标数据
2	Node_exporter	v0.16.0	采集服务器指标，如CPU、内存、磁盘、网络等
3	Kube-state-metrics	v1.9.0	采集K8S资源指标，如Pod、Node、Deployment、Service等
4	Grafana	v8.4.5	可视化展示Prometheus收集数据

3、离线包下载：

包括本实验的离线镜像包、导入Grafana所需的模板文件。

点击下载：

二、部署前准备工作

1、创建名称空间，下面所有资源都放到这里

kubectl create ns prometheus

2、创建ServiceAccount账号，并绑定cluster-admin集群角色(Prometheus中需要指定)

kubectl create serviceaccount prometheus -n prometheus

kubectl create clusterrolebinding prometheus-clusterrolebinding -n prometheus --clusterrole=cluster-admin  --serviceaccount=prometheus:prometheus

kubectl create clusterrolebinding prometheus-clusterrolebinding-1 -n prometheus --clusterrole=cluster-admin --user=system:serviceaccount:prometheus:prometheus

3、创建Prometheus存放数据目录
注意：我准备将Prometheus服务部署在Node-1节点，所以此步骤在Node-1节点执行

mkdir /data
chmod -R 777 /data

4、创建Grafana存放数据目录
我准备将Grafana服务部署在Node-1节点，所以此步骤也在Node-1节点执行

mkdir /var/lib/grafana/ -p
chmod 777 /var/lib/grafana/

5、时间同步 && 时区同步

# 时间同步
yum -y install ntpdate
/usr/sbin/ntpdate -u ntp1.aliyun.com

# 时区同步
timedatectl set-timezone Asia/Shanghai

定时同步：每天凌晨5点进行时间同步

echo "0 5 * * * /usr/sbin/ntpdate -u ntp1.aliyun.com >/dev/null &" >> /var/spool/cron/root

6、提前下载所需镜像

docker pull prom/prometheus:v2.33.5
docker pull prom/node-exporter:v0.16.0
docker pull quay.io/coreos/kube-state-metrics:v1.9.0
docker pull grafana/grafana:8.4.5

三、部署Prometheus监控系统

1、创建 ConfigMap资源

vim prometheus-cfg.yaml
---
kind: ConfigMap
apiVersion: v1
metadata:
  labels:
    app: prometheus
  name: prometheus-config
  namespace: prometheus
data:
  prometheus.yml: |
    global:
      scrape_interval: 15s           # 采集目标主机监控据的时间间隔
      scrape_timeout: 10s            # 数据采集超时时间，默认10s
      evaluation_interval: 1m        # 触发告警检测的时间，默认是1m
    scrape_configs:
    - job_name: 'kubernetes-node'
      kubernetes_sd_configs:          # 基于K8S的服务发现
      - role: node                    # 使用node模式服务发现
      relabel_configs:                # 正则匹配
      - source_labels: [__address__]  # 匹配带有IP的标签
        regex: '(.*):10250'           # 10250端口(kubelet端口)
        replacement: '${1}:9100'      # 替换成9100
        target_label: __address__
        action: replace
      - action: labelmap
        regex: __meta_kubernetes_node_label_(.+)
    - job_name: 'kubernetes-node-cadvisor' # cadvisor容器用于收集和提供有关节点上运行的容器的资源使用情况和性能指标
      kubernetes_sd_configs:
      - role:  node
      scheme: https
      tls_config:
        ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
      bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
      relabel_configs:
      - action: labelmap   # 把匹配到的标签保留
        regex: __meta_kubernetes_node_label_(.+) # 保留匹配到的具有__meta_kubernetes_node_label的标签
      - target_label: __address__               
        replacement: kubernetes.default.svc:443
      - source_labels: [__meta_kubernetes_node_name]
        regex: (.+)
        target_label: __metrics_path__
        replacement: /api/v1/nodes/${1}/proxy/metrics/cadvisor
    - job_name: 'kubernetes-apiserver'
      kubernetes_sd_configs:
      - role: endpoints
      scheme: https
      tls_config:
        ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
      bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
      relabel_configs:
      - source_labels: [__meta_kubernetes_namespace, __meta_kubernetes_service_name, __meta_kubernetes_endpoint_port_name]
        action: keep
        regex: default;kubernetes;https
    - job_name: 'kubernetes-service-endpoints'
      kubernetes_sd_configs:
      - role: endpoints   # 使用k8s中的endpoint模式服务发现
      relabel_configs:
      - source_labels: [__meta_kubernetes_service_annotation_prometheus_io_scrape]
        action: keep      # 采集满足条件的实例，其他实例不采集
        regex: true
      - source_labels: [__meta_kubernetes_service_annotation_prometheus_io_scheme]
        action: replace
        target_label: __scheme__
        regex: (https?)
      - source_labels: [__meta_kubernetes_service_annotation_prometheus_io_path]
        action: replace
        target_label: __metrics_path__
        regex: (.+)
      - source_labels: [__address__, __meta_kubernetes_service_annotation_prometheus_io_port]
        action: replace
        target_label: __address__
        regex: ([^:]+)(?::\d+)?;(\d+)
        replacement: $1:$2
      - action: labelmap
        regex: __meta_kubernetes_service_label_(.+)
      - source_labels: [__meta_kubernetes_namespace]
        action: replace
        target_label: kubernetes_namespace
      - source_labels: [__meta_kubernetes_service_name]
        action: replace
        target_label: kubernetes_name

执行配置清单：

kubectl apply -f  prometheus-cfg.yaml

查看ConfigMap资源信息：

kubectl get configmap -n prometheus prometheus-config

2、创建 Deployment资源

vim prometheus-deploy.yaml
---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: prometheus-server
  namespace: prometheus
  labels:
    app: prometheus
spec:
  replicas: 1
  selector:
    matchLabels:
      app: prometheus
      component: server
  template:
    metadata:
      labels:
        app: prometheus
        component: server
      annotations:
        prometheus.io/scrape: 'false'
    spec:
      nodeName: node-1                # 调度到node-1节点
      serviceAccountName: prometheus  # 指定sa服务账号
      containers:
      - name: prometheus
        image: prom/prometheus:v2.33.5
        imagePullPolicy: IfNotPresent
        command:                       # 启动时运行的命令
          - prometheus
          - --config.file=/etc/prometheus/prometheus.yml  # 指定配置文件
          - --storage.tsdb.path=/prometheus               # 数据存放目录
          - --storage.tsdb.retention=720h                 # 暴露720小时(30天)
          - --web.enable-lifecycle                        # 开启热加载
        ports:
        - containerPort: 9090
          protocol: TCP
        volumeMounts:
        - mountPath: /etc/prometheus       # 将prometheus-config卷挂载至/etc/prometheus
          name: prometheus-config
        - mountPath: /prometheus/
          name: prometheus-storage-volume
        - name: localtime
          mountPath: /etc/localtime
      volumes:                           
        - name: localtime
          hostPath:
            path: /etc/localtime
            type: File
        - name: prometheus-config          # 将prometheus-config做成卷
          configMap:
            name: prometheus-config
        - name: prometheus-storage-volume 
          hostPath:
           path: /data
           type: Directory

注意：我把Prometheus部署到node-1节点，这里填写节点名称，根据自己当前的环境写，其他配置如果是跟做，都不用改！！

执行配置清单：

kubectl apply -f prometheus-deploy.yaml

查看Deployment资源信息：

kubectl get deployment prometheus-server -n prometheus

3、创建 Service资源

vim prometheus-svc.yaml
---
apiVersion: v1
kind: Service
metadata:
  name: prometheus-svc
  namespace: prometheus
  labels:
    app: prometheus
spec:
  type: NodePort
  ports:
    - port: 9090
      targetPort: 9090
      nodePort: 31090
      protocol: TCP
  selector:
    app: prometheus
    component: server

执行配置清单：

kubectl apply -f prometheus-svc.yaml

查看Service资源信息：

kubectl get svc prometheus-svc -n prometheus

4、浏览器访问：http://IP:31090

如上图，没有提示时间对上的问题，表示只此步骤，无误。

四、部署Node_exporter组件

我直接写到一个文件中了，方便执行！

vim node-export.yaml
---
apiVersion: apps/v1
kind: DaemonSet
metadata:
  name: node-exporter
  namespace: prometheus
  labels:
    name: node-exporter
spec:
  selector:
    matchLabels:
     name: node-exporter
  template:
    metadata:
      labels:
        name: node-exporter
    spec:
      hostPID: true
      hostIPC: true
      # 使用物理机IP地址(调度到那个节点,就使用该节点IP地址)
      hostNetwork: true
      containers:
      - name: node-exporter
        image: prom/node-exporter:v0.16.0
        imagePullPolicy: IfNotPresent
        ports:
        # 暴露端口
        - containerPort: 9100
        resources:
          requests:
            cpu: 0.15
        securityContext:
          privileged: true
        args:
        - --path.procfs
        - /host/proc
        - --path.sysfs
        - /host/sys
        - --collector.filesystem.ignored-mount-points
        - '"^/(sys|proc|dev|host|etc)($|/)"'
        volumeMounts:
        - name: dev
          mountPath: /host/dev
        - name: proc
          mountPath: /host/proc
        - name: sys
          mountPath: /host/sys
        - name: rootfs
          mountPath: /rootfs
        - name: localtime
          mountPath: /etc/localtime
      # 指定容忍度,允许调度到master节点
      tolerations:
      - key: "node-role.kubernetes.io/master"
        operator: "Exists"
        effect: "NoSchedule"
      volumes:
        - name: proc
          hostPath:
            path: /proc
        - name: dev
          hostPath:
            path: /dev
        - name: sys
          hostPath:
            path: /sys
        - name: rootfs
          hostPath:
            path: /
        - name: localtime
          hostPath:
            path: /etc/localtime
            type: File

注意：需要根据环境修改容忍度tolerations 允许调度到Master节点，其他不用修改！！

可以使用以下命令查看master-1节点中的污点是什么，然后配置到上面的tolerations。

kubectl describe node master-1|grep -w Taints

执行资源清单：

kubectl apply -f node-export.yaml

查看资源信息，正常三个节点都要部署node_exporter，如果没有master节点，就要检查上面容忍度配置了。

kubectl get pods -n prometheus -o wide

五、部署Kube_state_metrics组件

关于kube-state-metrics资源，我也都写到一个文件中了，直接执行，不需要修改(前提是按照上面环境跟做的！)

vim kube-state-metrics.yaml
---
apiVersion: v1
kind: ServiceAccount
metadata:
  name: kube-state-metrics
  namespace: prometheus
---
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
  name: kube-state-metrics
rules:
- apiGroups: [""]
  resources: ["nodes", "pods", "services", "resourcequotas", "replicationcontrollers", "limitranges", "persistentvolumeclaims", "persistentvolumes", "namespaces", "endpoints"]
  verbs: ["list", "watch"]
- apiGroups: ["extensions"]
  resources: ["daemonsets", "deployments", "replicasets"]
  verbs: ["list", "watch"]
- apiGroups: ["apps"]
  resources: ["statefulsets"]
  verbs: ["list", "watch"]
- apiGroups: ["batch"]
  resources: ["cronjobs", "jobs"]
  verbs: ["list", "watch"]
- apiGroups: ["autoscaling"]
  resources: ["horizontalpodautoscalers"]
  verbs: ["list", "watch"]
---
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding
metadata:
  name: kube-state-metrics
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: ClusterRole
  name: kube-state-metrics
subjects:
- kind: ServiceAccount
  name: kube-state-metrics
  namespace: prometheus
---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: kube-state-metrics
  namespace: prometheus
spec:
  replicas: 1
  selector:
    matchLabels:
      app: kube-state-metrics
  template:
    metadata:
      labels:
        app: kube-state-metrics
    spec:
      serviceAccountName: kube-state-metrics
      containers:
      - name: kube-state-metrics
        image: quay.io/coreos/kube-state-metrics:v1.9.0
        imagePullPolicy: IfNotPresent
        ports:
        - containerPort: 8080
---
apiVersion: v1
kind: Service
metadata:
  annotations:
    prometheus.io/scrape: 'true'
  name: kube-state-metrics
  namespace: prometheus
  labels:
    app: kube-state-metrics
spec:
  ports:
  - name: kube-state-metrics
    port: 8080
    protocol: TCP
  selector:
    app: kube-state-metrics

执行资源清单：

kubectl apply -f kube-state-metrics.yaml

查看资源信息：

kubectl get pods -n prometheus

六、部署Grafana可视化平台

注意：修改nodeName指定部署到Node节点，其他不用修改！！

vim grafana.yaml
---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: grafana-server
  namespace: prometheus
spec:
  replicas: 1
  selector:
    matchLabels:
      task: monitoring
      k8s-app: grafana
  template:
    metadata:
      labels:
        task: monitoring
        k8s-app: grafana
    spec:
      nodeName: node-1 # 部署到那个节点
      containers:
      - name: grafana
        image: grafana/grafana:8.4.5
        imagePullPolicy: IfNotPresent
        ports:
        - containerPort: 3000
          protocol: TCP
        volumeMounts:
        - mountPath: /etc/ssl/certs
          name: ca-certificates
          readOnly: true
        - mountPath: /var
          name: grafana-storage
        - mountPath: /var/lib/grafana/
          name: lib
        - name: localtime
          mountPath: /etc/localtime
        env:
        - name: INFLUXDB_HOST
          value: monitoring-influxdb
        - name: GF_SERVER_HTTP_PORT
          value: "3000"
          # The following env variables are required to make Grafana accessible via
          # the kubernetes api-server proxy. On production clusters, we recommend
          # removing these env variables, setup auth for grafana, and expose the grafana
          # service using a LoadBalancer or a public IP.
        - name: GF_AUTH_BASIC_ENABLED
          value: "false"
        - name: GF_AUTH_ANONYMOUS_ENABLED
          value: "true"
        - name: GF_AUTH_ANONYMOUS_ORG_ROLE
          value: Admin
        - name: GF_SERVER_ROOT_URL
          # If you're only using the API Server proxy, set this value instead:
          # value: /api/v1/namespaces/kube-system/services/monitoring-grafana/proxy
          value: /
      volumes:
      - name: localtime
        hostPath:
          path: /etc/localtime
      - name: ca-certificates
        hostPath:
          path: /etc/ssl/certs
      - name: grafana-storage
        emptyDir: {}
      - name: lib
        hostPath:
         path: /var/lib/grafana/
         type: DirectoryOrCreate
---
apiVersion: v1
kind: Service
metadata:
  labels:
    # For use as a Cluster add-on (https://github.com/kubernetes/kubernetes/tree/master/cluster/addons)
    # If you are NOT using this as an addon, you should comment out this line.
    kubernetes.io/cluster-service: 'true'
    kubernetes.io/name: monitoring-grafana
  name: grafana-svc
  namespace: prometheus
spec:
  # In a production setup, we recommend accessing Grafana through an external Loadbalancer
  # or through a public IP.
  # type: LoadBalancer
  # You could also use NodePort to expose the service at a randomly-generated port
  # type: NodePort
  ports:
  - port: 80
    targetPort: 3000
    nodePort: 31091
  selector:
    k8s-app: grafana
  type: NodePort

执行资源清单：

kubectl apply -f grafana.yaml

查看资源信息：

kubectl get pods -n prometheus

浏览器访问：http://IP:31091

OK，浏览器可以访问到Grafana，表示至此步骤，无误！

七、Grafana可视化显示Prometheus收集数据

1、点击 设置 > Data Sources > Add data source > 选择Prometheus

2、填写Name、URL 字段
URL 使用SVC的域名，格式是：SVC名称.名称空间.svc

http://prometheus-svc.prometheus.svc:9090

3、往下滑，点击 Save & test

八、Grafana添加监控模板

模板可以去这个地址下载，Grafana模板下载地址：，下面我推荐几个对我来说比较满意的。

序号	模板文件	备注
1	`1860_rev32.json`	服务器监控模板-1
2	`node_exporter.json`	服务器监控模板-2
3	`docker_rev1.json`	Docker监控模板
4	`Kubernetes-1577674936972.json`	K8S集群监控模板
5	`Kubernetes-1577691996738.json`	K8S集群监控模板

1、我以导入 1860_rev32.json 服务器监控模板为例子演示：

最终效果：

2、导入node_exporter.json 服务器监控-2模板：

最终效果图：

3、导入docker_rev1.json Docker监控模板：

最终效果：

4、导入Kubernetes-1577674936972.json K8S-1监控模板：

最终效果：

5、导入Kubernetes-1577691996738.jsonK8S-2监控模板：

最终效果：

九、拓展

1、Prometheus热加载

curl -XPOST http://16.32.15.200:31090/-/reload

2、新增监控Service服务

问：为什么我添加的Service服务，在Prometheus中查看不到？？？？
答：在Service中添加注解才可以被Prometheus发现，如下图，这是我们定义的ConfigMap内容：

案例：以上面定义的prometheus-svc 为例子，添加prometheus_io_scrape注解。

vim prometheus-svc.yaml
---
apiVersion: v1
kind: Service
metadata:
  name: prometheus-svc
  namespace: prometheus
  labels:
    app: prometheus
  annotations:
    prometheus_io_scrape: "true"  # 注解,有这个才可以被Prometheus发现
spec:
  type: NodePort
  ports:
    - port: 9090
      targetPort: 9090
      nodePort: 31090
      protocol: TCP
  selector:
    app: prometheus
    component: server

更新一下资源清单：

kubectl apply -f prometheus-svc.yaml

热加载一下Prometheus：

curl -XPOST http://16.32.15.200:31090/-/reload

OK，Prometheus已经监控上了，如下图：

3、prometheus配置注意项：

scrape_interval采集时间的值，要小于evaluation_interval发送告警的值，比如 scrape_interval5分钟采集一次，evaluation_interval是1分钟告警一次，这样会产生5条告警，因为 scrape_interval是10分钟采集一次，而scrape_interval告警的是旧的值。

你可能感兴趣的:(#,#,prometheus,grafana,kubernetes)

科伦坡证券交易所（CSE）定制的全栈系统开发报告 Ashlee_guweng22346 python java perl docker 数据结构 emacs 算法
“全自动化交易平台”（CSE主席瓦吉拉·库拉提拉卡评价）的进化——订单处理延迟1Tbps）。容器化微服务：iSulad轻量容器引擎（内存开销6MB）实现Kubernetes秒级扩容，资源利用率提升70%，故障切换时间10ms，错失套利窗口。方案：鲲鹏低延迟引擎+InfiniBand网络。结果：时延降至0.5ms，套利收益年化提升22%。
机器学习模型监控警报系统设计：Prometheus+Evidently 实战教程大熊计算机机器学习 prometheus 人工智能
1.系统架构设计：从数据采集到智能告警（1）监控系统核心组件交互图预测请求监控指标告警规则通知渠道预测结果质量报告时序数据模型服务PrometheusExporterPrometheusServerAlertmanager邮件/Slack/WebhookEvidently服务可视化仪表盘图解：系统采用双引擎架构，Prometheus负责基础监控指标采集与告警触发，Evidently执行深度模型分析
Spring Cloud 微服务架构部署模式 Java技术栈实战架构 spring cloud 微服务 ai
SpringCloud微服务架构部署模式：从单体到云原生的进化路径关键词：SpringCloud、微服务架构、部署模式、容器化、Kubernetes、服务网格、DevOps摘要：本文系统解析SpringCloud微服务架构的核心部署模式，涵盖传统物理机部署、容器化部署、Kubernetes集群编排、服务网格集成等技术栈。通过技术原理剖析、实战案例演示和最佳实践总结，揭示不同部署模式的适用场景、技术
Minikube Unable to resolve the current Docker CLI context “default“ LF-DevJourney docker 容器运维 k8s minikube
问题描述minikube安装后，执行任何minikube命令，均报下面的信息。解决方法确认docker是否运行查看docker当前的context$dockercontextlsNAMETYPEDESCRIPTIONDOCKERENDPOINTKUBERNETESENDPOINTORCHESTRATORdefault*mobyCurrentDOCKER_HOSTbasedconfiguration
第一部分、Kubernetes基础（第三节：Kubernetes 核心概念全解析） jarenyVO K8s kubernetes 容器云原生
Kubernetes核心概念全解析深入理解Kubernetes核心概念是设计云原生架构的基础。本文将全面剖析Kubernetes的关键概念，结合Java应用场景，帮助您掌握这些核心抽象。一、Pod：Kubernetes的最小调度单元1.Pod概念解析Pod核心特性：原子调度单位：Kubernetes不直接调度容器，而是调度Pod共享上下文：同一个Pod中的容器共享：网络命名空间（相同IP和端口空间
k8s基础概念和组件介绍小黑屋说YYDS 笔记 kubernetes 容器云原生
k8s涉及到的概念和组件介绍Kubernetes（简称k8s）是一个开源的容器编排系统，由Google开发并于2014年开源，后捐赠给云原生计算基金会（CNCF）。它用于自动化应用程序的部署、扩展和管理，特别是在容器化环境中，已成为业界容器编排的事实标准。它通过自动化、弹性和自我修复能力，简化了容器化应用的部署和管理。无论是小型创业公司还是大型企业，k8s都能帮助团队更高效地构建、扩展和维护应用程
IP变更后k8s集群环境恢复方法总结 Herry_644280825 kubernetes 容器云原生
在实际工作中，已安装部署的k8s集群环境，可能由于办公场所搬迁等原因导致网络环境变化，原k8s集群环境不可用，重新安装比较麻烦，可参考下述方法，恢复环境运行。1.修改hostsip信息，配置新ip域映射。/etc/hosts2.检查k8s配置,配置新ip/etc/kubernetes/kubelet.conf3.manifests目录下配置ip更新/etc/kubernetes/manifests
Kubernetes架构原理
一，为什么需要Kubernetes很多人会有疑问，有了Docker为什么还用Kubernetes?在业务开始进行容器化时，前期需要容器化的项目可能并不多，涉及的容器也并不多，此时基于Docker容器直接部署至宿主机也能实现基本的需求。但是随着项目越来越多，管理的容器也会越来越多，此时使用“裸容器”部署的方式管理起来就显得很吃力，并且随着业务量的增加，会明显体会到“裸容器”的不足，比如:宿主机宕机造
集群透视 - K8s 核心监控组件与日志管理方案 weixin_42587823 云原生 kubernetes 容器云原生
集群透视-K8s核心监控组件与日志管理方案对于SRE而言，仅仅让应用跑起来是远远不够的，确保整个Kubernetes集群的健康、稳定，并能够快速定位应用问题，依赖于一套完善的监控和日志体系。Kubernetes监控分层与核心组件Kubernetes的监控可以从不同层面进行：节点(Node)层面:监控每台物理机或虚拟机的硬件资源使用情况、操作系统状态等（通常由NodeExporter负责，我们在Pr
Kubernetes自动伸缩全解析：HPA、VPA与CA的协同工作原理倪俊炼
Kubernetes自动伸缩全解析：HPA、VPA与CA的协同工作原理developer-roadmapdeveloper-roadmap项目地址:https://gitcode.com/gh_mirrors/deve/developer-roadmap概述在现代云原生环境中，应用的负载往往具有波动性，静态配置的资源很难满足动态需求。Kubernetes提供了三种自动伸缩机制来应对这一挑战：Hor
【Kubernetes】Pod 的创建过程详解 showyoui 云原生 kubernetes 容器云原生开源 pod
KubernetesPod创建过程深度解析概述Pod是Kubernetes中最小的可部署单元，理解Pod的创建过程对于深入掌握Kubernetes的工作原理至关重要。本文将详细解析从用户提交Pod创建请求到Pod成功运行的完整流程，帮助您深入理解Kubernetes的内部机制。Pod创建的核心组件在深入了解创建过程之前，我们先来认识参与Pod创建的核心组件：APIServer:Kubernetes
Gitea 服务器监控面板的搭建 shengyin714959 笔记最高笔记服务器 gitea 数据库
Prometheus是一个开源的服务监控系统和时序数据库。Grafana是一个可视化的数据分析面板，它可以从Prometheus中查询时序数据，绘制漂亮的数据图表。本文作者在实践中使用Prometheus抓取和存储Gitea服务器的运行数据，并基于Grafana提供的开源数据面板创建了一个自己服务器的Gitea性能监控面板。工作原理为了更清晰地理解Prometheus的工作原理，我在下方列出了Pr
Milvus 资源调度系统的核心部分：「查询节点」「资源组」「数据库」背太阳的牧羊人 milvus数据库 milvus 数据库
Milvus的资源管理分为三层：查询节点、资源组和数据库。查询节点：处理查询任务的组件。它在物理机或容器（如Kubernetes中的pod）上运行。资源组：查询节点的集合，充当逻辑组件（数据库和Collections）与物理资源之间的桥梁。您可以将一个或多个数据库或集合分配给一个资源组。下面我将详细解释这三个概念。总体图（打个比方）你可以把整个Milvus系统想象成一个「大型图书馆系统」，里头有：
Jenkins JNLP与SSH节点连接方式对比及连接断开问题解决方案 tianyuanwo devops jenkins ssh 运维
一、JNLPvsSSH连接方式优缺点对比对比维度JNLP（JavaWebStart）SSH（SecureShell）核心原理代理节点主动连接Jenkins主节点，通过加密通道通信，支持动态资源分配。Jenkins通过SSH协议远程登录代理节点执行命令，需预先配置SSH服务。适用场景容器化环境（如Kubernetes）、需要跨平台或动态扩缩容的场景。传统物理机/虚拟机、静态节点或简单命令执行场景。安
ASP.NET Core 健康监控：从入门到实战 Net分享 asp.net 后端
在ASP.NETCore中，HealthCheck是一种用于监控应用程序运行状况的内置机制。允许你定义和运行检查，以确保你的应用程序及其依赖项（如数据库、缓存、外部服务等）正常运行。HealthCheck通常用于微服务架构、容器化环境（如Kubernetes）或需要高可用性的场景。简介HealthCheck提供了一种标准化的方式，通过HTTP端点（通常是/health）返回应用程序的健康状态。He
Kubernetes在混合云平台中的应用：跨云容器编排实战 AI云原生与云计算技术学院 AI云原生与云计算 kubernetes 容器云原生 ai
Kubernetes在混合云平台中的应用：跨云容器编排实战关键词：Kubernetes，混合云平台，跨云容器编排，容器化，云原生摘要：本文围绕Kubernetes在混合云平台中的应用展开，详细阐述了跨云容器编排的相关技术。首先介绍了混合云及Kubernetes的背景知识，接着深入剖析Kubernetes跨云容器编排的核心概念与架构，讲解了相关算法原理和操作步骤，并通过数学模型进行了理论分析。通过具
Promtail收集docker容器的日志 jingleli21 docker
什么是Promtail？Promtail是Linux操作系统上的一个服务，它会扫描日志文件，并将它们提取到Loki中。Loki是Grafana的一个日志聚合工具，它类似于Prometheus，但主要用于日志数据。Promtail能够自动发现运行中的Docker容器，并抓取它们的日志。Promtail的工作原理Promtail的工作原理可以简单概括为以下几个步骤：监控日志文件：Promtail不断扫
kube-promethesu调整coredns监控 jingleli21 docker linux 运维
K8s集群版本是二进制部署的1.20.4，kube-prometheus对应选择的版本是kube-prometheus-0.8.0Coredns是在安装集群的时候部署的，采用的也是该版本的官方文档，kube-prometheus中也有coredns的监控配置信息，但是在prometheus的监控页面并没有发现coredns的servicemonitor.。所以我们需要一步步的去排查该问题。先看下c
Go语言与云原生：Kubernetes Operator开发全流程科技苑云原生开发语言
一、在云原生技术浪潮中，Kubernetes已成为容器编排领域的事实标准，而Go语言凭借其高效的性能、原生的并发支持和简洁的语法，成为Kubernetes生态开发的首选语言。KubernetesOperator作为扩展Kubernetes能力的重要工具，通过自定义资源（CRD）和控制器模式，实现对复杂应用的自动化管理。本文将深入解析如何使用Go语言进行KubernetesOperator的全流程开
Kubernetes 网络方案全解析：Flannel、Calico 与 Cilium 对比与选择 XMYX-0 K8S kubernetes 网络容器
文章目录Kubernetes网络方案全解析：Flannel、Calico与Cilium对比与选择Flannel——轻量级基础网络简介核心特性适用场景Calico——高性能与安全兼备的成熟方案简介核心特性适用场景Cilium——基于eBPF的下一代网络方案简介核心特性适用场景深入对比与选择建议安全性性能与扩展性部署与运维复杂性社区支持与未来发展总结与选择建议对比表格Kubernetes网络方案全解析
Kubernetes控制平面组件：Kubelet详解（五）：切换docker运行时为containerd grahamzhu 云原生学习专栏 kubernetes 容器 kubelet cri containerd k8s 容器运行时
云原生学习路线导航页（持续更新中）kubernetes学习系列快捷链接Kubernetes架构原则和对象设计（一）Kubernetes架构原则和对象设计（二）Kubernetes架构原则和对象设计（三）Kubernetes控制平面组件：etcd（一）Kubernetes控制平面组件：etcd（二）Kubernetes控制平面组件：APIServer详解（一）Kubernetes控制平面组件：API
Kubernetes控制平面组件：Kubelet详解（四）：gRPC 与 CRI gRPC实现 grahamzhu 云原生学习专栏 kubernetes kubelet grpc protobuf proto-gen-go proto rpc
云原生学习路线导航页（持续更新中）kubernetes学习系列快捷链接Kubernetes架构原则和对象设计（一）Kubernetes架构原则和对象设计（二）Kubernetes架构原则和对象设计（三）Kubernetes控制平面组件：etcd（一）Kubernetes控制平面组件：etcd（二）Kubernetes控制平面组件：APIServer详解（一）Kubernetes控制平面组件：API
k8s-diagrams：直观展现Kubernetes架构的利器汤力赛Frederica
k8s-diagrams：直观展现Kubernetes架构的利器k8s-diagramsAcollectionofkubernetes-relateddiagrams项目地址:https://gitcode.com/gh_mirrors/k8s/k8s-diagrams在当今的云计算时代，Kubernetes（简称K8s）作为容器编排的事实标准，其复杂而灵活的架构常常令人感到难以理解。k8s-di
Kubernetes、Docker Swarm 与 Nomad 容器编排方案深度对比与选型指导浅沫云归后端技术栈小结 Kubernetes Docker Nomad
Kubernetes、DockerSwarm与Nomad容器编排方案深度对比与选型指导在微服务和云原生时代，容器编排已成为保证应用可用性与扩展性的核心技术。本文将从问题背景出发，深入对比Kubernetes、DockerSwarm和Nomad三大主流编排方案，分析各自优缺点，并结合真实生产环境场景给出选型建议与实践验证，帮助后端开发与运维团队做出合理决策。1.问题背景介绍随着应用规模和复杂度的提升
16.7 Prometheus+Grafana实战：容器化监控与日志聚合一站式解决方案少林码僧 prometheus grafana 人工智能 langchain llama 语言模型机器学习
《Prometheus+Grafana实战：容器化监控与日志聚合一站式解决方案》关键词：容器化监控、日志聚合、Prometheus、Grafana、ELKStack、用户反馈收集容器化监控与日志系统的架构设计在LanguageMentorAgent生产部署中，监控系统需要覆盖以下维度：
prometheus+grafana+MySQL监控甲柒运维监控 prometheus grafana mysql
prometheus+grafana+MySQL监控环境说明操作前提：先去搭建Docker部署prometheus+grafana+...这篇文章的系统Docker部署prometheus+grafana+...的参考文章：Docker部署prometheus+grafana+…-CSDN博客在的节点服务器上搭建MySQL数据库（可以采用直接安装或者docker部署）搭建MySQL数据库的参考文章
k8s云原生技术栈(脑图) 晴空06 云原生 kubernetes 容器
Kubernetes(K8s)是一种开源的容器编排引擎，用于自动化应用程序容器的部署、扩展和操作。它由Google设计并捐赠给CloudNativeComputingFoundation（CNCF）进行维护。Kubernetes提供了一个强大的平台，用于构建和管理容器化应用程序的解决方案。K8s基础概念Kubernetes集群架构Master节点组件APIServerKubernetesAPI服务
Prometheus + Grafana监控方案详解：从入门到实战风偷走了蒲公开发知识 Prometheus Grafana 监控 DevOps Node.js
Prometheus+Grafana监控方案详解：从入门到实战1.引言在现代分布式系统中，监控是保障系统稳定性的关键。Prometheus作为一款开源的监控工具，结合Grafana的可视化能力，能够提供强大的监控解决方案。本文将详细介绍Prometheus+Grafana的监控方案，并通过丰富的代码示例和应用场景帮助读者快速掌握。2.Prometheus基础2.1Prometheus简介Prome
Kylin Linux Advanced Server V10 离线安装 Prometheus + Grafana + node_exporter指南晴空06 操作系统管理工具性能测试 kylin linux prometheus
离线安装Prometheus+Grafana+InfluxDB指南(KylinLinuxAdvancedServerV10)最终结果展示准备工作在一台有互联网连接的机器上下载所有必要的安装包和依赖准备一个USB驱动器或内部网络共享位置来传输文件确保目标服务器有足够的资源运行这些服务下载离线安装包在有网络的机器上下载以下组件：Prometheuswgethttps://github.com/prom
Kubernetes集群架构详情弓长三虎 kubernetes 架构 java 容器云原生
Kubernetes属于典型的Server-Client形式的二层架构，在程序级别，Master主要由APIServer(kube-apiserver)、ControllerManager(kube-controller-manager)和Scheduler(kubescheduler)这3个组件，以及一个用于集群状态存储的etcd存储服务组成，它们构成整个集群的控制平面；而每个Node节点则主要
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源