如何用prometheus监控k8s集群中业务pod的metrics

一般，我们从网上看到的帖子和资料，

都是用prometheus监控k8s的各项资源，

如api server, namespace, pod, node等。

那如果是自己的业务pod上的自定义metrics呢？

比如，一个业务pod开放了/xxx/metrics，

那么，如果用prometheus来抓取呢？

这里，我们就会用到kubernetes-pods这样一个job。

然后，在业务的deployment中，加annotation来配合抓取配置。

如下：

prometheus-configmap-pod.yaml

apiVersion: v1
kind: ConfigMap
metadata:
  name: prometheus-config
  namespace: ns-monitor
data:
  prometheus.yml: |
    global:
      scrape_interval:     15s
      evaluation_interval: 15s
    scrape_configs:
      - job_name: 'kubernetes-pods'
        kubernetes_sd_configs:
        - role: pod
        relabel_configs:
        - source_labels: [__meta_kubernetes_pod_annotation_prometheus_io_scrape]
          action: keep
          regex: true
        - source_labels: [__meta_kubernetes_pod_annotation_prometheus_io_path]
          action: replace
          target_label: __metrics_path__
          regex: (.+)
        - source_labels: [__address__, __meta_kubernetes_pod_annotation_prometheus_io_port]
          action: replace
          regex: ([^:]+)(?::\d+)?;(\d+)
          replacement: $1:$2
          target_label: __address__
        - action: labelmap
          regex: __meta_kubernetes_pod_label_(.+)
        - source_labels: [__meta_kubernetes_namespace]
          action: replace
          target_label: kubernetes_namespace
        - source_labels: [__meta_kubernetes_pod_name]
          action: replace
          target_label: kubernetes_pod_name

上面yaml文件中source_labels: [__meta_kubernetes_pod_annotation_prometheus_io_path]，

这样的relabel含义就是：

如果在业务pod中，annotation定义了prometheus.io/path，那么，prometheus就可以抓取其自定义的metrics。

如，一个业务deployments定义如下：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: gw
  namespace: default
spec:
  replicas: 3
  selector:
    matchLabels:
      name: gw
  template:
    metadata:
      labels:
        name: gw
      annotations:
        prometheus.io/path: /xxx/metrics
        prometheus.io/port: "32456"
        prometheus.io/scrape: "true"
    spec:
      imagePullSecrets:
      - name: dockersecret
      containers:
      - name: gw
......

那么，prometheus server加载prometheus.yml文件之后，

就会去抓取每个业务pod的pod:32456/xxx/metrics的监控数据了。

如果现实是无极，那内存就是太极，CPU的作用只是力图将线性化的空间还原为立体化的空间。其间当然要涉及映射运算。

如何用prometheus监控k8s集群中业务pod的metrics

你可能感兴趣的:(java)