在配置prometheus-operator 监控jvm之前,我们必须要了解prometheus-operator的4个crd不然后续会蒙蔽。
这四个CRD作用如下
监控后端jvm内存,我们需要下载jmx_prometheus_javaagent-0.11.0.jar
下载地址:
https://repo1.maven.org/maven2/io/prometheus/jmx/jmx_prometheus_javaagent/0.11.0/jmx_prometheus_javaagent-0.11.0.jar
config.yaml下载例子:
https://github.com/prometheus/jmx_exporter/tree/master/example_configs
下载之后重命名为config.yaml
之后将以上两个文件封装在dockerfile里
并在docker启动参数环境变量里加入JAVA_OPTS="$JAVA_OPTS -Duser.timezone=GMT+08 -javaagent:$PWD/jmx_prometheus_javaagent-0.2.0.jar=1234:$PWD/config.yaml -Djava.protocol.handler.pkgs=org.apache.catalina.webresources"
之后通过k8s启动之后通过curl http://127.0.0.1:1234/metrics 去访问是否已经成功
因为svc的负载均衡,所以在K8S里监控metrics基本最小单位都是一个svc背后的pod为target,所以prometheus-operator创建了对应的CRD: kind: ServiceMonitor ,创建的ServiceMonitor里声明需要监控选中的svc的label以及metrics的url路径的和namespaces即可
在需要获取jvm的应用的svc里配置相应的端口 也就是以上的1234端口 后续ServiceMonitor 会根据name的值对应相应的target
之后创建ServiceMonitor :
因ServiceMonitor 与监控的服务不再同一个namespace 所以需要加namespaceSelector
默认情况下ServiceMonitor和监控对象必须是在相同Namespace下的,如果要关联非同ns下需要下面这样设置值
spec:
namespaceSelector:
matchNames:
- target_ns_name
如果希望ServiceMonitor可以关联任意命名空间下的标签,则通过以下方式定义:
spec:
namespaceSelector:
any: true
创建完成之后 这里有一个坑:如果监控的服务不在同一个namespace 那么会出现无权限获取的问题:
User \"system:serviceaccount:monitoring:prometheus-k8s\" cannot list pods in the namespace \"pre\""
这里我们根据提示创建rbac认证
apiVersion: rbac.authorization.k8s.io/v1beta1
kind: ClusterRole
metadata:
name: prometheus
rules:
- apiGroups: [""]
resources:
- nodes
- services
- endpoints
- pods
verbs: ["get", "list", "watch"]
- apiGroups: [""]
resources:
- configmaps
verbs: ["get"]
- nonResourceURLs: ["/metrics"]
verbs: ["get"]
---
apiVersion: rbac.authorization.k8s.io/v1beta1
kind: ClusterRoleBinding
metadata:
name: prometheus
roleRef:
apiGroup: rbac.authorization.k8s.io
kind: ClusterRole
name: prometheus
subjects:
- kind: ServiceAccount
name: prometheus-k8s
namespace: monitoring
之后我们可以通过prometheus的ui界面查看到对应的target
总的来说就是创建自己的监控数据需要ServiceMonitor,通过ServiceMonitor去对应的label里找对应svc下的metrics的port。并且不同的namespace下的监控需要设置好rbac权限(在k8s集群中有配置rbac的集群里)
下载grafana的模版
https://grafana.com/dashboards/8878/revisions
导入到grafana的服务里最后查看对应的ui