Linux Kubernetes 资源监控 Metrics-Server V0.3.6 部署与应用

Metrics-Server V0.3.6 部署与应用

  • 一、Metrics-Server的部署
  • 二、 Metrics-Server 的使用

一、Metrics-Server的部署

Metrics-Server是集群核心监控数据的聚合器,用来替换之前的heapster。

容器相关的 Metrics 主要来自于 kubelet 内置的 cAdvisor 服务,有了Metrics-Server之后,用户就可以通过标准的 Kubernetes API 来访问到这些监控数据。

Metrics API 只可以查询当前的度量数据,并不保存历史数据。

Metrics API URI 为 /apis/metrics.k8s.io/,在 k8s.io/metrics 维护。

必须部署 metrics-server 才能使用该 API,metrics-server 通过调用 Kubelet Summary API 获取数据。
示例:

http://127.0.0.1:8001/apis/metrics.k8s.io/v1beta1/nodes
http://127.0.0.1:8001/apis/metrics.k8s.io/v1beta1/nodes/<node-name>
http://127.0.0.1:8001/apis/metrics.k8s.io/v1beta1/namespace/<namespace-name>/pods/<pod-name>

 
   
   
   
   
  • 1
  • 2
  • 3

Metrics Server 并不是 kube-apiserver 的一部分,而是通过 Aggregator 这种插件机制,在独立部署的情况下同 kube-apiserver 一起统一对外服务的。

kube-aggregator 其实就是一个根据 URL 选择具体的 API 后端的代理服务器。

Linux Kubernetes 资源监控 Metrics-Server V0.3.6 部署与应用_第1张图片Metrics-server属于Core metrics(核心指标),提供API metrics.k8s.io,仅提供Node和Pod的CPU和内存使用情况。 而其他Custom Metrics(自定义指标)由Prometheus等组件来完成。

资源下载:https://github.com/kubernetes-incubator/metrics-server

Metrics-server(v0.3.6)部署:

下载部署文件:

[root@server1 limit]# wget https://github.com/kubernetes-sigs/metrics-server/releases/download/v0.3.6/components.yaml

 
   
   
   
   
  • 1

编辑部署文件,主要更改镜像:

[root@server1 limit]# vim components.yaml 

 
   
   
   
   
  • 1

在这里插入图片描述可以先下载镜像放到私有仓库。

应用部署文件:

[root@server1 limit]# kubectl apply -f components.yaml
[root@server1 limit]# kubectl get pod -n kube-system 
NAME                              READY   STATUS    RESTARTS   AGE
coredns-7ff77c879f-8gzr5          1/1     Running   19         21d
coredns-7ff77c879f-dxst6          1/1     Running   18         21d
etcd-server1                      1/1     Running   19         21d
kube-apiserver-server1            1/1     Running   19         21d
kube-controller-manager-server1   1/1     Running   56         21d
kube-flannel-ds-amd64-8bj5x       1/1     Running   2          5h49m
kube-flannel-ds-amd64-qwk6c       1/1     Running   28         21d
kube-flannel-ds-amd64-wcqrh       1/1     Running   30         21d
kube-proxy-fvx88                  1/1     Running   17         17d
kube-proxy-m8xrc                  1/1     Running   23         17d
kube-proxy-qsq27                  1/1     Running   17         17d
kube-scheduler-server1            1/1     Running   47         21d
metrics-server-7cdfcc6666-mdmps   1/1     Running   0          15s

 
   
   
   
   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17

部署后正常情况下我们使用kubectl top pod和kubectl top node可以查看pod和node的状态,但是现在执行后发现没有信息:

[root@server1 limit]# kubectl top node
error: metrics not available yet
[root@server1 limit]# kubectl top pod
W0509 03:12:14.940662    9210 top_pod.go:274] Metrics not available for pod default/nfs-client-provisioner-6b66ddf664-2qf7m, age: 1h35m2.940654525s
error: Metrics not available for pod default/nfs-client-provisioner-6b66ddf664-2qf7m, age: 1h35m2.940654525s

 
   
   
   
   
  • 1
  • 2
  • 3
  • 4
  • 5

我们现在就来填坑。

查看Metrics-server的Pod日志:

[root@server1 limit]# kubectl logs metrics-server-7cdfcc6666-mdmps -n kube-system 

 
   
   
   
   
  • 1

可以看出是解析的问题:
Linux Kubernetes 资源监控 Metrics-Server V0.3.6 部署与应用_第2张图片错误1:dial tcp: lookup server1 on 10.96.0.10:53: no such host

这是因为没有内网的DNS服务器,所以metrics-server无法解析节点名字。可以直接修改coredns的configmap,将各个节点的主机名加入到hosts中,这样所有Pod都可以从CoreDNS中解析各个节点的名字。

[root@server1 limit]# kubectl -n kube-system get cm
NAME                                 DATA   AGE
coredns                              1      21d
extension-apiserver-authentication   6      21d
kube-flannel-cfg                     2      21d
kube-proxy                           2      21d
kubeadm-config                       2      21d
kubelet-config-1.18                  1      21d
[root@server1 limit]# kubectl -n kube-system edit cm coredns 
apiVersion: v1
data:
  Corefile: |
    ...
        ready
        hosts {
           172.25.63.1 server1
           172.25.63.2 server2
           172.25.63.3 server3
           fallthrough
        }
        kubernetes cluster.local in-addr.arpa ip6.arpa {

 
   
   
   
   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22

Linux Kubernetes 资源监控 Metrics-Server V0.3.6 部署与应用_第3张图片添加解析后还是不行:

[root@server1 limit]# kubectl top node
error: metrics not available yet

 
   
   
   
   
  • 1
  • 2

我们再次查看日志:

[root@server1 limit]# kubectl logs metrics-server-7cdfcc6666-mdmps -n kube-system 

 
   
   
   
   
  • 1

在这里插入图片描述报错2:x509: certificate signed by unknown authority

Metric Server 支持一个参数 --kubelet-insecure-tls,可以跳过这一检查,然而官方也明确说了,这种方式不推荐生产使用。

启用TLS Bootstrap 证书签发:

# vim /var/lib/kubelet/config.yaml 	
加入:
serverTLSBootstrap: true
# systemctl  restart kubelet

 
   
   
   
   
  • 1
  • 2
  • 3
  • 4
  • 5

Linux Kubernetes 资源监控 Metrics-Server V0.3.6 部署与应用_第4张图片
注意,每个节点都要进行以上两步操作。

操作后查看证书请求:

[root@server1 limit]# kubectl get csr
NAME        AGE     SIGNERNAME                      REQUESTOR             CONDITION
csr-5mvdn   20s     kubernetes.io/kubelet-serving   system:node:server3   Pending
csr-kfrm4   3m52s   kubernetes.io/kubelet-serving   system:node:server1   Pending
csr-r9jnh   18s     kubernetes.io/kubelet-serving   system:node:server2   Pending

 
   
   
   
   
  • 1
  • 2
  • 3
  • 4
  • 5

可以看出三个节点都在进行证书请求,我们现在来批准这些请求:

[root@server1 limit]# kubectl certificate approve csr-kfrm4
certificatesigningrequest.certificates.k8s.io/csr-kfrm4 approved
[root@server1 limit]# kubectl certificate approve csr-5mvdn
certificatesigningrequest.certificates.k8s.io/csr-5mvdn approved
[root@server1 limit]# kubectl certificate approve csr-r9jnh
certificatesigningrequest.certificates.k8s.io/csr-r9jnh approved

 
   
   
   
   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

批准后再次查看请求:

[root@server1 limit]# kubectl get csr
NAME        AGE     SIGNERNAME                      REQUESTOR             CONDITION
csr-5mvdn   47s     kubernetes.io/kubelet-serving   system:node:server3   Approved,Issued
csr-kfrm4   4m19s   kubernetes.io/kubelet-serving   system:node:server1   Approved,Issued
csr-r9jnh   45s     kubernetes.io/kubelet-serving   system:node:server2   Approved,Issued

 
   
   
   
   
  • 1
  • 2
  • 3
  • 4
  • 5

可以看出状态都是Approved。

到此,Metrics-Server部署完成。

二、 Metrics-Server 的使用

此时就可以使用命令查看pod和node的状态:

[root@server1 limit]# kubectl top node
NAME      CPU(cores)   CPU%   MEMORY(bytes)   MEMORY%   
server1   197m         9%     922Mi           31%       
server2   35m          1%     421Mi           47%       
server3   39m          1%     341Mi           38%  
[root@server1 limit]# kubectl top pod
NAME                                      CPU(cores)   MEMORY(bytes)   
nfs-client-provisioner-6b66ddf664-2qf7m   1m           3Mi  

 
   
   
   
   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

可以查看所有namespace的pod:

[root@server1 limit]# kubectl top pod --all-namespaces 
NAMESPACE     NAME                                      CPU(cores)   MEMORY(bytes)   
default       nfs-client-provisioner-6b66ddf664-2qf7m   0m           3Mi             
kube-system   coredns-7ff77c879f-8gzr5                  3m           7Mi             
kube-system   coredns-7ff77c879f-dxst6                  3m           7Mi             
kube-system   etcd-server1                              15m          52Mi            
kube-system   kube-apiserver-server1                    25m          256Mi           
kube-system   kube-controller-manager-server1           11m          41Mi            
kube-system   kube-flannel-ds-amd64-8bj5x               2m           9Mi             
kube-system   kube-flannel-ds-amd64-qwk6c               3m           9Mi             
kube-system   kube-flannel-ds-amd64-wcqrh               2m           9Mi             
kube-system   kube-proxy-fvx88                          1m           14Mi            
kube-system   kube-proxy-m8xrc                          5m           10Mi            
kube-system   kube-proxy-qsq27                          1m           10Mi            
kube-system   kube-scheduler-server1                    3m           13Mi            
kube-system   metrics-server-7cdfcc6666-mdmps           1m           10Mi 

 
   
   
   
   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16

也可以以以下这种方式查看节点信息:

[root@server1 limit]# kubectl get --raw "/apis/metrics.k8s.io/v1beta1/nodes/server1"
{"kind":"NodeMetrics","apiVersion":"metrics.k8s.io/v1beta1","metadata":{"name":"server1","selfLink":"/apis/metrics.k8s.io/v1beta1/nodes/server1","creationTimestamp":"2020-05-08T19:30:32Z"},"timestamp":"2020-05-08T19:30:04Z","window":"30s","usage":{"cpu":"133684972n","memory":"944076Ki"}}
[root@server1 limit]# kubectl get --raw "/apis/metrics.k8s.io/v1beta1/nodes/server2"
{"kind":"NodeMetrics","apiVersion":"metrics.k8s.io/v1beta1","metadata":{"name":"server2","selfLink":"/apis/metrics.k8s.io/v1beta1/nodes/server2","creationTimestamp":"2020-05-08T19:30:36Z"},"timestamp":"2020-05-08T19:30:08Z","window":"30s","usage":{"cpu":"27951701n","memory":"428968Ki"}}
[root@server1 limit]# kubectl get --raw "/apis/metrics.k8s.io/v1beta1/nodes/server3"
{"kind":"NodeMetrics","apiVersion":"metrics.k8s.io/v1beta1","metadata":{"name":"server3","selfLink":"/apis/metrics.k8s.io/v1beta1/nodes/server3","creationTimestamp":"2020-05-08T19:30:38Z"},"timestamp":"2020-05-08T19:30:06Z","window":"30s","usage":{"cpu":"24529050n","memory":"351900Ki"}}

 
   
   
   
   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

上面这种方式看着比较麻烦,我们可以安装一个插件来更好的显示:

[root@server1 yum.repos.d]# cat epel.repo 			#阿里云的epel源
[epel]
name=epel
enabled=1
gpgcheck=0
baseurl=https://mirrors.aliyun.com/epel/7/x86_64/
[root@server1 yum.repos.d]# yum repolist 
[root@server1 yum.repos.d]# yum install jq -y

 
   
   
   
   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

之后再此以这个插件的方式查看:

[root@server1 limit]# kubectl get --raw "/apis/metrics.k8s.io/v1beta1/nodes/server3" | jq
{
  "kind": "NodeMetrics",
  "apiVersion": "metrics.k8s.io/v1beta1",
  "metadata": {
    "name": "server3",
    "selfLink": "/apis/metrics.k8s.io/v1beta1/nodes/server3",
    "creationTimestamp": "2020-05-08T19:36:27Z"
  },
  "timestamp": "2020-05-08T19:36:06Z",
  "window": "30s",
  "usage": {
    "cpu": "32311938n",
    "memory": "350656Ki"
  }
}

 
   
   
   
   
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16

可以看出信息更好的显示出来了。

你可能感兴趣的:(Linux Kubernetes 资源监控 Metrics-Server V0.3.6 部署与应用)