Kubernetes 集群分析查看内存,CPU

Kubernetes方式

top命令查看所有pod,nodes中内存,CPU使用情况

查看pod

root @ master ➜  ~  kubectl top pod -n irm-server
NAME                                   CPU(cores)   MEMORY(bytes)   
test-ecd-server-56b77d9fbb-zfctt       1m           1529Mi          
test-flow-server-b477756f-2s5bc        1m           3006Mi          
test-huishi-api-86dcfdb7c5-jtcpt       0m           1829Mi          
test-huishi-message-5d4b456b88-n8xl5   241m         344Mi           
test-huishi-schedule-bc5f5d4d5-z22gq   3m           510Mi           
test-huishi-server-6f875487d7-9rzpd    44m          1483Mi          
test-irm-bd9444948-rwtgn               1m           1270Mi          
test-irm-task-89f65f5bd-zht2x          0m           1282Mi          
test-order-server-5fcc5575bd-67c4r     32m          1066Mi          
test-payment-6df4459864-5d8xl          1m           634Mi           
test-urule-54f4b8f84f-l5xbm            1m           2382Mi   

查看具体某一个pod

root @ master ➜  ~  kubectl top pod test-huishi-server-6f875487d7-9rzpd -n irm-server
NAME                                  CPU(cores)   MEMORY(bytes)   
test-huishi-server-6f875487d7-9rzpd   36m          1489Mi 

查看nodes

root @ master ➜  ~  kubectl top nodes -n irm-server
NAME      CPU(cores)   CPU%      MEMORY(bytes)   MEMORY%   
master    225m         9%        2853Mi          25%       
node1     219m         3%        18990Mi         65%       
node11    61m          6%        4236Mi          31%       
node12    2344m        36%       27839Mi         101%      
node2     76m          7%        7950Mi          59%       
node4     106m         10%       8151Mi          61%       
node5     123m         12%       4877Mi          92%       
node6     129m         12%       5614Mi          42%       
node7     58m          5%        3738Mi          28%       
node8     132m         6%        9098Mi          57%       
node9     60m          6%        3017Mi          22%  

查看具体某一个node

root @ master ➜  ~  kubectl top nodes node1 -n irm-server 
NAME      CPU(cores)   CPU%      MEMORY(bytes)   MEMORY%   
node1     222m         3%        19009Mi         65%   

上面使用nodes,node都可以

进入容器pod内部查看

root @ master ➜  ~  kubectl exec test-huishi-server-6f875487d7-9rzpd -it sh -n irm-server    
/home # jps 1
sh: jps: not found
/home # jstack 1
sh: jstack: not found
/home # exit
command terminated with exit code 127

docker容器内部没有jstack命令

Docker方式

找到具体pod所在的节点,进入使用docker命令查看具体的信息

docker top命令查看

[root@node1 ~]# docker ps -a |grep huishi-server
73c1189ddd0e        18.16.200.191:5000/test/huishi-server         "/bin/sh -c 'java $J…"   20 hours ago        Up 20 hours                                    k8s_test-huishi-server_test-huishi-server-7f4f5c5f8c-kqzrw_irm-server_2bc27a95-216a-11ea-932e-525400506c6a_0
ed1a36493259        gcr.io/google_containers/pause-amd64:3.0      "/pause"                 20 hours ago        Up 20 hours                                    k8s_POD_test-huishi-server-7f4f5c5f8c-kqzrw_irm-server_2bc27a95-216a-11ea-932e-525400506c6a_0

[root@node1 ~]# docker top 73c1189ddd0e
UID                 PID                 PPID                C                   STIME               TTY                 TIME                CMD
root                3439                3416                0                   Dec18               ?                   00:11:41            java -XX:+UnlockExperimentalVMOptions -XX:+UseCGroupMemoryLimitForHeap -XX:MaxRAMFraction=1 -Xms1024M -Duser.timezone=GMT+08 -Dfile.encoding=UTF-8 -javaagent:/data/jacocoagent.jar=includes=*,output=file,append=true,destfile=/data/log/huishi-server/jacoco.exec -jar /home/huishi-server.jar

docker stats 命令查看

docker stats 命令用来返回运行中的容器的实时数据流,

默认情况下,stats 使用参数-a或者--all,命令会每隔 1 秒钟刷新一次输出的内容直到你按下 ctrl + c。

[root@node1 ~]# docker stats -a

CONTAINER ID        NAME                                                                                                                                CPU %               MEM USAGE / LIMIT     MEM %               NET I/O             BLOCK I/O           PIDS
1ad181f01c76        k8s_POD_test-capital-schedule-6468f8774f-2s6dd_common-server_78d133b9-21f7-11ea-932e-525400506c6a_0                                 0.00%               1.766MiB / 30.89GiB   0.01%               0B / 0B             0B / 0B             1
73c1189ddd0e        k8s_test-huishi-server_test-huishi-server-7f4f5c5f8c-kqzrw_irm-server_2bc27a95-216a-11ea-932e-525400506c6a_0                        0.04%               1.178GiB / 2GiB       58.88%              0B / 0B             0B / 254kB          68
ed1a36493259        k8s_POD_test-huishi-server-7f4f5c5f8c-kqzrw_irm-server_2bc27a95-216a-11ea-932e-525400506c6a_0                                       0.00%               1.25MiB / 30.89GiB    0.00%               0B / 0B             0B / 0B             1
05c08624b3d7        k8s_POD_test-p2p-bms-7db78b7c46-9vvnt_common-server_759c4604-1c7e-11ea-932e-525400506c6a_0                                          0.00%               1.543MiB / 30.89GiB   0.00%               0B / 0B             0B / 0B             1
9013e1d0a243        k8s_POD_test-institution-6569774458-t8sk9_institution-server_f35e22c0-1a2e-11ea-932e-525400506c6a_0                                 0.00%               1.578MiB / 30.89GiB   0.00%               0B / 0B             0B / 0B             1

输出内容:

[CONTAINER]:以短格式显示容器的 ID。
[CPU %]:CPU 的使用情况。
[MEM USAGE / LIMIT]:当前使用的内存和最大可以使用的内存。
[MEM %]:以百分比的形式显示内存使用情况。
[NET I/O]:网络 I/O 数据。
[BLOCK I/O]:磁盘 I/O 数据。
[PIDS]:PID 号。

如果不想持续的监控容器使用资源的情况,可以通过 --no-stream 选项只输出当前的状态:

[root@node1 ~]# docker stats --no-stream 
CONTAINER ID        NAME                                                                                                                                CPU %               MEM USAGE / LIMIT     MEM %               NET I/O             BLOCK I/O           PIDS
1ad181f01c76        k8s_POD_test-capital-schedule-6468f8774f-2s6dd_common-server_78d133b9-21f7-11ea-932e-525400506c6a_0                                 0.00%               1.766MiB / 30.89GiB   0.01%               0B / 0B             0B / 0B             1
73c1189ddd0e        k8s_test-huishi-server_test-huishi-server-7f4f5c5f8c-kqzrw_irm-server_2bc27a95-216a-11ea-932e-525400506c6a_0                        1.72%               1.178GiB / 2GiB       58.89%              0B / 0B             0B / 254kB          68
ed1a36493259        k8s_POD_test-huishi-server-7f4f5c5f8c-kqzrw_irm-server_2bc27a95-216a-11ea-932e-525400506c6a_0                                       0.00%               1.25MiB / 30.89GiB    0.00%               0B / 0B             0B / 0B             1
05c08624b3d7        k8s_POD_test-p2p-bms-7db78b7c46-9vvnt_common-server_759c4604-1c7e-11ea-932e-525400506c6a_0                                          0.00%               1.543MiB / 30.89GiB   0.00%               0B / 0B             0B / 0B             1
9013e1d0a243        k8s_POD_test-institution-6569774458-t8sk9_institution-server_f35e22c0-1a2e-11ea-932e-525400506c6a_0                                 0.00%               1.578MiB / 30.89GiB   0.00%               0B / 0B             0B / 0B             1
366e27c0265f        k8s_debug-agent_debug-agent-h88sf_kube-system_263ac99f-133f-11ea-932e-525400506c6a_0                                                0.00%               10.3MiB / 30.89GiB    0.03%               0B / 0B             0B / 0B             14

格式化输出

[root@node1 ~]# docker stats --no-stream --format "table {{.Container}}\t{{.Name}}\t{{.CPUPerc}}\t{{.MemUsage}}"
CONTAINER           NAME                                                                                                                                CPU %               MEM USAGE / LIMIT
1ad181f01c76        k8s_POD_test-capital-schedule-6468f8774f-2s6dd_common-server_78d133b9-21f7-11ea-932e-525400506c6a_0                                 0.00%               1.766MiB / 30.89GiB
73c1189ddd0e        k8s_test-huishi-server_test-huishi-server-7f4f5c5f8c-kqzrw_irm-server_2bc27a95-216a-11ea-932e-525400506c6a_0                        0.32%               1.178GiB / 2GiB
ed1a36493259        k8s_POD_test-huishi-server-7f4f5c5f8c-kqzrw_irm-server_2bc27a95-216a-11ea-932e-525400506c6a_0                                       0.00%               1.25MiB / 30.89GiB
05c08624b3d7        k8s_POD_test-p2p-bms-7db78b7c46-9vvnt_common-server_759c4604-1c7e-11ea-932e-525400506c6a_0                                          0.00%               1.543MiB / 30.89GiB
9013e1d0a243        k8s_POD_test-institution-6569774458-t8sk9_institution-server_f35e22c0-1a2e-11ea-932e-525400506c6a_0                                 0.00%               1.578MiB / 30.89GiB
366e27c0265f        k8s_debug-agent_debug-agent-h88sf_kube-system_263ac99f-133f-11ea-932e-525400506c6a_0                                                0.05%               10.3MiB / 30.89GiB

上面的命令中我们只输出了 Name, CPUPerc 和 Memusage 三列。

下面是自定义的格式中可以使用的所有占位符:

.Container 根据用户指定的名称显示容器的名称或 ID。
.Name 容器名称。
.ID 容器 ID。
.CPUPerc CPU 使用率。
.MemUsage 内存使用量。
.NetIO 网络 I/O。
.BlockIO 磁盘 I/O。
.MemPerc 内存使用率。
.PIDs PID 号。

有了这些信息我们就可以完全按照自己的需求或者是偏好来控制 docker stats 命令输出的内容了。

JSON格式输出

docker stats --no-stream --format \
"{\"container\":\"{{ .Container }}\",\"memory\":{\"raw\":\"{{ .MemUsage }}\",\"percent\":\"{{ .MemPerc }}\"},\"cpu\":\"{{ .CPUPerc }}\"}"

{"container":"1ad181f01c76","memory":{"raw":"1.766MiB / 30.89GiB","percent":"0.01%"},"cpu":"0.00%"}
{"container":"73c1189ddd0e","memory":{"raw":"1.178GiB / 2GiB","percent":"58.90%"},"cpu":"0.33%"}
{"container":"ed1a36493259","memory":{"raw":"1.25MiB / 30.89GiB","percent":"0.00%"},"cpu":"0.00%"}
{"container":"05c08624b3d7","memory":{"raw":"1.543MiB / 30.89GiB","percent":"0.00%"},"cpu":"0.00%"}
{"container":"9013e1d0a243","memory":{"raw":"1.578MiB / 30.89GiB","percent":"0.00%"},"cpu":"0.00%"}
{"container":"366e27c0265f","memory":{"raw":"10.3MiB / 30.89GiB","percent":"0.03%"},"cpu":"0.00%"}
{"container":"9f206bab70fd","memory":{"raw":"1.465MiB / 30.89GiB","percent":"0.00%"},"cpu":"0.00%"}
{"container":"7a34c4cb664f","memory":{"raw":"1.555MiB / 30.89GiB","percent":"0.00%"},"cpu":"0.00%"}

容器内部查看分析

进入到容器:

[root@node1 ~]# docker exec -it  1218a5d5022d  sh
/home # cd /
/ # find . -name "jdk*"
^C
/ # find . -name "*jdk*"
^C
/ # find . -name "*jre*"
./opt/jre
./opt/jre1.8.0_231

进入到docker容器,发现并没有jdk,只有jre

docker cp迁移jdk到容器

[root@node1 java]# docker cp jdk1.8.0_91  1218a5d5022d:/usr/local
[root@node1 java]# docker exec -it  1218a5d5022d  sh
/home # cd /usr/local
/usr/local # ls
bin          jdk1.8.0_91  lib          share
/usr/local # jps
sh: jps: not found

命令不能使用

设置PATH环境变量

[root@node1 bin]# export PATH="$PATH:/usr/java/jdk1.8.0_91/bin"

[root@node1 bin]# echo $PATH
/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin:/usr/java/jdk1.8.0_91/bin

再次执行命令:

[root@node1 bin]# jps
-bash: /usr/java/jdk1.8.0_91/bin/jps: Permission denied

发现没有权限。

这其实不是什么 Bug,而是 Docker 自 1.10 版本开始加入的安全特性。

类似于 jmap 这些 JDK 工具依赖于 Linux 的 PTRACE_ATTACH,而是 Docker 自 1.10 在默认的 seccomp 配置文件中禁用了 ptrace。

释放docker容器ptrace权限

在docker run 命令中加上参数--cap-add=SYS_PTRACE
docker run --cap-add=SYS_PTRACE ......

日志分析方式:

k8s日志查看

kubectl logs
kubectl logs -f # 实时查看日志

kubectl logs -f test-huishi-server-6c68d8c769-5lf9z -n irm-server

docker日志查看

 docker logs da0072b10205

其他容器排查工具

kubectl debug

docker debug

参考:

kubectl 命令技巧大全

记一次k8s环境java服务卡死的处理

你可能感兴趣的:(Kubernetes 集群分析查看内存,CPU)