服务器卡顿排查方法

原文:https://blog.csdn.net/weixin_39539399/article/details/83896748 
 

背景:用户反馈系统好卡,进行系统排除,找到这篇帖子进行简单的学习。

一、查看服务器的内存和服务器核数大小
①查看服务器内存大小

cat /proc/meminfo | grep MemTotal

②查看服务器核数

总核数 = 物理CPU个数 * 每个物理CPU的核数

查看CPU的个数:

cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l

查看每个CPU中core的个数

cat /proc/cpuinfo| grep "cpu cores"| uniq

二、查看服务器的负载
在确定CPU的内存和CPU核数后,就可以进一步观察服务器的负载

Linux的负载高,主要是由于CPU使用、内存使用、IO消耗三部分引起的。其中任何一项的急剧增加,都会使得服务器的负载急剧升高

top:查看服务器的负载

第一行:

top - 14:50:58 up 16:46,  2 users,  load average: 1.15, 0.63, 0.44
14:50:58 :系统当前时间 
up 16:46 :系统开机到现在经过了2天 
2 users:当前1用户在线 
load average: 1.15, 0.63, 0.44:系统1分钟、5分钟、15分钟的CPU负载信息. 
备注:load average后面三个数值的含义是最近1分钟、最近5分钟、最近15分钟系统的负载值。这个值的意义是,单位时间段内CPU活动进程数。如果你的机器为单核,那么只要这几个值均<1,代表系统就没有负载压力,如果你的机器为N核,那么必须是这几个值均<N才可认为系统没有负载压力。

第二行解释: 
Tasks: 147 total,   1 running, 146 sleeping,   0 stopped,   0 zombie
147 total,:当前有108个任务 
1 running:1个任务正在运行 
46 sleeping,:107个进程处于睡眠状态 
  0 stopped:停止的进程数 
0 zombie:僵死的进程数

第三行解释: 
Cpu(s):  1.7%us,  0.2%sy,  0.0%ni, 95.6%id,  2.3%wa,  0.1%hi,  0.1%si,  0.0%st
1.7%us:用户态进程占用CPU时间百分比 
0.2%sy,:内核占用CPU时间百分比 
 0.0%ni:renice值为负的任务的用户态进程的CPU时间百分比。nice是优先级的意思 
95.6%id:空闲CPU时间百分比 
2.3%wa:等待I/O的CPU时间百分比 
0.1%hi:CPU硬中断时间百分比 
0.1%si:CPU软中断时间百分比

第四行解释: 
Mem:  32959108k total, 32783520k used,   175588k free,   291084k buffers
32959108k total:物理内存总数 
32783520k used: 使用的物理内存 
175588k free:空闲的物理内存 
291084k buffers:用作缓存的内存

第五行解释: 
Swap:  4194296k total,      148k used,  4194148k free, 10365856k cached
4194296k total:交换空间的总量 
148k used: 使用的交换空间 
4194148k free:空闲的交换空间 
10365856k cached:缓存的交换空间

当服务器的一些性能指标都良好的情况下,就要排查数据库方面



 

你可能感兴趣的:(服务器卡顿排查方法)