服务器卡顿排查方法

一、查看服务器的内存和服务器核数大小

①查看服务器内存大小

cat /proc/meminfo | grep MemTotal

②查看服务器核数

总核数 = 物理CPU个数 * 每个物理CPU的核数

查看CPU的个数：

cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l

查看每个CPU中core的个数

cat /proc/cpuinfo| grep "cpu cores"| uniq

二、查看服务器的负载

在确定CPU的内存和CPU核数后，就可以进一步观察服务器的负载

Linux的负载高，主要是由于CPU使用、内存使用、IO消耗三部分引起的。其中任何一项的急剧增加，都会使得服务器的负载急剧升高

top:查看服务器的负载

第一行：

top - 14:50:58 up 16:46, 2 users, load average: 1.15, 0.63, 0.44

14:50:58 ：系统当前时间

up 16:46 ：系统开机到现在经过了2天

2 users：当前1用户在线

load average: 1.15, 0.63, 0.44：系统1分钟、5分钟、15分钟的CPU负载信息.

备注：load average后面三个数值的含义是最近1分钟、最近5分钟、最近15分钟系统的负载值。这个值的意义是，单位时间段内CPU活动进程数。如果你的机器为单核，那么只要这几个值均<1，代表系统就没有负载压力，如果你的机器为N核，那么必须是这几个值均＜N才可认为系统没有负载压力。

第二行解释：

Tasks: 147 total, 1 running, 146 sleeping, 0 stopped, 0 zombie

147 total,：当前有108个任务

1 running：1个任务正在运行

46 sleeping,：107个进程处于睡眠状态

0 stopped：停止的进程数

0 zombie：僵死的进程数

第三行解释：

Cpu(s): 1.7%us, 0.2%sy, 0.0%ni, 95.6%id, 2.3%wa, 0.1%hi, 0.1%si, 0.0%st

1.7%us：用户态进程占用CPU时间百分比

0.2%sy,：内核占用CPU时间百分比

0.0%ni：renice值为负的任务的用户态进程的CPU时间百分比。nice是优先级的意思

95.6%id：空闲CPU时间百分比

2.3%wa：等待I/O的CPU时间百分比

0.1%hi：CPU硬中断时间百分比

0.1%si：CPU软中断时间百分比

第四行解释：

Mem: 32959108k total, 32783520k used, 175588k free, 291084k buffers

32959108k total：物理内存总数

32783520k used：使用的物理内存

175588k free：空闲的物理内存

291084k buffers：用作缓存的内存

第五行解释：

Swap: 4194296k total, 148k used, 4194148k free, 10365856k cached

4194296k total：交换空间的总量

148k used：使用的交换空间

4194148k free：空闲的交换空间

10365856k cached：缓存的交换空间

当服务器的一些性能指标都良好的情况下，就要排查数据库方面

三、数据库排查

SHOW FULL PROCESSLIS：命令的输出结果显示了有哪些线程在运行，不仅可以查看当前所有的连接数，还可以查看当前的连接状态帮助识别出有问题的查询语句等。

id列，用户登录mysql时，系统分配的"connection_id"，可以使用函数connection_id()查看

user列，显示当前用户。如果不是root，这个命令就只显示用户权限范围的sql语句

host列，显示这个语句是从哪个ip的哪个端口上发的，可以用来跟踪出现问题语句的用户

db列，显示这个进程目前连接的是哪个数据库

command列，显示当前连接的执行的命令，一般取值为休眠（sleep），查询（query），连接（connect）等

time列，显示这个状态持续的时间，单位是秒

state列，显示使用当前连接的sql语句的状态，很重要的列。state描述的是语句执行中的某一个状态。一个sql语句，以查询为例，可能需要经过copying to tmp table、sorting result、sending data等状态才可以完成

info列，显示这个sql语句，是判断问题语句的一个重要依据

服务器卡顿排查方法

你可能感兴趣的:(服务器卡顿排查方法)