一、查看服务器的内存和服务器核数大小
①查看服务器内存大小
cat /proc/meminfo | grep MemTotal
②查看服务器核数
总核数 = 物理CPU个数 * 每个物理CPU的核数
查看CPU的个数:
cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l
查看每个CPU中core的个数
cat /proc/cpuinfo| grep "cpu cores"| uniq
二、查看服务器的负载
在确定CPU的内存和CPU核数后,就可以进一步观察服务器的负载
Linux的负载高,主要是由于CPU使用、内存使用、IO消耗三部分引起的。其中任何一项的急剧增加,都会使得服务器的负载急剧升高
top:查看服务器的负载
第一行:
top - 14:50:58 up 16:46, 2 users, load average: 1.15, 0.63, 0.44
14:50:58 :系统当前时间
up 16:46 :系统开机到现在经过了2天
2 users:当前1用户在线
load average: 1.15, 0.63, 0.44:系统1分钟、5分钟、15分钟的CPU负载信息.
备注:load average后面三个数值的含义是最近1分钟、最近5分钟、最近15分钟系统的负载值。这个值的意义是,单位时间段内CPU活动进程数。如果你的机器为单核,那么只要这几个值均<1,代表系统就没有负载压力,如果你的机器为N核,那么必须是这几个值均<N才可认为系统没有负载压力。
第二行解释:
Tasks: 147 total, 1 running, 146 sleeping, 0 stopped, 0 zombie
147 total,:当前有108个任务
1 running:1个任务正在运行
46 sleeping,:107个进程处于睡眠状态
0 stopped:停止的进程数
0 zombie:僵死的进程数
第三行解释:
Cpu(s): 1.7%us, 0.2%sy, 0.0%ni, 95.6%id, 2.3%wa, 0.1%hi, 0.1%si, 0.0%st
1.7%us:用户态进程占用CPU时间百分比
0.2%sy,:内核占用CPU时间百分比
0.0%ni:renice值为负的任务的用户态进程的CPU时间百分比。nice是优先级的意思
95.6%id:空闲CPU时间百分比
2.3%wa:等待I/O的CPU时间百分比
0.1%hi:CPU硬中断时间百分比
0.1%si:CPU软中断时间百分比
第四行解释:
Mem: 32959108k total, 32783520k used, 175588k free, 291084k buffers
32959108k total:物理内存总数
32783520k used: 使用的物理内存
175588k free:空闲的物理内存
291084k buffers:用作缓存的内存
第五行解释:
Swap: 4194296k total, 148k used, 4194148k free, 10365856k cached
4194296k total:交换空间的总量
148k used: 使用的交换空间
4194148k free:空闲的交换空间
10365856k cached:缓存的交换空间
当服务器的一些性能指标都良好的情况下,就要排查数据库方面
三、数据库排查
SHOW FULL PROCESSLIS:命令的输出结果显示了有哪些线程在运行,不仅可以查看当前所有的连接数,还可以查看当前的连接状态帮助识别出有问题的查询语句等。
id列,用户登录mysql时,系统分配的"connection_id",可以使用函数connection_id()查看
user列,显示当前用户。如果不是root,这个命令就只显示用户权限范围的sql语句
host列,显示这个语句是从哪个ip的哪个端口上发的,可以用来跟踪出现问题语句的用户
db列,显示这个进程目前连接的是哪个数据库
command列,显示当前连接的执行的命令,一般取值为休眠(sleep),查询(query),连接(connect)等
time列,显示这个状态持续的时间,单位是秒
state列,显示使用当前连接的sql语句的状态,很重要的列。state描述的是语句执行中的某一个状态。一个sql语句,以查询为例,可能需要经过copying to tmp table、sorting result、sending data等状态才可以完成
info列,显示这个sql语句,是判断问题语句的一个重要依据