谈谈Linux假死

今天想谈谈在实际工作中常碰到的Linux系统假死现象。

首先,对假死做个定义:是指Linux内核alive,但是其上的某个或所有操作的响应变得很慢很慢的现象。


看看 Loadaverage比较高


有些进程负载很高,几乎不动了,但其他进程或者远程ssh上来都没有问题


系统整体某项性能过高,导致假死。体验过的案例如下。

1) 曾经跑过一个基于MPI的高性能计算程序,16个刀片节点的CPU利用率几乎都是100%,登陆这些节点时,变得很慢,但还是能进去。

2) 曾经跑过一个MySQL的应用LoadAverage过高(400-1000),节点所有操作很慢很慢,包括ls命令

3) 曾经有一个系统,采用LDAP统一登陆,又有LDAP服务器端的一些故障,导致登陆很慢很慢

4)    曾经有一个文件挂载到一个并行文件系统上,并行文件系统出问题后,ls 挂载点很慢很慢,当然,最终也挂不上


你可能感兴趣的:(谈谈Linux假死)