服务器负载突然飙高事件


这几天手机老是收到zabbix的报警邮件,公司的某太服务器的负载飚得非常高,今天来公司查了下到底是什么情况,后来我经过了一些监控工具的帮助,我成功的找到了服务器高负载的原因,原来是同事使用rsync同步的原因,按道理来说,rsync同步也不至于IO这么高啊?看了下rsync的同步脚本,里面有条命令(chown -R web:web /www(这个目录里面有非常多的内容,200G的大小j_0004.gif每次同步都需要chown递归,那不是傻了吗?j_0012.gif肯定服务器的负载飙高了。j_0013.gif))导致了服务器的负载飙高,把这条命令注释后,服务器负载一下子降下来了。




我使用了iotop和iostat和uptime等命令,分别打开三个窗口。


iotop动态查看是哪个程序的IO比较高

iostat动态查看服务器的IO使用率(%util)百分比,如果有70%以上,说明你服务器的磁盘IO出现瓶颈了

uptime加上watch实现动态服务器负载查看,比如1分钟负载,5分钟负载,15分钟负载


关于这三个工具的使用,可以去网上查查资料。

这三个工具还是挺重要的,可以帮助你找出服务器负载的原因,最好还是学习下吧,以后肯定会有用到的。


当然了,还有其他很多好用的工具,我这次只是用到这三个而已。


你可能感兴趣的:(linux,iostat,iotop)