liunx系统mail文件过大引起的服务器无法响应

今天一台CentOS 5.x 64bit的服务器发生异常,能ping通但ssh始终连接不上,服务器上跑着的服务也都全部无法访问,我估计是某个程序出了问题把cpu给耗完,这种情况没有其它办法只能通知机房重启机器。

 

重启后检查系统日志找到了故障原因:fmw用户的mail文件已经超过10G了!这台机器上部署了大量以fmw账号运行的crontab程序,每次crontab程序执行系统都会给用户发送一条mail消息,当mail文件过大系统可能无法继续往里写只能不断重试,从而导致系统负载过大。

 

教训:如果服务器上某个账号下部署有大量的crontab程序,那么需要定期清理/var/mail目录下该用户的mail文件!

你可能感兴趣的:(liunx)