Linux系统出现系统没有响应。 在/var/log/message日志中出现大量的 “echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.” 和 “blocked for more than 120 seconds” 错误。如下图:


Linux系统出现hung_task_timeout_secs和blocked for_第1张图片

 

  IT网,http://www.it.net.cn

问题原因:  Linux学习,http:// linux.it.net.cn

默认情况下, Linux会最多使用40%的可用内存作为文件系统缓存。当超过这个阈值后,文件系统会把将缓存中的内存全部写入磁盘, 导致后续的IO请求都是同步的。


将缓存写入磁盘时,有一个默认120秒的超时时间。 出现上面的问题的原因是IO子系统的处理速度不够快,不能在120秒将缓存中的数据全部写入磁盘。


IO系统响应缓慢,导致越来越多的请求堆积,最终系统内存全部被占用,导致系统失去响应。 

  Linux学习,http:// linux.it.net.cn

解决方法:


根据应用程序情况,对vm.dirty_ratio,vm.dirty_background_ratio两个参数进行调优设置。 例如,推荐如下设置:


# sysctl -w vm.dirty_ratio=10


# sysctl -w vm.dirty_background_ratio=5

# sysctl -p


 


如果系统永久生效,修改/etc/sysctl.conf文件。加入如下两行:


#vi /etc/sysctl.conf  IT网,http://www.it.net.cn

  IT网,http://www.it.net.cn

vm.dirty_background_ratio = 5 Linux学习,http:// linux.it.net.cn

vm.dirty_ratio = 10


# sysctl -p