在2.1和2.2上发生这样的报错,可能由于大量的磁盘读写,就会发生这样的问题
以下两个链接是相关解决办法。
http://forum.ubuntu.org.cn/viewtopic.php?t=457387
https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=664855#10
[email protected]'s password:
Last login: Tue Jul 14 17:23:50 2015 from 172.16.1.44
[oracle@localhost ~]$
Message from syslogd@localhost at Jul 15 09:51:04 ...
kernel:BUG: soft lockup - CPU#2 stuck for 67s! [oracle:2721]
Message from syslogd@localhost at Jul 15 09:51:04 ...
kernel:BUG: soft lockup - CPU#3 stuck for 67s! [oracle:2790]
Message from syslogd@localhost at Jul 15 09:51:28 ...
kernel:BUG: soft lockup - CPU#0 stuck for 67s! [oracle:11330]
编写内核程序,出现soft lockup错误是再常见不过了,类似BUG: soft lockup - CPU#2 stuck for 67s!。
刚开始调试内核时,出现这样的错误,往往两眼一抹黑,不知道该如何下手了。但其实,这样的问题解决多了,会发现原因基本就两种情况,死锁和死循环。
所以,在出现soft lockup错误时,不用慌张,只要分析相关代码是不是存在死循环,比如 for循环的退出条件弄错了导致循环无法退出,等等;或者就是分析是不是相关代码在使用锁时不正确导致了死锁。比如,spinlock嵌套调用若顺序不对的话就可能导致死锁,等等。
总之,在出现soft lockup错误时,基本就从这两方面找原因就可以了。即使core dump文件中可能会给出其他的call trace,也要从上述两方面认真进行分析,从而可以拨云见日,找到问题的真正原因。
关于lockup我们可以简单了解下。lockup分为soft lockup和hard lockup。
soft lockup是指内核中有BUG导致在内核模式下一直循环的时间超过67s(根据实现和配置有所不同),而其他进程得不到运行的机会。
hard lockup的发生是由于禁止了CPU的所有中断超过一定时间(几秒)这种情况下,外部设备发生的中断无法处理,内核认为此时发生了所谓的hard lockup,出现这种情况的可能原因是由于spin_lock_irqsave导致的。
出现上面这个报错,接着只要挂载2.2nfs目录源的主机,使用df命令都不响应,如下图,ctrl-c也不能结束,只能关闭这个终端
描述-2014-12-2
还少两张图,
一张是:2.1的nfs源即/VM,在源都不可以写,成为只读
另一张是:在vsphere中打开虚拟机的报错图
下图20150329195600
http://blog.csdn.net/zzban/article/details/8736121
On a few systems, I've noticed CIFS mounts have a tendency to lock up the system when transferring large files, or a shitload of small ones in quick succession. When this happens, the system may or may not completely lock up, and lines like these will appear in your syslog:
lock up 把…锁起来;关起来
tendency n. 倾向,趋势;癖好
shitload 许多; 大量 [taboo, slang]