mpd无法启动的案例及解决

在集群中启动mpd时,有一个节点的mpd无法启动,单独启动该节点mpd,出现以下显示:

n07_55851: mpd_uncaught_except_tb handling:
exceptions.OSError: [Errno 30] Read-only file system: '/tmp/mpd2.console_icebergs'
/opt/mpich2/bin/mpdlib.py 1128 __init__
os.unlink(self.conFilename)
/opt/mpich2/bin/mpd 237 run
self.conListenSock = MPDConListenSock(secretword=self.parmdb['MPD_SECRETWORD'])
/opt/mpich2/bin/mpd 1492 ?
mpd.run()

开始,以为是该节点 mpich 配置出了问题:
首先,使用 mpdcheck -pc 检查该节点和其他节点的配置,一致没有问题。
然后,使用 mpdcheck -s 和 mpdcheck -c 测试该节点,正常。(具体过程参考mpich安装手册),又使用以上两个命令测试该节点和其他节点的连接,也正常。

仔细看出错信息,尝试在/tmp下创建文件失败,提示:

mkdir: cannot create directory `test': Read-only file system

原来 mpd 启动后会在 /tmp 下创建一个名为 mpd2.console_* 的文件,而现在文件系统变成了只读的文件系统,没有写权限了,所以提示出错。

可能是该节点非正常关机所致或硬盘故障吧,使用fsck命令进行硬盘修复,fsck -y,重启之后系统恢复正常~

你可能感兴趣的:(MPI/OpenMP)