PBS/torque常见错误[转]

1、#  PBS_Server: Resource temporarily unavailable (11) in PBS_Server
出错的原因一般是server_name与mom设置的name不一致,修改server_name与mom一致即可。
 
server_name文件在PBS或torque的目录下。如果用rpm包安装的torque, 可以用下面的命令查询
rpm -ql torque

2、# qsub: Job exceeds queue resource limits MSG=cannot locate feasible nodes
在提交作业时候,如果PBS没有计算节点,就会出现这个错误。也可以用
pbsnodes

来查看PBS的节点。如果没有任何输出结果,说明需要设置计算节点。编辑文件
vim $PBS_HOME/server_priv/nodes

加入类似的节点,如
node001 np=2

重启PBS服务。

3、# mpiexec: cannot connect to local mpd
原因是PBS脚本没有启动mpd。启动mpd的简单方法是

cat $PBS_NODEFILE
NCPU=`wc -l < $PBS_NODEFILE`
NNODES=`uniq $PBS_NODEFILE | wc -l`
 
mpdboot -n ${NNODES} -f ${PBS_NODEFILE} -v --remcons
mpiexec -np $NCPU hostname
mpdallexit

你可能感兴趣的:(错误)