多机安装运行PBS (Torque)

本文链接:http://blog.csdn.net/kongxx/article/details/8022522

首先参考前一篇文章单机安装运行PBS (Torque)

假定“单机安装运行PBS (Torque)”中安装的机器作为master,下面来向cluster添加新的nodes。这里假定新加入nodes的机器名是host1和host2。


安装

1. 将master机器上生成的torque-package-*.sh文件复制到host1和host2上
2. 分别在host1和host2上运行下面命令执行安装

  $ sudo torque-package-mom-*.sh --install
  $ sudo torque-package-clients-*.sh --install


启动停止服务

1. 分别在host1和host2上运行下面命令启动mom服务

  $ sudo /url/local/sbin/pbs_mom
2. 在master机器上添加节点

  $ qmgr -c 'create node host1 np=5'
  $ qmgr -c 'create node host2 np=5'
添加完成后可以在master机器上使用qnodes命令查看,此时看到的新加入的两个节点state应该是offline。

3. 在master机器上重启服务使修改生效

  $ sudo /etc/init.d/pbs_server restart
再次在master机器上运行qnodes查看新加入节点状态,此时state变成了free,这说明新加入的节点已经生效可以使用了。


测试

1. 在master机器上写一个测试脚本/opt/test/sleep.sh, 内容如下

#!/bin/sh

sleep 600
2. 提交作业 (可以多提交一些,来检查是不是作业被分发到新添加的机器上运行了,比如运行下面的命令15次)

  $ qsub /opt/test/sleep.sh
3. 检查作业

  $ qstat -a -n
此时可以看到各个作业是在那个机器上运行的。








你可能感兴趣的:(多机安装运行PBS (Torque))