之前因为一次黑客入侵,他喵的重装系统,浪潮的哥们给我们搞定了,但是还有点问题,今天又问了下,把解决过程记录在这里。
1. NIS
因为重装系统,原来加系统用户的脚本没了,只好手动的。步骤:
1) 添加用户
mu02: useradd -m liuqiang2
passwd liuqiang2
cd /var/yp
make //保证NIS所有节点同步
之前不要忘记主节点启动NIS服务: service ypserv start
子节点启动: tentakel -g c1 service ypbind start
最后别忘了加入开机启动:
chkconfig ypserv on
tentakel -g c1 chkconfig ypbind on
2. PBS
因为之前防火墙的原因,注释了pbs的环境变量,现在在所有计算节点的/etc/profile末尾加上:
export TSCE_HOME=/opt/tsce
source /opt/tsce/share/tsce.profile //参考/lustre/bak下的profile文件
tentakel -g c1 'echo "export TSCE_HOME=/opt/tsce">>/etc/profile'
tentakel -g c1 'echo "source /opt/tsce/share/tsce.profile">>/etc/profile'
启动主节点pbs服务: service pbs_server status 或者 /etc/init.d/pbs_server start
重启所有节点的pbs服务
tentakel -g c1 service pbs_mom start
之前要注意: 1. tentakel -g c1 date 看各节点是否可用
2. 确认 各个节点挂在了/opt/tsce/share目录
查看pbs空闲节点,切换到普通用户目录下,登陆计算节点,执行: pbsnodes -l free
最后 , QQ还有远程桌面功能,太牛叉了!
后续问题: 出现了计算节点上qstat能够执行,但是主节点用户qstat不能执行,这样用户无法提交任务的问题。
此时mount -l 发现/home都挂载了,后来浪潮的人说是PBS环境变量没设置好,root下,执行
source /etc/profile ,即可.
export JAVA_HOME=/opt/tsce/share/jdk1.6.0_10
export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH:.
export CLASSPATH=$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$CLASSPATH:.
export TOMCAT_HOME=/opt/tsce/apache-tomcat-6.0.18
export TORQUE_HOME=/opt/tsce
export PATH=$TORQUE_HOME/share/bin:$TORQUE_HOME/share/sbin:$PATH
export MAUI_HOME=/usr/local/maui
export PATH=$MAUI_HOME/sbin:$MAUI_HOME/bin:$PATH
export TSCMSS_HOME=/opt/tsce/share/TSCMSS
export PATH=$TSCMSS_HOME:$PATH:.
export CLASSPATH=$TSCMSS_HOME:$CLASSPATH:.
export TSCE_HOME=/opt/tsce
source /opt/tsce/share/tsce.profile