工作笔记2:SMC计算节点重刷系统步骤

一:适用环境

1.比如计算节点为n001-n008(此为主机名)

2.因为n006系统硬盘故障,现在需要更换n006的系统盘,或者其他原因,虽然不更换系统盘,但是需要重刷系统

 

二:操作步骤如下

1.在更换或重刷之前需要先备份n006节点/root下的.ssh目录和/etc下的ssh目录

2.关闭n006节点,更换新系统盘

3.在SMC内重新刷(部署)n006节点

 

三:n006节点系统重刷好后,需要做的操作如下

◆ssh设置

1.把/etc目录下的ssh目录替换为备份的ssh目录

2.把/root/.ssh目录替换为备份的.ssh目录

3.重启ssh服务

4.检查该节点是否可以正常无密码访问其他节点,其他节点是否也可以正常无密码访问本节点

 

◆配置hosts

1.从正常的节点上(比如n001)拷贝hosts文件到/etc目录下

 

◆配置网络部分

1.从正常的节点上(比如n001)拷贝外网eth1的配置文件ifcfg-eth1到/etc /sysconfig/network目录下(别忘了把IP地址更改为n006所对应的IP)

2.检查ib网口配置文件是否正确(能否正常激活ib端口)

3.查看外网的默认路由是否正确配置(如果没有请配置默认路由)

4.重启网络查看外网eth1和ib网口是否都已正常激活

 

◆配置相关挂载

1.对照正常节点(比如n001)把需要挂载的nfs共享挂载

 

◆配置PBS

1.从正常的节点上(比如n001)拷贝PBS到该节点上并启动PBS服务

#scp -r n001:/var/spool/PBS /var/spool/

#scp -r n001:/opt/pbs /opt

#scp n001:/etc/pbs.conf /etc/

#scp n001:/etc/init.d/pbs /etc/init.d/

#/etc/init.d/pbs start

#chkconfig pbs on

 

注:有时计算节点主机名做过更改,这时可能需要重新生成新的payload和image


你可能感兴趣的:(SMC,集群管理软件)