mpich2 高性能集群

安装软件:
两台主机:192.168.0.81  192.168.0.34
yum install gcc gcc-c++ gcc-gfortran -y
在各个集群结点之间创建SSH 信任连接,这里用到NFS,新建smart用户,将此用户共享出去,让其他结点挂载

useradd -u 600 smart       两台主机都要创建相同用户名的用户
passwd  smart  密码为westos
在192.168.0.81上面:
su - smart
ssh-keygen      产生密码,一路回车即可
ssh-copy-id -i  ~/.ssh/id_rsa.pub 192.168.0.34 
创建信任连接,使各个结点登录都不需要密码

配置NFS服务端:
vim /etc/exports
/home/smart    192.168.0.34(rw,sync,all_squash,anonuid=600,anongid=600)
/etc/init.d/rpcbind start
/etc/init.d/nfslock start
/etc/init.d/nfs start

在192.168.0.34上面:
/etc/init.d/rpcbind start
/etc/init.d/nfslock start
/etc/init.d/nfs start
showmount -e 192.168.0.81
mount 192.168.0.81:/home/smart   /home/smart
df -h
su - smart

在两台主机安装:
yum  install mpich2 -y    在每个集群节点上安装mpich2
在192.168.0.81上面:
su - smart
vim .mpd.conf
secretword=wesot    smart用户的密码
chmod 600 .mpd.conf
vim mpd.hosts           集群节点集合文件
desktop81.example.com
desktop34.example.com  
注:如果以root用户启动mpd服务, 把mpd.conf文件创建在/etc目录中(不加"."),
mpd.hosts放在root主目录中

mpdboot -n 2 -f mpd.hosts    参数-n 2指定了要启动的机器个数,-f mpd.hosts指定了通过mpd.hosts运行
mpdtrace   可以列出两台主机的主机名
desktop81
desktop34
mpdallexit  退出mpd
在192.168.0.34上面:
mpdtrace   同样可以列出主机名

下载测试文件:这里用 cipi ,计算圆周率的
chmod +x cipi
./icpi     执行后可以选择 计算精度,分别为10000,100000000  单机计算测试
mpiexec -n 2 /home/smart/icpi   精度也分别为10000,100000000 集群计算测试,然后分别对比执行时间

注:当计算量小的时候,并行运算的效果不明显。这是因为并行运算过程中,参与运算的机器需要通过网络传递一些消息,如果计算量不大的话,花在了这上面的时间影响会比较明显,因而反不如单机版的来得快。

使用 rsh 方式解决结点之间的联通性更为方便,因为它允许除 root 用户外的其他用户免密码登录,此服务受xinetd服务管理,但用 ssh 方式更为安全。在测试连通性时使用非root用户去测试,并且此
用户在所有节点上都存在。

排错:
mpdcheck获得帮助信息:
mpdcheck -pc
mpdcheck -l
通过mpd.hosts文件查错:
mpdcheck -f mpd.hosts
mpdcheck -f mpd.hosts -ssh
对任意两台机器进行查错:
mpdcheck -s
返回主机名host和端口port:即
server listening at INADDR_ANY on: desktop81.example.com 44178
 

你可能感兴趣的:(MPICH2,高性能集群)