1. Linux 安装
  安装过程就不多说了。需要注意的是安装时,如果机群不与外界联网则可以不考虑安全方面的因素而把rsh选为可信赖的服务,注意安装相应的软件包;如果还要与外界保持联网,出于安全需要应把ssh选为可信赖的服务。安装以后,应该保证各节点之间能够用ssh相互登录。每个节点的sshd都应该能正常提供服务。主机名:node1...noden (我所构
  建的系统n=2)
   2.创建NFS服务
  在服务器节点public目录下建立mpi目录,并将其配置成NFS服务器,在/etc/exports文件中加入一行:
  /public/mpi node1(rw) node2(rw)
  在客户端节点的/etc/fstab文件中增加一行:
  sever :/pubilc/mpi nfs rw , bg , soft 0 0
  将/public/mpi这个目录从服务器节点输出,并装载在各客户端,从而便于在各节点间分发任务
   3.修改/etc/hosts文件
  将所有节点名称极其ip地址填入。例如:
  127.0.0.1 localhost.localdomain localhost
  192.168.1.1 node1
  192.168.1.2 node2
  …………………….
  每个节点都进行类似的配置。这样做的目的是使节点之间能够通过node1 ... noden的名称相互访问。你可以通过ping noden 或 ssh noden进行测试。
   4.修改(或创建)/etc/hosts.equiv文件
  将所有你允许访问本机进行mpi计算的机器名填入,一行一个机器名。这一步是为了使节点对其它的节点放权。
  例如,我的node1是我用于启动mpi集群计算的机器,其他的节点是参与计算者,在node 1的/etc/hosts.equiv文件是这样的:
  node1 #给自己放权,这样在只有一台机器时也可以模拟并行计算环境
  node2
  .....
  noden
  在node2...noden的/etc/hosts.equiv文件:
  node1 #对node1放权
  node2
  ......
  noden   5.修改~/.bash_profile文件
  首先决定一个用于启动集群计算的用户名,不提倡使用root进行集群计算。这里在每个节点上建立新用户chief,他们的主目录都是/home/chief,必须采用同样的密码,将来 的计算程序必须放在相同的路径上。譬如你的程序为:fpi.f和a.out,则必须把a.out放在同样的路境内,比如~/mpirun/a.out,每个节点都是如此。 修改~/.bash_profile文件,主要是加入下列几行脚本:
  export PATH=$PATH:/usr/local/mpich/bin
  export MPI_USEP4SSPORT=yes
  export MPI_P4SSPORT=22
  export P4_RSHCOMMAND=rsh 或ssh
  这里我们预定了将来mpich的运行环境安装在目录/usr/local/mpich下面。其余的三个变量是用来通知mpi运行环境采用rsh(或ssh)来作为远程shell。 Linux的运行环境到此就配置完毕了。
   6.配置rsh 或ssh
  对于采用rsh来作为远程shell运行MPI的用户只要保证在各个节点上都具有相同的用户,并把这一用户的密码设为空密码就可以运行了。
  若采用ssh作为远程shell则按如下配置:以你设定的用于启动mpi计算的用户登录,运行ssh-keygen,这将生成一个私有/公开密钥对,分别存放在~/.ssh/identity和~/.ssh/identity.pub文件内。然后进行访问授权,运行:
  cp ~/.ssh/identity.pub ~/.ssh/authorized_keys
  chmod go-rwx ~/.ssh/authorized_keys
  ssh-agent $SHELL
  ssh-add
  在每个节点重复一遍。试着在某一节点上登录其它节点,ssh noden,则在.ssh/下生成一个known_hosts2文件,里面放着访问该主机的密钥,把所有密钥收集起来,在各个节点上作同样的拷贝。这样做的目的是使各节点相互之间访问无需输入密码。
   7.开启各项必需的服务
  如果是以根用户root 登陆系统的则可以用ntsysv命令启动ntsysv实用程序。ntsysv 实用程序允许使用简单的菜单界面启动或关闭各种运行等级的服务。在其中我们选择开启rsh ,rlogin,telnet等。也可以关闭一些服务以加快启动速度如sendmail。
  如果是使用su命令转为root用户的则很可能运行ntsysv并不出现ntsysvs实用程序。此时可以直接去修改/etc/xinetd.d下的rlogin, rsh ,telenet的设置。用vi编辑器打开xin
  etd.d:
  vi /etc/xinetd.d
  则可看到如下所示的配置文件:
  关于rsh的设置如下
  # default: off
  # description: The rshd server is the server for the rcmd(3) routine and, \
  # consequently, for the rsh(1) program. The server provides \
  # remote execution facilities with authentication based on \
  # privileged port numbers from trusted hosts.
  service shell
  {
  disable = yes
  socket_type = stream
  wait = no
  user = root
  log_on_success += USERID
  log_on_failure += USERID
  server = /usr/sbin/in.rshd
  } 关于rlogin的设置如下
  # default: off
  # description: rlogind is the server for the rlogin(1) program. The server
  \
  # provides a remote login facility with authentication based on \
  # privileged port numbers from trusted hosts.
  service login
  {
  disable = yes
  socket_type = stream
  wait = no
  user = root
  log_on_success += USERID
  log_on_failure += USERID
  server = /usr/sbin/in.rlogind
  }
  关于telnet的设置如下
  # default: off
  # description: The telnet server serves telnet sessions; it uses \
  # unencrypted username/password pairs for authentication.
  service telnet
  {
  disable = yes
  flags = REUSE
  socket_type = stream
  wait = no
  user = root
  server = /usr/sbin/in.telnetd
  log_on_failure += USERID
  }
  所有这些服务在安装完系统之后都是默认为禁用的,要进行修改来打开这些服务。如要通过修改启动telenet则就需要改disable = yes为disable = no。对于其他的服务的启动的修改与之相同。若启动这些服务则只需要简单执行:
  #/etc/rc.d/init.d/xinetd restart
  或重起计算机就可以使所作的更改生效。
  C.在服务器节点编译、安装Fortran90编译器
  先将Fortran90(我用的是Intel的)编译器拷贝至/tmp下,然后用tar xvfz fortran90 .tar.gzj解压缩。运行
  ./install
  选择你所要安装的类型,如果你的机器是基于IA-32,就选择1。如果你的机器是基于It anium(TM)-based system就选择2。如果要停止安装,就选择X。选择过之后安回车进入下一步,此时会要求你选择 :
1. Intel(R) Fortran Complier for 32-bit Applications,Version 6.0 build 02031
  2Z
  2. 2. Linux Applicationdebugger for 32-bit Applications,Version 6.0 buid 2002
  0
  x. Exit
  按顺序选择1,2 。最后选择X 完成安装并退出。在选择完1之后会要求你看版权声明,输入Accept继续安装。默认的安装路径为/opt/intel,选择默认路径按Enter继续。选2之后的情形与1相同。如果不注册可以用90天。
  D. 在服务器节点编译、安装mpich 1.2.3
  将mpich 1.2.4: [url]ftp://ftp.mcs.anl.gov/pub/mpi/mpich.tar.gz[/url]。拷贝到一个临时目录下,放在/tmp下了。用root用户登录进行编译安装。
  1. 对mpich的安装进行预处理:
  首先,用tar xvfz mpich.tar.gz解压。生成mpich-1.2.3目录。切换到mpich-1.2.3目录。运行预处理:
  ./configure --prefix=/usr/local/mpi --对应于用rsh进行远程登录的系统
  ./configure --prefix=/usr/local/mpi -rsh=ssh --对应于用ssh进行远程登录的系统
  这里我们通知编译系统mpich的安装位置为/usr/local/mpich,运行环境的远程shell为rsh或ssh。
  2.编译:
  make
  运行此命令后mpich软件包会自动编译形成MPI系统的函数库,需要数分钟的时间,根据不同的机器可以略有不同。
  3.安装:
  make install
  运行此命令可以将MPI软件包安装到由./configure --prefix选项指定MPICH安装目录即/usr/local/mpi修改文件/usr/local/mpi/share/util/machines/machines. Linux。如下:
  node1
  ndoe2
  ......
  ndoen
  这一步是通知mpich运行环境都有那些节点可供集群计算。每个节点都这样输入一遍。
  4.测试安装是否正确
  在/usr/local/mpi/examples/basics下编译cpi.c:
  make cpi
  用命令行:
  ../../bin/mpirun -np 2 cp
  运行。将会获得如下信息。
  Processes 0 on node1
  Processes 1 on node2
  ……..………………..
  如果能正常运行即证明mpich软件包安装完全成功。
Linux 职场 休闲 Linux+System

0

收藏

上一篇:用rsync修复不完整的Linu... 下一篇:我的友情链接
详解 Linux系统集群的安装与并行计算_第2张图片
terrynie

31篇文章,4W+人气,0粉丝

详解 Linux系统集群的安装与并行计算_第3张图片

Ctrl+Enter 发布

发布

取消

推荐专栏更多

详解 Linux系统集群的安装与并行计算_第4张图片
带你玩转高可用

前百度高级工程师的架构高可用实战

共15章 | 曹林华

¥51.00 501人订阅
订   阅
详解 Linux系统集群的安装与并行计算_第5张图片
VMware vSAN中小企业应用案例

掌握VMware超融合技术

共41章 | 王春海

¥51.00 411人订阅
订   阅
详解 Linux系统集群的安装与并行计算_第6张图片
基于Kubernetes企业级容器云平台落地与实践

容器私有云平台实践之路

共15章 | 李振良OK

¥51.00 677人订阅
订   阅
详解 Linux系统集群的安装与并行计算_第7张图片
网工2.0晋级攻略 ——零基础入门Python/Ansible

网络工程师2.0进阶指南

共30章 | 姜汁啤酒

¥51.00 1901人订阅
订   阅
详解 Linux系统集群的安装与并行计算_第8张图片
负载均衡高手炼成记

高并发架构之路

共15章 | sery

¥51.00 561人订阅
订   阅

猜你喜欢

我的友情链接 用rsync修复不完整的Linux光盘映像文件 linux命令eval的用法 Linux MemFree与MemAvailable的区别 Linux awk用法 Linux理论+系统的安装 我们不得不面对的中年职场危机 Java线程:线程的调度-休眠 “Linux”真确读音! 【Linux技术资源汇总】 linux升级OpenSSL Linux命令之umask resin部署安装 详述HP EVA4400/6400/8400/P6000数据恢复解决方案 Citrix实现桌面虚拟化 虚拟机备份 存储与虚拟主机管理 IBM_V7000底层结构及服务器数据恢复案例详解 服务器更换硬盘之后一定要检查是否同步 遇到RAID5阵列硬盘出现问题的情况该如何解决?
详解 Linux系统集群的安装与并行计算_第9张图片
详解 Linux系统集群的安装与并行计算_第10张图片

扫一扫,领取大礼包

0

分享
详解 Linux系统集群的安装与并行计算_第11张图片
terrynie
详解 Linux系统集群的安装与并行计算_第12张图片