高性能集群系统方案

高性能集群系统方案

最新推出的基于IA-64架构,采用Cluster体系结构集群系统,具有可自由伸缩、高度可管理、高可用、高性能价格比等诸多优点,该集群服务器解决了跨平台管理、跨操作系统管理、系统软硬件运行状态监控等混合平台应用等技术难题,是担当大规模科学工程计算的坚实且理想的系统平台。

●机群系统技术特点

     一、快速消息传递系统的点对点基本通信协议与TCP/IP通信协议相比,通信延迟低,通信带宽高;
     二、并行程序运行回卷恢复和进程迁移系统采用基于消息驱赶的协调检查点设置机制和进程迁移、检查点文件镜像技术,实现了故障检测、结点软硬件瞬时/永久故障恢复、系统重构等容错功能,系统可靠性高;
     三、交互式FORTRAN77并行化编译器能分析出串行程序中运行时间较长的循环以及含有过程调用循环的并行性,并生成正确的分布并行代码,交互功能完善;
     四、C和FORTRAN语言并行调试器将状态冻结方法和常用的记录--重放技术相结合,解决了并行程序运行时的不确定性问题,并利用检查点技术支持并行程序状态的保存和恢复,可缩短并行程序的调试时间。
     五、可视化人机交互集成开发环境功能比较齐全、界面友好、使用方便,对用户研究、选择和优化并行算法以取得高效的解题结果有重要作用,系统可用性好。

●机群系统特点

     一、性能价格比高
传统的并行机曾经是高端RISC架构,生产批量小往往价格昂贵,且维护费用高;而本集群系统采用高品质的商品化部件,其超强的处理能力可以取代价格昂贵的中大型机,已经接近一些MPP的水平。
     二、可靠性高
程序运行回卷恢复系统实现了故障检测、结点软硬件瞬时/永久故障恢复、系统动态升/降级重构等容错功能。只要有一个结点可用,该系统就可以提供持续的服务。增加/删除结点、系统维护等操作可在线(on-line)。
     三、可扩展性好
结点的配置和结点机的数目可根据用户的需求来确定,原有的资源还可得到充分利用。当硬件与软件技术进一步发展时,可对系统及时升级。
     四、使用方便
系统的可视化人机交互集成开发环境功能齐全、界面友好、使用灵便;快速消息传递系统、动态负载平衡系统、并行调试器、交互式Fortran77和Fortran90并行化编译器等软件为用户提供了方便;只要在原有C、C++、Fortran等语言程序中的相应地方插入少量几条原语后,即可使这些程序在集群系统上并行运行,可继承原有传统语言编写的软件财富。
     五、应用领域
主要应用领域有:石油勘探、地震预测预报、气候模拟与天气预报、人体基因与遗传工程、医学图象的快速处理、海洋环流和超导模拟、环境污染的分析与处理、飞行器的仿真研究、新型武器设计与模拟、计算机辅助设计、计算流体力学及基础学科中的一些理论计算等领域。此外,还可以作为超级服务器用于信息服务、事务处理、决策支持等进行应用。

产品结构

1. 机群软件系统

本系统配备的机群软件系统主要有机群操作系统、机群管理系统、机群监控系统、机群文件系统和作业管理系统(包括在操作系统内)。操作系统要求具有多用户多任务的特征,并且有很强的稳定性,所以在本方案中,操作系统采用Red Hat 9.0,机群管理系统采用图形化界面和接口,如用户管理、访问限制、系统配置、系统控制、基于TCP/IP的网络管理功能(如TCP/IP的配置、Hosts表管理、NFS配置、NIS配置)等。

1. 1 Linux操作系统
Linux凭借高效率的核心,加上不计其数的应用程序,成为当前众多操作系统中的佼佼者。同时Linux具有强大的网络功能,能很好的支持Internet/Intranet。在相同的硬件环境下,Linux提供更好的性能。很少有人会反对Linux是一个安全的,稳健的操作系统。Linux不仅是性价比非常高的系统,而且由于它经常的更新所使用的技术,使得它可以不断的提高系统的性能,使用最先进的技术。在计算领域中,越来越多的公司通过使用Linux上的应用开发,让自己的硬件产品通过Linux认证来支持Linux的发展。

1.2系统监控软件(Cluster Monitor Management System)
 可监控机柜系统环境、每节点硬件配置情况、每节点直流电压、各部件温度、风扇转速等硬件状态、系统CPU、内存、网络使用情况等。可指定节点,也可以图形方式对各节点的单项数据进行对比。
在Ethernet上使用专用的协议和Socket接口进行数据传递,监控数据对OS透明。
 可以设置报警域值,在系统异常时,向系统管理员报警,避免或减少系统故障的损失。
可以通过Modem远程拨号(Windows系统)或Telnet远程登录(LINUX系统)进行监控和管理。

1.3 并行计算环境
国际上并行计算工业标准或事实上的标准主要有PVM、MPI两种,本套集群系统继承了所有用于科学运算的超级服务器的特点,支持标准的PVM(Parallel Virtual Machine)和MPI(Message Passing Interface)。
    PVM包括一个完整的工具软件和软件库,它可以在网络连接的各类计算机系统上模拟一个灵活的异构并行计算环境。PVM由两个部分组成:构成并行虚拟机的PVMD和用于用户编程的PVM用户界面函数库。PVM目前支持C、C++和FORTRAN。一般来说,一个PVM应用程序由多个子任务构成,每一个子任务负责程序的一部分运算,最后将计算结果进行汇总。PVM是当今流行的并行计算系统之一。
    MPI是基于消息传递的并行运算模式,是对消息传递的一种新的库描述,被众多厂商、实现者和用户组成的委员会作为一种标准提出。MPI是为能在大规模并行机和工作站机群上高性能运行而设计的,它可以从多种渠道获得,包括可以免费由网站或厂商提供。MPI是一个消息传递库,而不是一门语言,它目前支持的语言有C,C++、FORTRAN等等。

2. 机群硬件系统

2.1 机柜内部连接:
在一个标准42U或36U的机柜中,放置若干台1U机架式计算节点(42U机柜不超过32个节点,36U机柜不超过16个节点)同时通过网络连接,1000M以太网或者Myrinet连接。(可选PCI-SCI高性能互连产品) 。
由I2C总线方式,组成硬件监控网。在出现硬件异常情况时,直接做出相应的报警,并且能在机柜的触摸屏上直接查询各节点的状态,这大大减少了系统维护的复杂性。
计算节点的性能要求就是需要有强大的计算能力和I/O吞吐能力及稳定的性能。根据以上的性能要求,我们选用计算节点是具有很高性价比的基于Intel IA架构、1U的企业级机架式服务器,具有强大的数据处理能力和很高的I/O吞吐能力,安装简便,性能稳定,非常适合需要很高数据处理和网络吞吐能力并且对空间限制严格的数据中心等业务。具体配置采用最新的双路INTEL XEON CPU并采用CPU超线程技术,使其具有极强的运算能力,1G ECC DDR 内存, 并配以最新的INTEL 公司E7501芯片组与双通道DDR内存系统平台,确保高带宽与性能吞吐。加强型可自适应的、带宽1000Mbit的以太网控制器、大大地提高了系统可靠性。同时采用Intel NetBurst技术,结合533MHZ 系统总线可以为双CPU服务器在多线程多任务环境下提供极为优异的性能。

2. 2 网络通信连接
机群系统网连接机群系统中所有的节点,既要负责管理信息的流通,又要支撑机群网络文件系统,因此必须具备高带宽和低延迟。
1、采用1000M以太网组成系统信息通信域网, 计算节点通过千兆以太网交换机连接进行运算数据的交换。
2、采用Myrinet, SCI (可选)

2.3 机群辅助设计
独特设计的高性能集群系统集群专用机柜,支持36U或42U内部扩展空间。精心设计的内部网络和电源布线,均采用就近插接,构造了整洁的机柜内部环境,极大的方便了用户设备调试和问题分析。
布线系统按最大使用设计,机柜内部最大可为节点机系统提供32路交流电源接口和48路网络信息接口(24×2)。各机柜均采用单独上电,简单明了。前面板采用12.1"超大真彩LCD控制窗口,整个系统软硬件运行状态实时动态显示,一目了然。用户可以直接通过控制窗口的触摸屏进行人机交互,可以非常方便地对系统进行周到细致的管理和监控。

主机柜内部的中心节点,全面采集整个系统的运行环境、各节点的软硬件运行状态,对节点发送控制指令,并负责机柜系统I/O。视频切换器具有独特的视频切换功能,使得用户利用单一显示系统就可以对整个机群系统进行操作,改变了以往的每一个计算机节点都配置一个显示器的情况。既方便了用户的管理又节约了用户投资。
UPS供电保护。以防系统在突然断电的情况之下能够保护用户的数据。
以本系统16个节点为例,每个计算机节点的电源供电量为400W,平均的耗电量为峰值的85%。两台交换机和KVM的耗电量之和在100W左右。外加一台4000-6000W左右的空调。而集群的散热量是每台机器在200W左右,整个集群系统的发热量在4800W左右。空调的正常耗电量也是在5000W左右。所以本系统(包括空调)的耗电峰值应该在16000W左右。而平均耗电量在 14000W左右。

扩展机柜(可选)
操作系统 LINUX (RedHat 9.0)/AS3.0
系统语言及编译器 C、C++和Fortran编程语言及编译器,交互式Fortran并行化编译器TIPS
并行编程环境 PVM与MPI
管理系统  网络交换机 台视频切换机 台内置机架式控制台 15" 真彩LCD显示器(含键盘、鼠标)自动控制可伸缩控制台
 
工作环境 环境温度:0℃--25℃ 相对湿度:30%--90%
储运环境 环境温度:0℃--40℃ 相对湿度:30%--95%

服务用户:

一、为用户提供高性能并行计算需求分析与可行性报告
1、 帮助用户根据应用问题的特征,这些问题对高性能并行计算的需求,以及近期内将要 达到的目标,提出高性能并行计算需求报告;
2、 综合当前各类高性能并行机的发展趋势、应用特征以及经费额度,提出最合适的高性能并行机及其附属设备的购买方案,并在选型过程中帮助用户对候选机型进行有针对性的性能测试与比较;
3、 基于用户现有或将要购买的并行机,用户现有的人才资源状况,结合用户实际应用问题的特征,提出高效率管理、维护和使用并行机的方案;

二、为用户提供高性能并行机系统集成及并行计算培训
1、 包括系统结构设计、系统集成与调试、运行环境设计、系统管理维护工具的开发、系统性能优化、系统管理与使用培训,并在一定时间内承担系统维护的技术支持,
2、 配置并行机操作系统、编译系统、并行程序开发平台、作业调度环境、程序调试环境、性能分析工具、上机环境,以及各类并行应用程序开发辅助工具;
3、 安装各类高性能数值库软件工具箱;
4、 辅助用户建设高性能并行计算机环境。
5、 培训一般的并行机系统管理与系统维护人员,使之能有效地承担起本单位并行机或微机机群的日常系统管理与维护任务;

三、高性能并行应用软件开发与性能优化

1、   为用户提供的串行应用软件基础上,在不改变数值算法的前提下,基于消息传递MPI、共享存储OpenMP和数据并行HPF,实现用户科学与工程应用软件的高性能并行化,使该并行程序能在用户指定的并行机上高效率地运行;
2、 接合当前并行机的高性能特征,优化用户现有的并行应用软件的性能,并使之具备更高的可扩展性、可移植性、可维护性;
3、 用户并行应用程序中将遇到的核心问题,例如矩阵运算、稀疏线性代数方程组求解、矩阵特征值、FFT、分类排序、模式匹配等等,指导选择适当的高性能的并行库软件
4、 针对用户提出的实际应用问题,合作研制高性能的并行算法和并行程序。
5、 对用户关心的科学/工程问题,应用现有计算方法(预条件处理,多重网格,区域分裂等)研制高效并行库软件;
6、 对具体问题,研究网格构造及网格移动技术;
7、 有软件或数据之间无缝接口技术;科学/工程问题中参数提取算法研究。
8、 对一些特殊问题研究新算法及并行实现方法

转载于:https://www.cnblogs.com/F4ncy/archive/2005/02/12/103964.html

你可能感兴趣的:(高性能集群系统方案)