世界最快超级计算机 探秘天河一号

处理器的性能提升一直决定着全球超级计算机运算能力的发展。过去的约10年里,TOP500全球最高速超级计算机的总运算性能提升速度基本上和摩尔定律保持一致。然而在2007年左右,TOP500超级计算机的性能开始明显的加速上涨,这一时间点,正是GPU被引入超级计算机的开端。从此GPU作为超级计算机中重要的性能部件彰显着不可替代的作用,CPU+GPU的异构超算能带来比同样规模的纯CPU提供数以倍计的浮点科学计算能力。

  这种“异构计算”应用的典型例子就是中国的天河一号A,它使用了超过14000颗CPU,辅以7168颗Tesla M2050 GPU,总运算能力2.5PFLOPS,成为当今全球最强的超级计算机。天河一号主任设计师,国防科大计算机学院系统软件研究室主任杨灿群今天也到场介绍了该机的设计过程。据称,从去年的试验性系统,到今年的天河一号A,他们将GPU加速的效率从20%提升到了70%,同时使用自主开发的节点网络系统,规模和性能是去年使用的进口成套网络系统的两倍。

世界最快超级计算机 探秘天河一号_第1张图片
NV创始人黄仁勋在2010高性能计算峰会上专门讲述了天河一号A

跟随NVidia2010高性能计算峰会的脚步,我们有幸参观了国家超级计算天津中心,并进距离的深入了解其中的天河一号A超级计算机,这种机会非常难得。

世界最快超级计算机 探秘天河一号_第2张图片
国家超级计算天津中心 天河一号所在

世界最快超级计算机 探秘天河一号_第3张图片
国家超级计算天津中心

  天河的命名来自于国防科大“银河”系列超级计算机与天津的结合。天河一号A配备了14336颗Intel Xeon X5670 2.93GHz六核心处理器(32nm Westmere-EP),2048颗我国自主研发的飞腾FT-1000八核心处理器,以及7168块NVIDIA Tesla M2050高性能计算卡,总计186368个核心,224TB内存,使用自主研制的互连网络架构、Linux操作系统,Linpack最大性能2.566PFlops(每秒千万亿次浮点运算)、峰值性能4.701PFlops,系统效率54.6%,技压群雄获最新全球超算TOP500排名首位,成为全球最强超级计算机。

  

世界最快超级计算机 探秘天河一号_第4张图片

世界最快超级计算机 探秘天河一号_第5张图片

世界最快超级计算机 探秘天河一号_第6张图片
黄仁勋与国家超级计算天津中心主任刘光明

  

世界最快超级计算机 探秘天河一号_第7张图片
天河一号A其实就这这一排排的机柜

世界最快超级计算机 探秘天河一号_第8张图片
真名应该叫:天河高效能计算机系统

世界最快超级计算机 探秘天河一号_第9张图片

世界最快超级计算机 探秘天河一号_第10张图片
天河一号A中的GPU运算节点

黄仁勋与国家超级计算天津中心杨灿群教授展示天河一号A中的GPU运算节点。杨灿群教授是天河一号主任设计师,国防科大计算机学院系统软件研究室主任。

天河一号A配备了14336颗Intel Xeon X5670 2.93GHz六核心处理器(32nm Westmere-EP),2048颗我国自主研发的飞腾FT-1000八核心处理器,以及7168块NVIDIA Tesla M2050高性能计算卡,总计186368个核心,224TB内存。

世界最快超级计算机 探秘天河一号_第11张图片
传说中的完全自主知识产权的飞腾CPU计算节点

世界最快超级计算机 探秘天河一号_第12张图片
八核64线程的飞腾1000处理器

世界最快超级计算机 探秘天河一号_第13张图片
现场展示的各种超算应用

天河一号A配备了14336颗Intel Xeon X5670 2.93GHz六核心处理器(32nm Westmere-EP)以及7168块NVIDIA Tesla M2050高性能计算卡,总计186368个核心,224TB内存,

世界最快超级计算机 探秘天河一号_第14张图片
GPU计算节点,其上为两路MV TeslaM2050

世界最快超级计算机 探秘天河一号_第15张图片
至强CPU计算节点

世界最快超级计算机 探秘天河一号_第16张图片
黄仁勋先生与刘光明主任在天河一号前合影留念

  

  参观行程之后,黄仁勋、中国国家超级计算天津中心主任刘光明和天河一号主任设计师,国防科大计算机学院系统软件研究室主任杨灿群在现场接受了媒体的采访,以下为采访全文。

  问:天河一号A使用了14336颗Intel Xeon和7168块NVIDIA Tesla。HPC中CPU和GPU搭配的数量比例平衡由什么因素决定?

  刘光明:是这样。基本上,我们在天河一号A中主要使用通用CPU做一些复杂计算,一些比较规程的大规模并行计算放到GPU上来做。我们在去年的9月份做了一次试验,根据现在的研究情况,这种2:1的比例比较合理,效率比较高。现在这台机器已经在硬件设计的时候设定了这种比例,不会再做改变。不过现在是千万亿次,未来到万万亿次的时候,根据到时候的应用状况可能比例还会有变化,这个还需要继续的研究。

  问:NVIDIA未来有怎样的计划来推广Tesla产品?

  黄仁勋:CPU+GPU的架构已经被证明在并行计算领域拥有非常高的性能和非常高的能效。这个道理非常简单,用最适合的处理器来运行最合适的应用,就能获得最高的效率。就像所有中国的年轻人都知道的那样,要打造一台游戏PC,获得最高性能、最高效率的方法就是购买GeForce GPU。我们在设计GPU的时候已经加入了通用计算的思想,因此我们的产品现在不仅仅可以用来加速游戏图形,还可以将GPU运用在通用科学计算领域。

  杨博士、刘博士的团队有这样的远见,在几年前就看到了将GPU应用在HPC中的潜力。事实上今天在科学计算、高性能计算领域的每一位研究者都认识到,在超级计算机中使用GPU是一种非常有效的提升性能的方式。高性能计算领域的权威杂志《HPC Wire》本周刚刚撰文指出,GPU加速已经是超级计算机领域的头号趋势。虽然现在这种趋势已经非常明显,但在两年前,当天河刚刚启动开发的时候,这种选择还是有相当高的风险。我在这里首先要感谢杨博士、刘博士,感谢他们卓有远见的选择。

  天河一号A现在为全球的超级计算机设定了一个新标准,提升了人们对HPC的期待值。中国政府也已经认识到,在超级计算机领域的投资,实际上是对知识基础设施的投入。计算能力已经成了科研的命脉,投资超级计算机实际上和投资建设道路、高速互联网一样的重要。投资高性能计算可以引领我们实现新的探索、新的发现,最终使各个产业受益。

  

  天津超算中心的这台超计算机,不仅对科研领域相当重要,对各个行业也都有相当关键的意义。就像刘博士介绍的那样,他们的超级计算机被应用在医疗领域研发新药延长我们的生命,设计更好的汽车、飞机,甚至创造出色的电影、电视节目。超级计算已经渗透到了我们生活的各个方面。虽然Tesla已经在遍布全球的超级计算领域得到了相当大的成功,但我们的信仰,我们的策略是让Tesla应用在各行各业当中,让企业自己使用Tesla来进行产品开发、设计,让他们的产品更早的投放市场,创造更好、更具竞争力的产品。

  目前,全球最高能效超级计算机的前十名中,已经有7台使用了Tesla。我相信,这呈现了一种趋势,未来将有越来越多的企业使用基于GPU通用计算的超级计算机,Tesla HPC将成为一个非常庞大的市场。因此我们才和包括惠普、戴尔、IBM、Cray、SGI、浪潮等全球所有主流的高性能计算、服务器厂商合作,向用户提供Tesla产品。用户现在可以在全球任何一个国家,通过任何一家主流厂商购买Tesla产品。

  问:如今硬件的销售越来越依赖于软件应用的发展。NVIDIA有没有类似苹果App Store那样的软件应用平台计划,吸引软件开发者的加入?

  黄仁勋:不错,每当你造出了一颗新的处理器,你必须要提供新的应用软件。我们在传播如何进行并行计算编程的领域,投入了大量的资源。CPU代表着顺序执行,每次一个任务,而GPU拥有着大量的流处理核心,可以同步运作。我们必须创建一个有效的并行计算架构,同时也需要教导普及全球的软件开发人员,如何来用全新的并行思想编程。

  我们一直在CUDA教育领域持续进行着推广,如今全球有接近400所大学在教授CUDA编程课程。CUDA教材已经以英语、中文、日语、俄语等多种语言全球出版。全球注册CUDA开发人员超过10万人。设计、分析、数字创作等领域重要的第三方软件,包括Adobe、MATLab、ANSYS、AMBER、3DStudio MAX等都已经支持CUDA。我们现在还有很多的软件开发工作正在进行当中。

  如今,全球CUDA软件开发群体的增长势头非常迅猛。这是因为,全世界最快、中国最快、日本最快、俄国最快的超级计算机都在使用CUDA,开发者们都希望能够使用这些最强的HPC来进行工作。同时,从苹果、惠普、戴尔、联想,到全球每一家网吧中的电脑,每一台拥有GeForce显卡的PC也都支持CUDA,开发者们可以在自己的电脑上进行开发。CUDA无处不在。

  有一点非常重要,在每家企业的多种计算应用中,往往只有一两个应用占用绝大部分的运算性能。不是所有的应用都同样重要,只要我们在这些关键应用上应用GPU实现大幅提速,就能极大的提升他们的效率。

  问:天河一号A在性能、效率、能耗方面相比上代都有了大幅提升,这背后主要是在哪些方面进行了改进?

  杨灿群:天河1A这一代系统的实际性能、计算效率大幅度的提高,主要有几个方面的原因,包括自主研发的新高速网络系统,软件优化后提升了应用效率,以及NVIDIA Tesla并行计算GPU的加入。

  问:天河一号A如今已经是全球最快超级计算机,为了保持这种优势,我们未来需要有怎样的努力和创新?NVIDIA未来将对中国的超级计算机发展提供怎样的支持?

  刘光明:中国的高性能计算机发展经历了30多年的历程,从1978年的银河1开始,一直到现在的天河一号A。这些努力并不是为了争得一个世界第几的排名,确确实实是我们国家急需这样的高性能计算能力。作为天河来讲,在突破千万亿次大关的过程中,遇到了世界性的难题。从2005年到2007年,我们一直在进行研究,最终决定采用异构架构,即通用处理器和专用加速处理器结合的方式突破这一难题。这中间我们试验过自己的军用流处理器FT100,去年也尝试过AMD的GPU,最后发现了NVIDIA的芯片性能更好。

  这里大家需要注意一点,高性能计算机能够做出来,做出Linpack测试到世界第一,并不等于能够在实际应用中用好。这是两个问题,如何在异构结构下有效的编程是下一个大的挑战。我们有一个专门的团队从几年前就在开展这项工作,现在已经得到了不错的成绩,但未来还有很多的任务要做。

  黄仁勋:刘博士说的很对,并行计算面临的困难非常多,但正确解决这些困难带来的效益也非常可观。整个行业过去30年都在努力想要解决并行计算的难题,却几乎没有一家得到成功。直到CUDA的出现,我们终于找到了CPU+GPU的异构计算模式。这项革命性的技术花费了NVIDIA公司多年的时间和数十亿美元的投资。NVIDIA在并行计算领域的投资超过世界上任何一家企业。因为CUDA,并行计算现在有一个非常光明的前景。不过,在这一领域我们仍然面临着非常多的挑战。未来,我们将更加紧密的同刘博士的团队合作,创造下一台更强的超级计算机系统。

  中国已经认识到超级计算机对未来各个领域的重要性,NVIDIA非常荣幸能够在中国的超级计算机发展中提供自己的支持。世界现在已经越来越小,科技领域的发展能够让全世界每一个人受益,中国超级计算机的进步实际上可以造福整个人类。我们将提供自己最出色的工程师来帮助中国建造更高速的超级计算机,帮助他们更有效的进行并行计算编程,并在中国的所有高校普及并行计算教育。我相信,未来每一个从高校毕业的计算机技术人员都将必备并行计算知识。串行计算是过去式,并行计算才代表了未来。处理器的性能提升一直决定着全球超级计算机运算能力的发展。过去的约10年里,TOP500全球最高速超级计算机的总运算性能提升速度基本上和摩尔定律保持一致。然而在2007年左右,TOP500超级计算机的性能开始明显的加速上涨,这一时间点,正是GPU被引入超级计算机的开端。从此GPU作为超级计算机中重要的性能部件彰显着不可替代的作用,CPU+GPU的异构超算能带来比同样规模的纯CPU提供数以倍计的浮点科学计算能力。

  这种“异构计算”应用的典型例子就是中国的天河一号A,它使用了超过14000颗CPU,辅以7168颗Tesla M2050 GPU,总运算能力2.5PFLOPS,成为当今全球最强的超级计算机。天河一号主任设计师,国防科大计算机学院系统软件研究室主任杨灿群今天也到场介绍了该机的设计过程。据称,从去年的试验性系统,到今年的天河一号A,他们将GPU加速的效率从20%提升到了70%,同时使用自主开发的节点网络系统,规模和性能是去年使用的进口成套网络系统的两倍。

世界最快超级计算机 探秘天河一号_第17张图片
NV创始人黄仁勋在2010高性能计算峰会上专门讲述了天河一号A

跟随NVidia2010高性能计算峰会的脚步,我们有幸参观了国家超级计算天津中心,并进距离的深入了解其中的天河一号A超级计算机,这种机会非常难得。

世界最快超级计算机 探秘天河一号_第18张图片
国家超级计算天津中心 天河一号所在

世界最快超级计算机 探秘天河一号_第19张图片
国家超级计算天津中心

  天河的命名来自于国防科大“银河”系列超级计算机与天津的结合。天河一号A配备了14336颗Intel Xeon X5670 2.93GHz六核心处理器(32nm Westmere-EP),2048颗我国自主研发的飞腾FT-1000八核心处理器,以及7168块NVIDIA Tesla M2050高性能计算卡,总计186368个核心,224TB内存,使用自主研制的互连网络架构、Linux操作系统,Linpack最大性能2.566PFlops(每秒千万亿次浮点运算)、峰值性能4.701PFlops,系统效率54.6%,技压群雄获最新全球超算TOP500排名首位,成为全球最强超级计算机。

  

世界最快超级计算机 探秘天河一号_第20张图片

世界最快超级计算机 探秘天河一号_第21张图片

世界最快超级计算机 探秘天河一号_第22张图片
黄仁勋与国家超级计算天津中心主任刘光明

  

世界最快超级计算机 探秘天河一号_第23张图片
天河一号A其实就这这一排排的机柜

世界最快超级计算机 探秘天河一号_第24张图片
真名应该叫:天河高效能计算机系统

世界最快超级计算机 探秘天河一号_第25张图片

世界最快超级计算机 探秘天河一号_第26张图片
天河一号A中的GPU运算节点

黄仁勋与国家超级计算天津中心杨灿群教授展示天河一号A中的GPU运算节点。杨灿群教授是天河一号主任设计师,国防科大计算机学院系统软件研究室主任。

天河一号A配备了14336颗Intel Xeon X5670 2.93GHz六核心处理器(32nm Westmere-EP),2048颗我国自主研发的飞腾FT-1000八核心处理器,以及7168块NVIDIA Tesla M2050高性能计算卡,总计186368个核心,224TB内存。

世界最快超级计算机 探秘天河一号_第27张图片
传说中的完全自主知识产权的飞腾CPU计算节点

世界最快超级计算机 探秘天河一号_第28张图片
八核64线程的飞腾1000处理器

世界最快超级计算机 探秘天河一号_第29张图片
现场展示的各种超算应用

天河一号A配备了14336颗Intel Xeon X5670 2.93GHz六核心处理器(32nm Westmere-EP)以及7168块NVIDIA Tesla M2050高性能计算卡,总计186368个核心,224TB内存,

世界最快超级计算机 探秘天河一号_第30张图片
GPU计算节点,其上为两路MV TeslaM2050

世界最快超级计算机 探秘天河一号_第31张图片
至强CPU计算节点

世界最快超级计算机 探秘天河一号_第32张图片
黄仁勋先生与刘光明主任在天河一号前合影留念

  

  参观行程之后,黄仁勋、中国国家超级计算天津中心主任刘光明和天河一号主任设计师,国防科大计算机学院系统软件研究室主任杨灿群在现场接受了媒体的采访,以下为采访全文。

  问:天河一号A使用了14336颗Intel Xeon和7168块NVIDIA Tesla。HPC中CPU和GPU搭配的数量比例平衡由什么因素决定?

  刘光明:是这样。基本上,我们在天河一号A中主要使用通用CPU做一些复杂计算,一些比较规程的大规模并行计算放到GPU上来做。我们在去年的9月份做了一次试验,根据现在的研究情况,这种2:1的比例比较合理,效率比较高。现在这台机器已经在硬件设计的时候设定了这种比例,不会再做改变。不过现在是千万亿次,未来到万万亿次的时候,根据到时候的应用状况可能比例还会有变化,这个还需要继续的研究。

  问:NVIDIA未来有怎样的计划来推广Tesla产品?

  黄仁勋:CPU+GPU的架构已经被证明在并行计算领域拥有非常高的性能和非常高的能效。这个道理非常简单,用最适合的处理器来运行最合适的应用,就能获得最高的效率。就像所有中国的年轻人都知道的那样,要打造一台游戏PC,获得最高性能、最高效率的方法就是购买GeForce GPU。我们在设计GPU的时候已经加入了通用计算的思想,因此我们的产品现在不仅仅可以用来加速游戏图形,还可以将GPU运用在通用科学计算领域。

  杨博士、刘博士的团队有这样的远见,在几年前就看到了将GPU应用在HPC中的潜力。事实上今天在科学计算、高性能计算领域的每一位研究者都认识到,在超级计算机中使用GPU是一种非常有效的提升性能的方式。高性能计算领域的权威杂志《HPC Wire》本周刚刚撰文指出,GPU加速已经是超级计算机领域的头号趋势。虽然现在这种趋势已经非常明显,但在两年前,当天河刚刚启动开发的时候,这种选择还是有相当高的风险。我在这里首先要感谢杨博士、刘博士,感谢他们卓有远见的选择。

  天河一号A现在为全球的超级计算机设定了一个新标准,提升了人们对HPC的期待值。中国政府也已经认识到,在超级计算机领域的投资,实际上是对知识基础设施的投入。计算能力已经成了科研的命脉,投资超级计算机实际上和投资建设道路、高速互联网一样的重要。投资高性能计算可以引领我们实现新的探索、新的发现,最终使各个产业受益。

  

  天津超算中心的这台超计算机,不仅对科研领域相当重要,对各个行业也都有相当关键的意义。就像刘博士介绍的那样,他们的超级计算机被应用在医疗领域研发新药延长我们的生命,设计更好的汽车、飞机,甚至创造出色的电影、电视节目。超级计算已经渗透到了我们生活的各个方面。虽然Tesla已经在遍布全球的超级计算领域得到了相当大的成功,但我们的信仰,我们的策略是让Tesla应用在各行各业当中,让企业自己使用Tesla来进行产品开发、设计,让他们的产品更早的投放市场,创造更好、更具竞争力的产品。

  目前,全球最高能效超级计算机的前十名中,已经有7台使用了Tesla。我相信,这呈现了一种趋势,未来将有越来越多的企业使用基于GPU通用计算的超级计算机,Tesla HPC将成为一个非常庞大的市场。因此我们才和包括惠普、戴尔、IBM、Cray、SGI、浪潮等全球所有主流的高性能计算、服务器厂商合作,向用户提供Tesla产品。用户现在可以在全球任何一个国家,通过任何一家主流厂商购买Tesla产品。

  问:如今硬件的销售越来越依赖于软件应用的发展。NVIDIA有没有类似苹果App Store那样的软件应用平台计划,吸引软件开发者的加入?

  黄仁勋:不错,每当你造出了一颗新的处理器,你必须要提供新的应用软件。我们在传播如何进行并行计算编程的领域,投入了大量的资源。CPU代表着顺序执行,每次一个任务,而GPU拥有着大量的流处理核心,可以同步运作。我们必须创建一个有效的并行计算架构,同时也需要教导普及全球的软件开发人员,如何来用全新的并行思想编程。

  我们一直在CUDA教育领域持续进行着推广,如今全球有接近400所大学在教授CUDA编程课程。CUDA教材已经以英语、中文、日语、俄语等多种语言全球出版。全球注册CUDA开发人员超过10万人。设计、分析、数字创作等领域重要的第三方软件,包括Adobe、MATLab、ANSYS、AMBER、3DStudio MAX等都已经支持CUDA。我们现在还有很多的软件开发工作正在进行当中。

  如今,全球CUDA软件开发群体的增长势头非常迅猛。这是因为,全世界最快、中国最快、日本最快、俄国最快的超级计算机都在使用CUDA,开发者们都希望能够使用这些最强的HPC来进行工作。同时,从苹果、惠普、戴尔、联想,到全球每一家网吧中的电脑,每一台拥有GeForce显卡的PC也都支持CUDA,开发者们可以在自己的电脑上进行开发。CUDA无处不在。

  有一点非常重要,在每家企业的多种计算应用中,往往只有一两个应用占用绝大部分的运算性能。不是所有的应用都同样重要,只要我们在这些关键应用上应用GPU实现大幅提速,就能极大的提升他们的效率。

  问:天河一号A在性能、效率、能耗方面相比上代都有了大幅提升,这背后主要是在哪些方面进行了改进?

  杨灿群:天河1A这一代系统的实际性能、计算效率大幅度的提高,主要有几个方面的原因,包括自主研发的新高速网络系统,软件优化后提升了应用效率,以及NVIDIA Tesla并行计算GPU的加入。

  问:天河一号A如今已经是全球最快超级计算机,为了保持这种优势,我们未来需要有怎样的努力和创新?NVIDIA未来将对中国的超级计算机发展提供怎样的支持?

  刘光明:中国的高性能计算机发展经历了30多年的历程,从1978年的银河1开始,一直到现在的天河一号A。这些努力并不是为了争得一个世界第几的排名,确确实实是我们国家急需这样的高性能计算能力。作为天河来讲,在突破千万亿次大关的过程中,遇到了世界性的难题。从2005年到2007年,我们一直在进行研究,最终决定采用异构架构,即通用处理器和专用加速处理器结合的方式突破这一难题。这中间我们试验过自己的军用流处理器FT100,去年也尝试过AMD的GPU,最后发现了NVIDIA的芯片性能更好。

  这里大家需要注意一点,高性能计算机能够做出来,做出Linpack测试到世界第一,并不等于能够在实际应用中用好。这是两个问题,如何在异构结构下有效的编程是下一个大的挑战。我们有一个专门的团队从几年前就在开展这项工作,现在已经得到了不错的成绩,但未来还有很多的任务要做。

  黄仁勋:刘博士说的很对,并行计算面临的困难非常多,但正确解决这些困难带来的效益也非常可观。整个行业过去30年都在努力想要解决并行计算的难题,却几乎没有一家得到成功。直到CUDA的出现,我们终于找到了CPU+GPU的异构计算模式。这项革命性的技术花费了NVIDIA公司多年的时间和数十亿美元的投资。NVIDIA在并行计算领域的投资超过世界上任何一家企业。因为CUDA,并行计算现在有一个非常光明的前景。不过,在这一领域我们仍然面临着非常多的挑战。未来,我们将更加紧密的同刘博士的团队合作,创造下一台更强的超级计算机系统。

  中国已经认识到超级计算机对未来各个领域的重要性,NVIDIA非常荣幸能够在中国的超级计算机发展中提供自己的支持。世界现在已经越来越小,科技领域的发展能够让全世界每一个人受益,中国超级计算机的进步实际上可以造福整个人类。我们将提供自己最出色的工程师来帮助中国建造更高速的超级计算机,帮助他们更有效的进行并行计算编程,并在中国的所有高校普及并行计算教育。我相信,未来每一个从高校毕业的计算机技术人员都将必备并行计算知识。串行计算是过去式,并行计算才代表了未来

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/22785983/viewspace-682764/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/22785983/viewspace-682764/

你可能感兴趣的:(世界最快超级计算机 探秘天河一号)