申耀的科技观察
读懂科技,赢取未来!
在通往冠军这条路上,联想HPC从来都是永不止步的。
今年11月8日,在首届中国超级算力大会上,联想以39套的成绩,名列2019 HPC TOP100榜单,第五次斩获中国HPC佳冠。而时隔11天之后,在刚刚举办的2019年的全球超算大会(SC2019)上,联想又再一次以175套的成绩,继续蝉联HPC TOP500榜首,继续领跑整个HPC行业。
在我看来,联想屡夺中国和全球HPC的冠军,实现了在HPC领域的持续“霸榜”,不仅是联想与时俱进、积极响应用户需求的最新举措,也是它始终洞察整个HPC市场需求变化,在技术和创新上保持高强度自我迭代和进化的重要印证,这也让联想能够在HPC市场不断取得突破,最终成为了中国乃至全球超算领域真正的引领者和推动者。
联想HPC的冠军之路
如果从1999年联想正式成立HPC部门算起,联想进入超算行业刚好走过了整整20年。可以说,过去20年,不仅是联想HPC技术创新与积累的20年,更是中国超算崛起的20年。
联想数据中心业务集团HPC & AI 营销总监于涛
在联想数据中心业务集团HPC & AI 营销总监于涛看来:“过去20年,联想HPC发展经历了三个阶段,首先是1999-2014年,这是联想HPC从无到有、从弱到强的阶段。在这个阶段,我们涌现出很多优秀人才,比如原来我们的首席科学家祝明发和肖利民等知名HPC专家,也培养了一支非常强劲的HPC方面非常有能力的队伍和体系,同时这个阶段我们也做了很多大机器。”
所谓的“大机器”,是指联想于 2002 年研发出世界上第一台万亿次的超算集群深腾1800,打破了国际超算舞台一直被发达国家垄断的格局。更为重要的是,深腾1800是成功将Cluster体系结构应用于大规模超级计算机的当之无愧的先行者,在国内外产业界和科技界均产生了重大而深远的影响,引领Cluster体系结构在超算领域迅速走向主流,彻底改变了超级计算机行业的生态。
而时隔一年之后,联想深腾6800超级计算机再次研制成功,运算速度超过4万亿次。在短短一年的时间里性能提升了4倍,在HPC全球TOP500榜单,排名第14位,再次获得了全世界的关注。
其次,是第二阶段,主要是从2014-2017年,这个阶段的标志性事件,是联想在2014年并购了IBM x86服务器业务,也是联想HPC开始走向国际化的一年。联想在本身HPC技术、人才、队伍逐渐完备的基础上,结合了IBM在HPC上的能力,真正成为了一支国际化的HPC队伍。
确实如此,在并购 IBM x86 服务器业务之后,联想HPC的发展进入了快车道,同时联想在超算领域的领导力也体现得愈发明显。比如,随着联想HPC业务的发展,如今它已经遍布了全球162个国家和地区,在中国,德国、丹麦、挪威、加拿大等国家都是当地市场第一名。
更关键的是,在中国市场,联想的超算系统在风洞测试和仿真系统中也扮演了非常重要的角色,持续支持中国航天事业,成功助力神舟9号、10号、11号的发射;在国家气象局、海洋局、环保局等政府部门及中石油、中石化等大型企业,联想HPC也承担着国家级基础数据的巨量计算和处理任务。
最后,第三阶段是从2017年至今,联想不但开启了HPC领域的夺冠之路,同时更跨入到了HPC和AI融合的新阶段。可以看到,2018年6月,联想以117套的份额,成为TOP500榜单中占比份额冠军,正式登上全球HPC冠军的宝座;今年6月,TOP500中有 173 套来自联想,再次蝉联世界第一;而刚刚结束的首届中国超级算力大会,以及在最新的TOP500榜单中,联想都实现了“霸榜”。
而在HPC和AI融合方面,于涛表示:“联想HPC目前不仅仅是单纯的超算,同时从算力的角度来看,它也在推动人工智能业务的发展,我们相信联想HPC在未来将有越来越多的技术、产品将是HPC和AI的结合,同时这些产品技术的发展也会推动联想HPC走向一个全新的阶段。” 由此可见,从成立到现在的这20年中,联想始终站在HPC技术和应用的前沿,通过不断地探索与创新,联想在HPC领域实现了一次又一次的重大突破,同时也真正成就了自身的冠军之路。
背后是持续的技术创新
回顾联想在HPC领域的发展过程,我们会发现联想对HPC行业的发展变化,始终有着深刻的认知和敏锐的洞察,总能与时俱进的推出相应的、端到端的完善解决方案和平台,而这正是成就联想冠军之路的重要秘诀。 例如,在能耗技术方面,联想研发的温水水冷技术,目前已经历了四次技术升级。所谓“温水水冷”解决方案,就是在服务器等需要强力制冷的数据中心设备中,通过无泄漏快速连接系统,将温水(一般为45℃)流经水冷头来冷却核心处理器及其内存,从而实现散热与冷却的技术。
如今,这项技术已经可以提供成熟的、稳定的商用解决方案,国内顶级高校北京大学就全面采用了联想水冷HPC解决方案,而本次在首届中国超级算力大会上,以2.4PF计算能力上榜TOP100的北京气象局项目,同样也成为了联想深腾X9000以及新一代温水冷却技术的又一成功案例。
于涛告诉我:“联想是目前国内最重要的温水冷却推动者,在功耗上大概比风冷可以节省45%左右,PUE大概能降到1.05,会带来直接的功耗上的体现。除此之外,还可以把CPU性能提高20%-25%,帮客户节约成本提高使用效率,并很大程度上降低器件使用的故障率,延长器件寿命。”
另据介绍,近期联想也刚刚赢得了韩国某大型项目,该项目建成后峰值计算能力将高达50PF,这套系统不仅使用了联想“海神”第四代温水水冷解决方案,还结合了最新的Dragonfly网络结构。此外,明年“海神”系统将迎来全新升级,以应对不断提升的CPU功耗和日益增加的基于不同场景的异构加速需求。
再如,面对即将到来的E级超算时代,联想HPC也提出了从Every scale到Exa-scale的技术路线。有别于针对Exa-scale进行专业化设计的理念,联想主张使用更加通用的部件和更加开放标准的去实现到Exa-scale的跨越,即使用标准的机柜,通用的高带宽低延迟网络,以及标准化的供电模块。
关键在于,这样做的优势是可以大幅度降低Exa-scale的建设成本,同时也大幅降低客户的应用难度和门槛,客户完全可以像使用任何通用的HPC平台一样,无缝的切换到Exa-scale的计算平台上。
于涛表示,联想目前也正在全球范围内携手合作伙伴与行业的顶尖的用户,共同打造面向Exa-scale的技术社区与平台。预计在不久的将来,联想也将会推动更多的客户迎来自己的Exa-scale超算时代。
不难看出,联想在超算领域对技术创新的坚持,以及对超算领域前沿技术的不断投入,再加上始终站在用户角度解决问题的决心和信心,由此成就了联想HPC业务,同时也是联想今天能在中国乃至超算市场保持领先优势核心原因。
继续推动HPC与AI融合
我们知道,超算最早的应用领域是在科学计算领域,包括国防、航空、能源、电力、汽车、生物、气象、仿真等市场,因此超算才被称之为“国之重器”,它不仅代表着国家在科学计算方面的实力,更是一个国家在经济建设中打造核心竞争力的关键武器。
在此同时,经过超算一代代的发展,特别是互联网新兴负载工作的大量出现,超算不仅在科学计算方面的贡献日益突出,如今更是被广泛应用于机器学习、人工智能等领域。
事实上,超算和人工智能有着天然的联系,超算不仅可以加速人工智能的快速发展,更随着人工智能的不断成熟,又反过来促进了超算更好的部署和应用,因此二者之间是相互促进、相互融合的关系。
联想研究院人工智能实验室主任研究员王奇刚
据联想研究院人工智能实验室主任研究员王奇刚介绍,目前基于市场需求,联想也推出了一系列的新策略、新方案、新产品,以帮助客户更好的利用超算来加速其机器学习、乃至人工智能的发展,具体而言:
一方面,是在人才和经验积累方面,联想一直走在了人工智能应用的前沿,并在一线行业应用方面积累了大量的实践经验。
“联想三年前从微软请到了芮勇博士,又从德国人工智能实验室请回了徐飞玉博士,他们都是AI领域屈指可数的人物。从那时起,联想开始组建AI实验室。在将近三年时间内,我们在AI各个领域都做了很多研究,包括从算法、人工智能算力上都有很多成果。”王奇刚说。
另一方面,在超算平台方面,联想基于AI优化的LiCO新平台,不仅具备分布式的资源调度系统,还可以帮助用户从容应对各种深度学习训练不断增长的计算需求。目前,联想LiCO已支持人脸识别、深度学习和自然语言等一系列人工智能产品及解决方案,从而帮助工程师们开发出更多更好的算法。
对此,于涛也补充表示,“在联想集团现在的3S战略当中,支撑3S战略的核心就是联想的AI技术和AI企业解决方案,这些的AI能力就是从联想HPC业务发展而来的,这样我们才可以做到AI解决方案和HPC解决方案有效结合,给更多企业和客户赋能。”
可以预期,未来联想还将继续发挥在HPC领域的技术及应用优势,通过技术创新输出的方式,推动HPC与AI的融合,让更多中国企业受益于超算以及人工智能普及带来更多价值。
全文总结,联想在HPC领域的屡屡夺冠和持续“霸榜”,背后无疑是联想在HPC领域坚持长期做技术的压强投入,厚积薄发最终得以实现突破,这是成就联想HPC冠军之路的核心所在,也是关键所在。同时,联想今天还在大力推动HPC和AI的加速融合,不仅会把整个超算行业带上一个新的阶段,也将为今后赋能千行百业的客户加速数字化转型之路进一步夯实好重要基础。
申耀的科技观察,由科技与汽车跨界媒体人申斯基(微信号:shenyao)创办,16年媒体工作经验,拥有中美两地16万公里自驾经验,专注产业互联网、企业数字化、渠道生态以及汽车科技内容的观察和思考。