AMD异构系统首席架构师Phil Rogers布道HSA

导读:异构计算被广泛认为是继多核架构后提升处理器性能的最有效的方法,开发者和软件公司通过异构编程能够实现以往CPU无法满足的处理效果甚至全新的领域,并带来全新的用户体验,如人脸识别、高清图像防抖处理等等。通过异构系统架构(Heterogeneous Systems Architecture, HSA),开发者可以充分发挥GPU的潜力,编程难度也大幅降低,并可通过简单的改动和重编译在PC、平板电脑、智能手机端移植。今年6月,AMD、ARM、Imagination、MTK和TI作为发起者共同宣布HSA基金会(HSA Foundation),推动HSA普及和跨平台应用。

【CSDN报道】7月11日,AMD公司院士Phil Rogers出现在中科院计算所的报告大厅,为现场学者、开发者和研究生们分享了HSA为异构计算和编程带来的广阔前景。在ATI工作的十多年间,Phil对Radeon系列显卡的研发作出了重要贡献,加盟AMD后专注于大幅降低运行各种现代应用程序所需的功耗,并担任异构系统架构首席架构师及异构系统架构基金会总裁。

AMD异构系统首席架构师Phil RogersAMD异构系统首席架构师Phil Rogers

AMD的异构系统架构经过多年的开发,已经渐入佳境。AMD的HSA架构创造性实现CPU和GPU间的片上数据共享,简化了编程难度,消除了传统异构系统由于不同部件间数据传输而产生的时延、效率和功耗问题,在内存和缓存两大计算机体系设计难题上做到异构系统的融合。这种架构实现了真正意义上CPU和GPU的协同工作,将显示和计算两大关系效率和功耗的部件从硬件上做到根本的改变。在技术演变路线上,逐渐完成对GPU任务统一调度及QoS保证。

为了解决传统编程者对异构尤其GPU编程的畏惧,通过HSA,AMD力图让异构应用的编程像传统的CPU编程一样容易。这套软件系统使得应用开发者得以决弃对先前驱动的依赖,根据自己的要求直接进入GPU编程,或者通过第三方和开源中间件获得更好的系统性能。JIT的实现使得对GPU底层编程的依赖大大降低。

更为重要的是,AMD将这套体系结构以一种规范的方式公开。通过成立非营利的HSA Foundation,来合理驱动异构系统及其编程的发展。在6月份的AMD开发者大会(AFDS)上, AMD、ARM、Imagination、MTK和TI作为发起者共同宣布基金会正式开展工作。基金会力求共同发展,通过统一编程模型,使得异构计算在服务器、PC、移动终端等各类设备上,最大可能的实现不同平台的互操作性。在未来的几年,随着HSA架构的逐渐成熟和各厂家相关产品的推出,可以预见更多差异化的应用会在上述平台上大量涌现。这些应用将根本性的改变目前由于操作系统、硬件平台的同质化而产生的应用同质化,并带来大量商机和丰富用户体验。通过异构架构HSA编程,软件公司和开发者能够实现诸多原先CPU体系架构无法得到的计算资源和计算性能,从而催生大量附带的差异化应用,如人脸识别、虚拟实现、手势控制、全天计算、高清图像处理、安全、云计算搜索等领域,并走出国内传统对GPU只在高性能(HPC)计算这一特定领域应用的误区,真正实现广泛应用,合理应用,差异化应用和高质量应用。

Phil表示:从编程角度,异构计算HSA架构也力图让传统的OpenCL编程变得容易,最终普通的编程人员也可以用Java、C++等来进行异构编程。在AMD的计划里,AMD将会支持更多语言比如微软的C++ AMP和利用开源项目来降低门槛,比如通过Aparapi工具、BOLT库等,同时通过这些工具和库的支持引入对Java和C++的支持。更多的开源应用也得到HSA的支持,比如OpenCV的异构版本。需要指出的是,HSA并不是APU的专利,对于追求独立显卡这种更高设备性能的开发用户,同样也享有效率和性能的提高。

6月,AMD刚刚发布了第二代APU产品(Trinity),并计划明年6月发布基于HSA架构的第三代APU产品(Kaveri),可以做到CPU/GPU共享统一的虚拟内存空间,并支持异构系统不同部件间的缓存一致性。这样的改动,使得采用APU的设备可以获得性能功耗比的极大提升。传统的DIY用户,如果不是强调大型3D游戏的显卡性能,甚至可以抛弃先前计算机必须配备独立显卡的要求。AMD在全球致力异构计算生态环境建设,在中国范围内也涌现出越来越多的应用,比如暴风播放器和基于GPU的图形处理软件Musemage,在开源项目上如VLC、X264、GIMP、Handbrake等。这些应用都可以看到由于异构计算而带来的性能提升。

未来,HSA基金会帮助联盟成员进一步推进与平板电脑、智能手机的融合。“通过HSA,开发者可以实现跨平台应用开发,”Phil表示,这意味着开发者只需要做简单的改动和重编译,就可以在平板电脑、智能手机和PC间移植应用。作为移动设备硬件提供商的典型代表ARM,其移动图形处理器(如ARM MALI604)已提供对OpenCL的完整支持。国内互联网和终端应用方兴未艾,异构计算为那些苦苦追寻自己应用差异化的公司无疑是一条创新之路。

在演讲中,Phil专门从技术层面就人脸检测,Memory CacheD两大应用阐述了异构计算带来的性能提升,现场很多从事相关应用的开发者得到诸多启迪。在演讲结束后,Phil与现场的听众进行了交流,他鼓励开发人员熟悉、掌握异构编程,拥抱异构计算带来的机遇和开发出有创意和真正有价值的应用。

据AMD中国技术开发与合作总监楚含进介绍,今年5月,作为推广异构计算的计划之一,清华大学出版社联合中科院软件所翻译出版《OpenCL异构计算》中文译本,这是首部详细介绍OpenCL的中文书籍,此书的出版为中国的开发人员在异构计算领域提供一本权威的教材和参考资料,对推动异构计算在国内普及有重要意义。随书出版,AMD和国内高校联合编写了丰富的副册《异构应用实例》, 帮助广大开发者切实的学习和掌握OpenCL,推动异构计算在中国的普及。

楚含进表示,“我们希望这本书能够成为高校OpenCL课程的教科书,帮助中国高校异构计算人才的培养。”目前,AMD已经在中国10余所大学进行了异构计算及OpenCL的授课和培训。AMD也分别与清华大学,西电大学、浙江大学,上海交大等高校合作开展通用异构计算应用等科研项目,助力中国专业技术人才队伍的建设及科研创新能力的提高。

今年暑期,AMD的新一届异构编程大赛将如期而至,来自国内百余所大专院校的学生和社会开发者将同台竞技,优胜者不仅有丰厚奖品,并且将获邀前往美国2013 AFDS大会现场,与世界级的计算机体系和软件设计专家交流。

9月,在CSDN 2012软件开发2.0技术大会上,AMD异构计算专家Phil Rogers将再次来到国内带来HSA相关全新的资讯和进展,举行一系列的活动,同时也聆听国内开发者的声音。(文/包研,感谢AMD提供技术支持)

本文为CSDN原创文章,未经允许不得转载。如需转载请联系[email protected]

http://cloud.csdn.net/a/20120717/2807418-AMD-PhilRogers-preach-HSA.html

你可能感兴趣的:(架构师)