风往哪儿吹,通用GPU成就异构HPC潮流
异构HPC纷现 通用GPU正一步步向用户走来。虽然通用GPU目前要想完全取代CPU尚不现实,但通用GPU可以和CPU配合组成异构系统来实现更强劲的计算性能,特别是图形计算性能。这是因为通用GPU是专门为图形运算而设计的,考虑到了图形运算的特殊性。这让其更适合用于海量数据重复运行场合,更适合处理SIMD运算、科学计算、数据库分析等高性能计算需求。这让通用GPU正逐步成为前沿用户关注的焦点,而通用GPU的市场化之路也正被打开。 通用GPU要想在市场上获得突破,显然HPC领域将成其最大的最具代表意义的阵地。最有名的异构系统是著名的超级计算机“Roadrunner(走鹃)”。其每个节点由一台Opteron刀片服务器加上两台PowerX Cell刀片服务器组成。其中,6912颗(早期的配置)双核Opteron主频仅为1.8G,只能提供49.8TF的峰值浮点,因此,Roadrunner的运算能力几乎全部由PowerX Cell提供,而且效率超过了75%。虽然由于采用通用化不足的Cell让走鹃很难用,但这让很多用户看到了异构系统强大的一面,让异构计算成为近年HPC领域的新趋势,并在国际高性能计算领域掀起一阵热潮,被公认为提高HPC性能的有效手段。 此后,国内的“天河一号”超算在这方面也进行了实验。天河一号也是款异构系统,其采用6144个Intel通用处理器(3072x2 Intel Quad Core Xeon E5540 2.53GHz/E5540 3.0GHz),和5120个AMD GPU加速处理器(2560 ATI Radeon 4870x2 575MHz),内存总容量98TB,点对点通信带宽40Gbps,共享磁盘总容量则达到1PB。在该系统的帮助下,其以每秒钟1206万亿次的峰值速度和每秒563.1万亿次的Linpack实测性能,勇入TOP500榜十强。 图2 新一代通用GPU正成为异构HPC的最佳解决方案 而“星云”则是近期异构系统最耀眼的新星。伴随最新TOP500超算排行榜的公布,中国超级计算机“星云”让全世界为之一震,其峰值理论运算能力达2.98PFlop/s,而Linpack性能为1.27PFlop/s,位于第35届超算排行榜第二位,这也是中国超级计算机在TOP500榜单历史上的最高名次。星云超级计算机采用自主设计的HPP体系结构,处理器是32nm工艺的六核至强X5650,并且采用了NVIDIA Tesla C2050 GPU做协处理,由4640个计算单元组成。在这种高效异构协同计算体系的支持下,让其性能倍增,并能更好的应用于云计算等领域。而其中的亮点Tesla 20系列通用GPU基于代号为“Fermi”的下一代CUDA架构,支持技术与企业计算所“必备”的诸多特性,其中包括C++支持、可实现极高精度与可扩展性的ECC存储器以及7倍于Tesla 10系列GPU的双精度性能。Tesla C2050与C2070 GPU旨在重新定义高性能计算并实现超级计算的平民化,与最新的四核CPU相比,Tesla C2050与C2070计算处理器可以十分之一的成本和二十分之一的功耗就可实现同等超级计算性能。 (编辑:PHP编程网 - 黄冈站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |