风往哪儿吹,通用GPU成就异构HPC潮流
在最新的TOP500超算榜上我们还注意到位于19位的Mellanox Mole-8.5超级计算机也采用了异构系统,该机位于中国科学院过程工程研究所。Mole-8.5系统共计有372个计算和数据处理节点(Node)——4U的双路GPU服务器TYAN FT72-B7015,其可嵌入2颗Intel Xeon 5520系列处理器和6个NVIDIA Tesla C2050系列通用处理器,几乎可以达到4Tflops双精密度最高效能的理论值。这让Mole-8.5系统可提供高达207.3TFlops的最高运算效能理论值。数据中心不仅能够提供给客户最大的运算能力,还可以提供先进的流动点的数据处理能力,满足研究和设计的不同需要。使用户能够缩短运行科学发现过程中至关重要的应用程序所需的时间,过程工程研究所亦正使用Mole-8.5在化学工程、材料科学、生物化学、数据与图像处理、石油开采与采收率以及冶金等领域开展科学模拟。 后记 图3 在个人HPC和普通服务器领域,异构系统的力量也在展现 通用GPU不仅在TOP500排行榜上、在超级计算机领域开始展露头角,在普通HPC和个人HPC、服务器方面也在批量展示实力。Appro的1U Tera GPU服务器,采用两颗AMD Opteron 6100八/十二核心处理器或两颗Intel Xeon 5500/5600四/六核心处理器,配备了四块Fermi Tesla M2050,拥有1792个流处理器,可满足HPC客户对低价位、高密度和超级计算性能的需求。Supermicro提供GPU计算系统FC405,在4U塔式机箱SC747TQ-R1400之内并排安放四块Fermi Tesla C2050,搭配Xeon 5500/5600系列处理器,还支持八个热插拔3.5寸SAS/SATA硬盘位,适合集群配置和个人HPC。浪潮倚天Tesla HPC集群以更低的功耗,更低的成本给客户提供超级计算性能,相比标准的只有CPU架构的集群,Tesla预配置集群使用更少的系统,氧气泵采用NVIDIA Tesla S1070计算系统搭建,S1070系统每个GPU计算单元有4 GB的专用存储器,支持IEEE 754单精度和双精度浮点数;提供1个快速102GB/sec的GDDR3内存接口,可以加速到节能并行计算的转变,而且可以通过规模化来更快、更准确地解决世界上最重要的计算挑战。总之,在通用GPU的推动下,服务器和HPC的异构时代正悄然到来,这种趋势已变得势不可挡。
(编辑:PHP编程网 - 黄冈站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |