天河二号是什么?
由国防科大研制的天河二号超级计算机系统,以峰值计算速度每秒5.49亿亿次、持续计算速度每秒3.39亿亿次双精度浮点运算的优异性能位居榜首,成为全球最快超级计算机。2010年11月,天河一号曾以每秒4.7千万亿次的峰值速度,首次将五星红旗插上超级计算领域的世界之巅。此次是继天河一号之后,中国超级计算机再次夺冠。
2013年11月18日,国际TOP500组织公布了最新全球超级计算机500强排行榜榜单,中国国防科学技术大学研制的“天河二号”以比第二名―美国的“泰坦”快近一倍的速度再度登上榜首。美国专家预测,在一年时间内,“天河二号”还会是全球最快的超级计算机。
在2014年6月23日公布的全球超级计算机500强榜单中,中国“天河二号”以比第二名美国“泰坦”快近一倍的速度连续第三次获得冠军。
组成结构
天河2号由16000个节点组成,每个节点有2颗基于Ivy Bridge-E Xeon E5 2692处理器和3个Xeon Phi,累计共有32000颗Ivy Bridge处理器和48000个Xeon Phi,总计有312万个计算核心。
每个Xeon Phi使用其中的57个核心,而不是使用全部的61个,因为使用61个在运算周期协调方面会有问题,而使用57个核心能够加速4个执行线程,并且在每个线程单周期可以达成4flops的运算量,运行在1.1GHz的Xeon Phi可以生产1003 Tflops的双精度运算能力。如果考虑CPU,2 Ivy Bridge * 0.2112 Tflop/s + 3 Xeon Phi * 1.003 Tflop/s=3.431 Tflops,2个Ivy Bridge+3个Xeon Phi单个节点可以有3.431 Tflops运算能力,16000个节点总计可达54.9PFlops性能。每个运算节点有64GB主存、而每个Xeon Phi板载8GB内存,因此每个节点共有88GB内存,总计16000个节点一共有1.404 PB内存,而外部存储器容量方面更是高达12.4PB.
在每个主板上有2个计算节点,而每个框架则有16个主板,4个框架组成一个机柜,整个系统由125个机柜组成。每个计算节点主板分为两块,一块CPM一块APU,CPM上有4核Ivy Bridge、内存和一个Xeon Phi,而APU基板上则承载着5个Xeon Phi.CPM和APU之间有5个水平插入的链接口,由Ivy Bridge内置的PCI-E 2.0进行连接,虽然Ivy Bridge内置为PCI Express 3.0接口,但Xeon Phi仅支持2.0,单个通路为10Gbps带宽。
计算节点的前端处理器为4096个FT-1500处理器, FT-1500处理器是由国防科技大学为天河1研发,其可以说是天河1项目的最大收获,其为16核心的Sparc V9架构处理器,在40nm工艺情况下运行频率为1.8Ghz,峰值性能为144 Fflops/s,功耗为65W,但相比英特尔22nm 12核 2.2GHz 211Gflops/s性能的Ivy Bridge还是有明显差距。
天河2互联方面采用自主研发的 Express-2 内部互联网络,其为有13个交换机,而每个交换机有576个端口。连接介质为光电混合。具体控制器是名为NRC的ASIC专用目的集成电路,其采用90nm工艺,封装尺寸为17.16x17.16 mm,共有2577引脚。单个NRC的吞吐能力为2.56Tbps.而在终端方面网络接口也采用类似结构的NIC,但规模稍小,为10.76x10.76 mm, 675 pin,其采用PCIE 2.0方式连接,传输速率为6.36GB/s.并且在在12000节点的情况下延迟也很低,仅为85us.
而在计算能力方面,使用14336个节点 总计50GB内存进行LINPACK测试,理论性能为49.19Pflops,而实际测试性能为30.65Pflops,效率为62.3%.这个效率并不算高,还有很大优化提升潜力。当然也可能是被Xeon phi仅支持PCI Express 2.0带宽不足限制。
上面测试使用了16000个节点中的14336个,运用了90%的规模,基本可以代表天河2的整体性能表现。天河2的性能部件(处理器、内存、互联)整体功耗为17.6MW,而整体的运算能力为30.65PFlops,这样计算每瓦的性能为1.935Gflops,这个性能/功耗比可以拍在超算TOP500的前五,其整体性能/功耗比十分出色。
系统的整体功耗为17.6 MW,并且这个功耗还不包括水冷这样的散热系统,如果考虑上整体功耗将高达24MW,广州国家超算中心将采用城市供水系统构建高散热效能的冷却系统,有能力可以提供80KW系统的散热能力。
天河二号是当今世界上运算速度最快的超级计算机,综合技术处于国际领先水平。它有五大特点:一是高性能,峰值速度和持续速度都创造了新的世界纪录;二是低能耗,能效比为每瓦特19亿次,达到了世界先进水平;三是应用广,主打科学工程计算,兼顾了云计算;四是易使用,创新发展了异构融合体系结构,提高了软件兼容性和易编程性;五是性价比高。
天河二号超级计算机系统由170个机柜组成,包括125个计算机柜、8个服务机柜、13个通信机柜和24个存储机柜,占地面积720平方米,内存总容量1400万亿字节,存储总容量12400万亿字节,最大运行功耗17.8兆瓦。天河二号运算1小时,相当于13亿人同时用计算器计算一千年,其存储总容量相当于存储每册10万字的图书600亿册。相比此前排名世界第一的美国“泰坦”超级计算机,天河二号计算速度是“泰坦”的2倍,计算密度是“泰坦”的2.5倍,能效比相当。与该校此前研制的天河一号相比,二者占地面积相当,天河二号计算性能和计算密度均提升了10倍以上,能效比提升了2倍,执行相同计算任务的耗电量只有天河一号的三分之一。
主要性能
天河二号自主创新了新型异构多态体系结构,在强化科学工程计算的同时,可高效支持大数据处理、高吞吐率和高安全信息服务等多类应用需求,设计了微异构计算阵列和新型并行编程模型及框架,提升了应用软件的兼容性、适用性和易用性。天河二号服务阵列采用了国家核高基重大专项支持、该校研制的新一代“FT-1500”CPU,这是当前国内主频最高的自主高性能通用CPU。天河二号还在高速互连、新型层次式加速存储架构、容错设计与故障管理、综合化能效控制、高密度高精度结构工艺等方面取得了一系列创新和突破。
应用领域
天河二号已应用于生物医药、新材料、 工程设计与仿真分析、天气预报、智慧城市、电子商务、云计算与大数据、数字媒体和动漫设计等多个领域,还将广泛应用于大科学、大工程、信息化等领域,为经济社会转型升级提供重要支撑。
天河二号逐步在生命科学、材料科学、大气科学、地球物理、宇宙、经济学,以及大型基因组组装、基因测序、污染治理等一系列事关国计民生的大科学、大工程中“大显身手”。此外,国家超算广州中心积极推动国际交流与合作,利用天河二号为国外研究机构提供高性能计算服务。
据悉,科技部近年不断加大对超算应用软件研发的投入。“十二五”以来的相关研发投入已超过2亿元。预计“十三五”期间投入将进一步加大。
根据该专项“面向大规模科学计算的高性能多核CPU”课题计划安排,2011年中国将采用FT-1500CPU构建全自主国产千万亿次计算机――“天河二号”。
2009年,中国首台千万亿次计算机“天河一号”研制成功,
运行“核高基”专项支持研制的银河麒麟操作系统,名列当年的国际超级计算机TOP 500排行榜世界第五位、亚洲第一位的排名,并使中国成为继美国之后世界上第二个能够研制千万亿次超级计算机的国家。
相对于上世纪颇负盛名的"两弹一星"。"核高基"专项被誉为中国新时期的"两件(核心电子器件、基础软件)一芯(高端通用芯片)",主要涵盖了核心的电子器件、高端通用芯片、基础软件产品三个方向;掌握其关键技术并实现产业化对于中国实现以信息化带动工业化、确保国家信息安全至关重要。
在高端通用芯片方向,"核高基"专项重点部署了高性能服务器多核CPU、安全适用计算机CPU及嵌入式CPU;在基础软件产品方向,重点部署了操作系统、数据库、办公软件、中间件、重大信息化应用等基础软件。