天河二号超级计算机计算速度每秒5,Intel协处理器五连发

图片 5

天河二号是当今世界上运算速度第二快的超级计算机,综合技术处于国际领先水平。

天河2号用的就是3120P,不过进行了专门定制。

在每个主板上有2个计算节点,而每个框架则有16个主板,4个框架组成一个机柜,整个系统由125个机柜组成。每个计算节点主板分为两块,一块CPU一块APU,CPU上有4核Ivy
Bridge、内存和一个Xeon Phi协处理器,而APU基板上则承载着5个Xeon
Phi协处理器.CPU和APU之间有5个水平插入的链接口,由Ivy Bridge内置的PCI-E
2.0进行连接,虽然Ivy Bridge内置为PCI Express 3.0接口,但Xeon
Phi仅支持2.0,单个通路为10Gbps带宽。

【编辑推荐】

同样在2013年6月,天河二号以2,061GTEPS的成绩在Graph500上排名第六。Graph500是一个对超级电脑的数据密集型运算处理性能进行的一个排行榜,在此榜单上排位第一的是IBM红杉,成绩是15,363GTEPS。

“5120D”规格与之基本类似,还是60核心、1.011TFlops,只不过提高了内存频率而有352GB/s的带宽,热设计功耗同时也增至245W,外观上采用非PCI-E扩展卡的紧凑型设计,针对高密度计算环境,可直连在迷你主板上做刀片服务器,而且自身无散热,需要系统辅助。

APU模块和CPM模块之间以CPU内部提供的PCI-E 3.0
16x接口进行连接,但实际由于Xeon Phi的硬件限制,仅支持至PCI-E 2.0
16x,单通道数据传输速率为10Gbps。

Intel同时还披露了下一代Xeon Phi协处理器的部分情况,开发代号“Knights
Landing”,不但可以用作协处理器(co-processor),还能首次作为主处理器(host
processor)使用,也就是不再需要Xeon的辅助,能同时担当中央处理器、协处理器的角色,可大大提高计算密度、能耗比,而且不再需要考虑经过PCI-E在两种处理器之间转移数据,编程自然大大简化。到时候,它就不能叫协处理器了。

天河二号已应用于生物医药、新材料、工程设计与仿真分析、天气预报、智慧城市、电子商务、云计算与大数据、数字媒体和动漫设计等多个领域,还将广泛应用于大科学、大工程、信息化等领域,为经济社会转型升级提供重要支撑。

“7110P”、“7120X”致力于提供最强悍的性能,均开启了全部61个核心,主频进一步提高至1.238GHz,而且还能动态加速至最高1.33GHz,因此浮点性能达到了1.208TFlops,所搭配内存容量也翻番至16GB,峰值带宽352GB/s。热设计功耗依旧控制在300W,其中前者被动散热,后者无散热。

技术参数

天河2号登顶世界超级计算机500强排行榜第一,不仅让中国再次震惊世界,也成就了Intel
Xeon
Phi协处理器的风光无限。前十名已有两套用了这种新技术,协处理加速计算初露锋芒。

组成结构

Intel这次没有披露它们的具体价格,不过根据此前消息,3000系列不会超过2000美元。5110P
2649美元。

主要性能

趁此机会,Intel大大扩充了Xeon
Phi家族的规模,一口气发布了五款新型号,从高到低形成了完成的产品线。

每块主板上分为APU模块和CPM模块两部分,APU部分承载5块Xeon
Phi,CPM部分承载1块Xeon Phi+4颗Xeon E5。

图片 1

它有五大特点:一是高性能,峰值速度和持续速度都创造了新的世界纪录;二是低能耗,能效比为每瓦特19亿次,达到了世界先进水平;三是应用广,主打科学工程计算,兼顾了云计算;四是易使用,创新发展了异构融合体系结构,提高了软件兼容性和易编程性;五是性价比高。

Xeon
Phi此前仅有一款产品“5110P”,60核心,主频1.053GHz,搭载8GB内存,带宽320GB/s,峰值双精度浮点运算能力1.011TFlops,热设计功耗225W,采用主动/被动散热的PCI-E扩展卡形式。

世界上运算速度最快的计算机是天河二号超级计算机。“天河二号”是由国防科学技术大学研制的超级计算机系统,以峰值计算速度每秒5.49亿亿次、持续计算速度每秒3.39亿亿次双精度浮点运算的优异性能位居榜首,成为全球最快超级计算机。2014年11月17日公布的全球超级计算机500强榜单中,中国“天河二号”以比第二名美国“泰坦”快近一倍的速度连续第四次获得冠军。2015年5月,“天河二号”上成功进行了3万亿粒子数中微子和暗物质的宇宙学N体数值模拟,揭示了宇宙大爆炸1600万年之后至今约137亿年的漫长演化进程。同时这是迄今为止世界上粒子数最多的N体数值模拟。

第二代将采用14nm
3D晶体管工艺制造,并且引入整合封装嵌入式缓存,从而大大提高内存带宽——Haswell
GT3e难道就是这样的试验品?

使用光电混合传输技术(Optoelectronics Hybrid Transport
Technology),使用自制的TH
Express-2主干拓扑结构网络连接,以13个大型路由器通过576个连接端口以光电传输介质与各个运算节点互联,控制器名为NRC,使用90纳米制程,单个控制器的数据吞吐量2.56Tbps,终端网络接口使用名为NIC的控制器,以PCI-E
2.0接口链接,数据传送速率6.36GB/s。

第二代仍会采用PCI-E扩展卡样式。

存储

“3120P”、“3120A”面向追求性价比的高性能计算客户,都拥有57个核心,主频提高到1.1GHz,但因为核心较少而浮点性能只有1.003TFlops。它们均搭载6GB内存,峰值带宽240GB/s,热设计功耗高达300W,分别是被动、主动散热。

而在计算能力方面,使用14336个节点总计50GB内存进行LINPACK测试,理论性能为49.19Pflops,而实际测试性能为30.65Pflops,效率为62.3%.这个效率并不算高,还有很大优化提升潜力。当然也可能是被Xeon
phi仅支持PCI Express 2.0带宽不足限制。

图片 2

12.4PB容量的硬盘阵列

2013年6月,天河二号以峰值速度每秒54,902.4TFLOPS、持续速度33,862.7TFLOPS,超越泰坦超级计算机(Rpeak
27,112.5TFLOPS,Rmax
17,590.0TFLOPS),成为当今世界上最快的超级计算机。这个成绩于2013年6月17日提交至TOP500。实际上,在早前的运行测试中,仅使用16,000个运算节点中的90%,亦即14,336个节点,LINPACK运算速度就达到30.65PFLOPS的性能水准,超过前任“泰坦”的74%。国际TOP500组织2013年11月18日公布了最新全球超级计算机500强排行榜榜单,“天河二号”以比第二名美国的“泰坦”快近2倍的速度登上榜首。

图片 3

前端处理器

借助天河二号的“计算神功”,国产C919大型客机开展了高精度外流场气动计算;中科院上海药物研究所开展了75万个小分子化合物的结合亲和力评估,完成了600多个各类药物的体内外活性测试评价。天河二号适配了广州市电子政务数据管理系统和云盘存储系统等,为智慧城市建设搭建高效可靠的承载平台……

主架

计算节点的前端处理器为4096个FT-1500处理器,FT-1500处理器是由国防科技大学为天河1研发,其可以说是天河1项目的最大收获,其为16核心的Sparc
V9架构处理器,在40nm工艺情况下运行频率为1.8Ghz,峰值性能为144
Gflops/s,功耗为65W,但相比英特尔22nm 12核2.2GHz 211Gflops/s性能的Ivy
Bridge还是有明显差距。

连接

应用领域

天河2互联方面采用自主研发的Express-2内部互联网络,其为有13个交换机,而每个交换机有576个端口。连接介质为光电混合。具体控制器是名为NRC的ASIC专用目的集成电路,其采用90nm工艺,封装尺寸为17.16×17.16
mm,共有2577引脚。单个NRC的吞吐能力为2.56Tbps.而在终端方面网络接口也采用类似结构的NIC,但规模稍小,为10.76×10.76
mm,675 pin,其采用PCIE
2.0方式连接,传输速率为6.36GB/s.并且在在12000节点的情况下延迟也很低,仅为85us.

图片 4

操作系统

麒麟操作系统、基于SLURM(Simple Linux Utility for Resource
Management,资源管理用单一Linux公用程序)的全局资源管理。

整机功耗17,808千瓦,在搭载水冷散热系统以后,功耗将达到24兆瓦,无论水冷系统的搭载与否,都是目前TOP500里功耗最大的。天河二号电费每年达1亿人民币。

系统的整体功耗为17.6
MW,并且这个功耗还不包括水冷这样的散热系统,如果考虑上整体功耗将高达24MW,广州国家超算中心将采用城市供水系统构建高散热效能的冷却系统,有能力可以提供80KW系统的散热能力。

内存

每个节点拥有64GB主存,而每个Xeon
Phi协处理器板载8GB内存,故每节点共88GB内存,整体总计内存1.408PB。

运算加速上,使用基于英特尔集成众核架构的Xeon Phi
31S1P协处理器,运行时钟为1.1GHz,每个使用61个核心中的57个(因为使用61个会存在运算周期协调问题),每核心籍由特殊的超线程技术能运作4个线程,产生峰值性能为1.003TFLOPS。

天河二号超级计算机系统由170个机柜组成,包括125个计算机柜、8个服务机柜、13个通信机柜和24个存储机柜,占地面积720平方米,内存总容量1400万亿字节,存储总容量12400万亿字节,最大运行功耗17.8兆瓦。天河二号运算1小时,相当于13亿人同时用计算器计算一千年,其存储总容量相当于存储每册10万字的图书600亿册。相比此前排名世界第一的美国“泰坦”超级计算机,天河二号计算速度是“泰坦”的2倍,计算密度是“泰坦”的2.5倍,能效比相当。与该校此前研制的天河一号相比,二者占地面积相当,天河二号计算性能和计算密度均提升了10倍以上,能效比提升了2倍,执行相同计算任务的耗电量只有天河一号的三分之一。

以6月17日公布的数据推算,每瓦性能为1.901GFLOPS,仍不及泰坦的每瓦2.143GFLOPS和IBM红杉每瓦2.177GFLOPS的成绩,但比”京”的每瓦0.830GFLOPS每和天河一号每瓦仅0.668GFLOPS都要高不少。

每个Xeon
Phi使用其中的57个核心,而不是使用全部的61个,因为使用61个在运算周期协调方面会有问题,而使用57个核心能够加速4个执行线程,并且在每个线程单周期可以达成4Gflops的运算量,运行在1.1GHz的Xeon
Phi可以生产1.003 Tflops的双精度运算能力。如果考虑CPU,2 Ivy
Bridge*0.2112 Tflop/s+3 Xeon Phi*1.003 Tflop/s=3.431 Tflops,2个Ivy
Bridge+9个Xeon Phi单个节点可以有3.431
Tflops运算能力,16000个节点总计可达54.9PFlops性能。每个运算节点有256GB主存、而每个Xeon
Phi板载8GB内存,因此每个节点共有88GB内存,总计16000个节点一共有1.404
PB内存,而外部存储器容量方面更是高达12.4PB.

天河2号由16000个节点组成,每个节点有2颗基于Ivy Bridge-E Xeon E5
2692处理器和3个Xeon Phi,累计共有32000颗Ivy Bridge处理器和48000个Xeon
Phi,总计有312万个计算核心。

主要特点

天河二号逐步在生命科学、材料科学、大气科学、地球物理、宇宙、经济学,以及大型基因组组装、基因测序、污染治理等一系列事关国计民生的大科学、大工程中“大显身手”。此外,国家超算广州中心积极推动国际交流与合作,利用天河二号为国外研究机构提供高性能计算服务。

上面测试使用了16000个节点中的14336个,运用了90%的规模,基本可以代表天河2的整体性能表现。天河2的性能部件(处理器、内存、互联)整体功耗为17.6MW,而整体的运算能力为30.65PFlops,这样计算每瓦的性能为1.935Gflops,这个性能/功耗比可以排在超算TOP500的前五,其整体性能/功耗比十分出色。

计算节点前端处理器为4096颗FT-1500 16核心SPARC
V9架构的处理器,40纳米制程,运作时钟频率1.8GHz,热设计功耗65瓦,峰值性能144GFLOPS。

根据该专项“面向大规模科学计算的高性能多核CPU”课题计划安排,2011年中国将采用FT-1500CPU构建全自主国产千万亿次计算机——“天河二号”。

“天河二号”的系统存储总容量相当于600亿册每册10万字的图书。假设每人每秒钟进行一次运算,“天河二号”运算一小时,相当于13亿人同时用计算器算上1000年。

图片 5

天河二号型号为TH-IVB-FEP

据悉,科技部近年不断加大对超算应用软件研发的投入。“十二五”以来的相关研发投入已超过2亿元。预计“十三五”期间投入将进一步加大。

外存

中央处理器为英特尔提供的,运作时钟频率为2.2GHz的Xeon E5-2692
V212核心处理器,基于英特尔Ivy Bridge微架构(Ivy
Bridge-EX核心),采用22纳米制程,峰值性能0.2112TFLOPS。

Ubuntu Linux。(Ubuntu
OpenStack运行在256个高性能节点上,而且在接下来的数月将会增长至超过6400个节点。OpenStack和Ubuntu的编制工具Juju都将运行在天河二号上,使国防科技大学的合作伙伴和联盟机构能够快速部署和管理高性能云环境)

16,000个运算节点,每节点配备两颗Xeon E5 12核心的中央处理器、三个Xeon Phi
57核心的协处理器。累计32,000颗Xeon E5主处理器和48,000个Xeon
Phi协处理器,共312万个计算核心。

处理器

能耗

型号

主板、机架与机柜均由浪潮集团制造,共有125个机柜,每个机柜容纳4个机架,每个机架容纳16块主板,每个主板设置有两个计算节点。每个机柜还装有负载指示灯,根据机柜内主机的运算负载变更发光二极管的发光颜色。

发表评论

电子邮件地址不会被公开。 必填项已用*标注