美国再砸6亿美元造E级超算,2023年问世,算力盖世

OPEN编辑 2年前

  美国能源部宣布建设新的“E级”超算 El Capitan,算力将达到 1.5EP,预计 2023 年上线,是现有最快超算算力的 10 倍,超过目前“超算 500”榜单上前 10 名的算力总和,同时实现了 4 倍的能效提升。但新超算将使用什么 CPU 和 GPU,目前尚不得而知。

  美国能源部(DOE)和国家核安全局近日宣布,超算制造商 Cray 的 Shasta 超级计算平台将成为 El Capitan 的支柱。这台美国军火库中新的首屈一指的超级计算机将达到 1.5 EP 的算力,比现有最快的超级计算机快 10 倍。 

  一、El Capitan 算力将达 1.5EP,尚未透露 CPU/GPU 配置  

  El Capitan 将使用人工智能和机器学习以前所未有的规模和速度进行 3D 模拟任务,并且在现有超级计算机基本上不可能达到的分辨率下进行。目前的超级计算机在性能最高可达 400petaFLOPS,可在 200petaFLOP 级别上内提供持续算力。(1E=1000P) 

  目前世界上最快的 10 台超算中,有 4 台归美国能源部所有。该部已向 Cray 授予了价值 6 亿美元的合同,用于构建基于 Shasta 架构,Slingshot 互联和软件平台的系统。该系统为能源部的在建的其他“E级”超级计算机 Aurora 和 Frontier 提供动力的平台。

  其中 Aurora 配备了尚未公开的“未来的”Intel Xeon 处理器、尚未发布的 Xe 图形架构,以及 Optane Persistent DIMM。Frontier 则采用下一代 AMD EPYC 处理器和 Radeon Instinct GPU。这些系统都没有使用英伟达的 GPU,而英伟达 GPU 一直是超级计算机的主流选择。 

  目前同样不确定英伟达的 GPU 是否会出现在 El Capitan 中。美国能源部也还没有最终决定 El Capitan 将使用哪家公司的处理器,这很奇怪,因为目前已经公布了性能预测,而且超算的设计看来已经进入了最后阶段,不过目前所知的是,El Capitan 使用的架构将遵循 Shasta 平台架构中 GPU 和 CPU 的标准组合。

  Shasta 架构目前仅支持 Intel、AMD 和 Nvidia CPU/加速器,所以看上去应该不会使用 IBM 的 POWER 或 ARM 的处理器。制造商 Cray 表示,将在稍后公布 El Capitan 使用的 CPU 和 GPU。

  功耗仅 40 兆瓦,能效四倍提升

  最强算力、“E级”这些热词总是令人印象深刻,但功率效率对于超级计算也很重要。因为目前美国能源部尚未公布哪些处理器和 GPU,该机构称 El Capitan 的功率大约 40 兆瓦,效率是 Sierra 的四倍,Sierra 是该机构目前最快的超级计算机。提高效率主要是网络,水冷和软件优化(AI / ML)的结果。 

  在去年的超级计算机大会上,我们有机会近距离观察 Shasta 平台。美国能源部尚未透露 El Capitan 将使用多少机架,如果该超算的刀片机架首尾相连,长度将比优胜美地国家公园中的 3600 英尺高的酋长岩(El Capitan)山峰高三倍。该超算的名字正是由来于此。

  El Capitan 将使用有四个节点的 Shasta 计算 blade。每个节点目前最多可容纳 8 个计算插槽和完整的内存 DIMM 和网络。制造商 Cray 已经表明其 Shasta CPU、GPU 和网络刀片的当前一代产品将不会在 Frontier 超算中继续使用。目前还不清楚 El Capitan 的动力来源是 Cray 当前一代还是下一代计算技术。 

 

  与当前一代一样,Cray 将使用其专有的 Slingshot 结构将节点连接到集成的架顶式交换机上,这些交换机中包括 Cray 设计的 ASIC,每个交换端口数据吞吐量为 200 Gb / s。网络结构使用增强的低延迟协议,利用智能路由机制缓解拥塞。还支持光链路互联。该系统将与未来版本的 Cray CluserStor 存储服务搭配使用。 

  Cray 还将开发新的软件堆栈,一旦 ElCapitan 完全构建完毕,就可以立即部署。Cray 正与所有相关机构合作,建立一个“卓越计算中心”,对现有的软件代码进行优化,以便在 2023 年搭建完成时与 El Capitan 实现合作。 

  El Capitan 的构建标志着超算制造商 Cray 又一次巨大的胜利,目前该公司一共拿到的 Shasta 订单额达到了 15 亿美元。El Capitan,Aurora 和 Frontier 将共同角逐世界最快的超级计算机榜单,这使得 Cray 在超级计算竞赛中处于领先地位。

  此外,Shasta 平台也可用于标准数据中心和高性能计算平台的部署,类似的系统可能将很快出现在数据中心里,可能就在你的身边。