
NVIDIA在2022年推出采用ARM架构的Grace CPU Superchip,希望挑战英特尔(Intel)与超微(AMD)x86架构在高效能运算(HPC)市场的霸权地位,掀起业界波澜,除将首先搭载于美国洛斯阿拉莫斯国家实验室(LANL)的Venado系统,近期更宣告赢得西班牙巴塞隆纳超级运算中心(BSC)准百万万亿级(pre-exascale)超级电脑MareNostrum 5的供应合约。
综合Tom’s Hardware与HPCWire报导,MareNostrum 5超级电脑为欧洲高效能运算联合任务中心(EuroHPC JU)计划的一环,最快将于2023年运转,系统由Atos负责打造,搭载采用双芯片配置的NVIDIA 144核心Grace CPU Superchip,以及Hopper H100独立式GPU加速器,预估CPU与GPU加速器的FP64运算峰值效能将达到314PFLOPS。
The NextPlatform估计,MareNostrum 5使用的H100加速器数量可能多达4,500个,其中配备的Tensor核心,有助于系统达到270 PFLOPS的FP64运算效能,至于剩下的44 PFLOPS,则来自于Grace双芯片CPU模块,估计每颗Grace芯片平均能提供3.84TFLOPS的速度,因此Grace CPU模块数可能达到5,730个。
另外,MareNostrum 5人工智能(AI)加速(通常是FP8 8位元浮点运算)速度预计会超过18 EFLOPS,有望成为欧盟境内速度最快的AI超级电脑。除了芯片技术以外,MareNostrum 5还会导入NVIDIA的Quantum-2无限带宽软件定义网络,利用BlueField数据处理器(DPU)改善系统各零件之间的传输延迟,吞吐率可达到每秒400GB。
MareNostrum 5特别针对医学研究、化学模拟与药物开发等应用领域进行设计,同时也能支持气候科学与环境工程等,而NVIDIA Omniverse套装软件将支持上述应用的数码分身(digital twin)发展。数码分身技术有助于自动化系统与现实世界的实时数据流之间的整合,能够促成在模拟模型上的实时更新(on-the-fly update)、模拟与产出的循环回馈机制。
BSC表示,MareNostrum 5将促成能够改变世界的科学突破,也承诺BSC会发展属于欧洲的硬件,应用于未来时代的超级电脑,并协助欧盟达成科技主权目标。
另外,如同部署于欧洲各地的其他新一代超级电脑一般,MareNostrum 5完全使用再生能源,多余的热能会进行再利用,而不是随便排掉。废热再利用比例与方式目前未知,但很可能会采用与芬兰LUMI超级电脑相同的设计原则。
LUMI是EuroHPC JU首座pre-exascale级超级电脑,峰值速度达到214.35PFLOPS,目前在TOP500榜单中排名第3,采用超微优化版第3代Epyc CPU与Instinct MI250X GPU,废热回收比例为20%,主供周遭居民使用。
MareNostrum 5采购案曾在2021年5月遭到取消,据Politico报导,主因大概是在供应商竞标时,欧盟执委会(EC)代表偏好身为欧洲业者的Atos,但西班牙代表偏好IBM与联想(Lenovo)联盟的困局所致。然而也有其他说法指出,采购案取消是因为系统规格需要更新。
直到当年12月底,MareNostrum 5系统才重新招标。推测Atos的雀屏中选,可能与疫情、供应链干扰与地缘政治紧张等背景下,欧洲希望强化超级运算科技主权的因素有关。系统打造成本约1.51亿欧元(约1.58亿美元),由EuroHPC JU与西班牙、葡萄牙、土耳其组成的联盟,两方平均分摊。
责任编辑:朱原弘
暂无评论哦,快来评论一下吧!
