欧洲航天局(EuropeanSpaceAgency,ESA)正在研究多种提高太空计算能力的方法,其支持的其中一款处理器即将发布。
该局研究人员在上个月的欧洲设计、自动化和测试会议上发表演讲时表示,由苏黎世联邦理工学院和博洛尼亚大学的工程师开发的Occamy处理器已接近完成。这颗芯片在2021年4月20日开始研发,2022年7月流片成功后,目前正在进行最后封装。欧洲航天局也是该开源处理器小组的一员。
目前已知的一些芯片特性
据悉该芯片属于并行超低功耗(PULP)平台项目,包含两个计算单元(CPU),每个采用了216个32位RISC-V内核的Chiplet设计、未知数量的64位浮点单元(FPU),以及两颗来自美光的16GBHBM2E内存。这颗处理器的内核通过中介层实现互连,双块CPU估计峰值性能为:FP64时达到0.768TFLOp/s,在FP32时达到1.536TFLOp/s,在FP16时达到3.072TFLOp/s,在FP8精度时达到6.144TFLOp/s。
在该芯片中,研发人员将名为Snitch的小型超高效有序32位RISC-V整数内核,与通过单指令多数据(SIMD)增强的大型多精度FPU相结合,实现以下FP格式的功能:FP64(11,52)、FP32(8,23)、FP16(5,10)、FP16alt(8,7)、FP8(5,2)、FP8alt(4,3)。除了标准的RISC-V融合乘法累加(FMA)指令外,两种8位和两种16位FP格式还具有新的扩展和点积和三加数求和(exsdotp、exvsum和vsum)指示。
为了在数据并行FP工作负载上实现超高效计算,研发人员利用了两个自定义架构扩展:数据可预取寄存器文件条目和重复缓冲区。相应的RISC-VISA扩展流语义寄存器(SSR)和FP重复指令(FREP)使Snitch内核能够为计算绑定内核实现高于90%的FPU利用率。
Occamy部分die视图
每个Occamy 每颗Chiplet包含超过216个Snitch内核,这些内核以四个计算集群为一组进行组织。每个集群在八个计算内核和一个高带宽(512位)DMA增强内核之间共享一个紧密耦合的内存,用于编排数据流。基于AXI的宽多级互连和专用DMA引擎有助于管理巨大的片上带宽。支持CVA6Linux的RISC-V核心管理所有计算集群和系统外围设备。每个Chiplet都有一个私有的16GB高带宽内存(HBM2e),并且可以通过19.5GB/s宽、源同步技术独立的裸片到裸片DDR链路与相邻的Chiplet进行通信。
Occamy部分die视图
Occamy是一款用于AI和高性能计算工作负载的低功耗芯片,其轻量级的32位CPU核心更像是一个控制芯片,负责将任务重新路由到AI核心。今天的AI工作负载在很大程度上依赖于GPU和AI核心等加速器来进行训练和推理,研究人员希望开源芯片也可以用于太空中的AI工作负载。
单个Occamy芯片以1GHz的频滤运行时功耗是10瓦,因此两个芯片加上HBM内存会使最终芯片的功耗增加一倍以上。欧空局及其开发合作伙伴都没有透露Occamy的具体功耗,但据说该芯片采用了被动式散热,这意味着它可能是一款低功耗处理器。
无心插柳的Chiplet设计
这款432核芯片是新旧技术的有趣结合,当下热门的Chiplet设计优点之一是允许在芯片封装内混合和匹配新旧技术,例如模拟或数字处理器,后续还可以在封装中添加其他功能模块,以便在需要时加速某些工作负载。每颗Occamy芯片中都有216个RISC-V内核和用于矩阵计算的FPU,这颗尺寸72mm2的小小芯片上总计大约分布了10亿晶体管,,与英特尔2011年制造的四核SandyBridge芯片大致相同(大三倍)。
Occamy基于格芯(GlobalFoundries)12LPP(12nm低功耗)工艺制造,Chiplet设计置于无源65nm中介层之上。
ESA表示,Occamy项目最初是其在2020年HotChips会议上提出的Manticore高性能架构概念的偶然成果。目前的研究原型,用于展示和探索基于RISC-V的架构在2.5D集成Chiplet系统中的可扩展性、性能和效率,展示了GlobalFoundries的技术及其IP生态系统,以及Rambus(HBM2e控制器IP和集成支持)和Micron(HBM2eDRAM供应和集成支持)的IP生态系统。另外新思科技(Synopsys)在EDA工具许可上的大力支持,以及Avery在HBM2eDRAM验证模型上的支持使该项目成为可能。
作为对比,英特尔AlderLake裸片尺寸为163mm2。就性能而言,英伟达A30GPU具有24GBHBM2显存,可提供5.2FP64/10.3FP64的TensorTFLOPS以及330/660(稀疏性)INT8TOPS。
欧洲自主芯片计划的一部分
据公开资料显示,Occamy是作为欧空局EuPilot计划(EuropeanPILOTProject)的一部分开发的,它是ESA正在考虑用于航天计算的众多芯片之一。该计划旨在通过创建一套在欧洲设计、实施、制造和部署的自主加速器,交付第一个基于全欧洲开源和开放标准的软件和硬件集成HPC系统。加速器将采用新的欧洲GlobalFoundries先进工艺技术制造,以展示欧洲技术的独立性。
EuPilot计划正在开发本土处理器以减少对专有x86和Arm架构芯片的依赖,也在为超级计算机、人工智能、物联网和自动驾驶汽车开发自主可控芯片。
ESA对这些芯片很感兴趣,因为它将允许太空中的设备执行片上数据分析。虽然不能保证ESA会让该芯片投入太空运行,但它是正在探索用于航天计算的众多处理器之一。美国这边,NASA也采用了Microchip和SiFive的RISC-V芯片来升级其航天计算机。
据介绍,Occamy可以在FPGA上进行仿真运算,该实现已在两个AMDXilinxVirtexUltraScale+HBMFPGA和VirtexUltraScale+VCU1525FPGA上进行了测试。设计Occamy芯片的研究人员希望芯片设计能够被采用并被低成本地复用,要实现这点可能取决于软件。
暂无评论哦,快来评论一下吧!