摩尔线程MUTLASS开源:加速国产GPU算子开发与算法创新
来源:ictimes 发布时间:2024-11-13 分享至微信

近日,摩尔线程在推动国产GPU生态建设方面迈出了重要一步,宣布开源其高性能线性代数模板库MUTLASS。这一举措旨在助力开发者更高效地针对摩尔线程全功能GPU的MUSA Core及Tensor Core等单元进行编程,从而加速基于国产GPU的算子开发以及算法创新。


MUTLASS(MUSA Templates for Linear Algebra Subroutines)作为摩尔线程专为MUSA架构优化的高性能计算库,其开源地址位于GitHub平台。


在数值计算和深度学习领域,矩阵乘法(GEMM)及其变种是构建复杂上层应用的基石。然而,为了实现更高的算子融合效率或更创新的算法,开发者们往往需要超越标准化计算接口的限制,进行高性能的定制化算子开发。MUTLASS正是为满足这一需求而生,它采用了与muDNN库类似的分层分解及数据搬运策略,确保性能的充分发挥。


在本次开源的版本中,摩尔线程不仅适配了CuTe后端库,还为其增加了第三代MUSA架构的MMA计算原语,支持TF32/FP16/BF16/INT8等多种数据精度。以此为基础,MUTLASS初步实现了矩阵乘法、默认实例库、性能测试器及相关工具包的支持,为开发者提供了丰富的功能和工具。


[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!