摩尔线程MUTLASS开源:加速国产GPU算子开发与算法创新
来源:ictimes 发布时间:2024-11-13 分享至微信
近日,摩尔线程在推动国产GPU生态建设方面迈出了重要一步,宣布开源其高性能线性代数模板库MUTLASS。这一举措旨在助力开发者更高效地针对摩尔线程全功能GPU的MUSA Core及Tensor Core等单元进行编程,从而加速基于国产GPU的算子开发以及算法创新。
MUTLASS(MUSA Templates for Linear Algebra Subroutines)作为摩尔线程专为MUSA架构优化的高性能计算库,其开源地址位于GitHub平台。
在数值计算和深度学习领域,矩阵乘法(GEMM)及其变种是构建复杂上层应用的基石。然而,为了实现更高的算子融合效率或更创新的算法,开发者们往往需要超越标准化计算接口的限制,进行高性能的定制化算子开发。MUTLASS正是为满足这一需求而生,它采用了与muDNN库类似的分层分解及数据搬运策略,确保性能的充分发挥。
在本次开源的版本中,摩尔线程不仅适配了CuTe后端库,还为其增加了第三代MUSA架构的MMA计算原语,支持TF32/FP16/BF16/INT8等多种数据精度。以此为基础,MUTLASS初步实现了矩阵乘法、默认实例库、性能测试器及相关工具包的支持,为开发者提供了丰富的功能和工具。
[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!
ictimes
聚焦于半导体行业芯闻
查看更多
相关文章
中国GPU新星摩尔线程启动A股IPO,瞄准AI芯片市场
2024-11-13
摩尔线程完成股份制改造,正筹备上市
2024-11-12
摩尔线程迈向资本市场,完成股改准备上市
2024-11-11
d-Matrix推出AI芯片Corsair,无需GPU与HBM辅助加速推论
2024-11-26
热门搜索