DeepSeek开源周再放大招
来源:龙灵 发布时间:2025-02-26
分享至微信

近日,DeepSeek开源周活动如火如荼地进行中,继MLA解码核FlashMLA以及DeepEP两款代码库开源后,DeepSeek再次抛出重磅炸弹——宣布开放DeepGEMM代码库。
DeepGEMM,这款专为简洁高效的FP8通用矩阵乘法(GEMMs)而设计的代码库,无疑是此次开源周的又一大亮点。它不仅支持普通的GEMM运算,还兼顾了专家混合(MoE)分组的运算需求,展现了其强大的通用性和灵活性。
值得一提的是,该代码库使用CUDA编写,安装过程无需繁琐的编译步骤,只需在运行时通过轻量级即时编译模块即可完成所有内核的编译,极大地提升了开发效率。
DeepGEMM的代码量仅约为300行,却巧妙地解决了FP8张量核心累加不精确的问题。它采用了CUDA核心的两级累加(提升)方法,确保了运算的准确性和稳定性。目前,该代码库仅支持英伟达Hopper架构运算,但这一限制并未影响其成为FP8通用矩阵乘法领域的佼佼者。
[ 新闻来源:龙灵,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!

龙灵
开创IC领域,共创美好未来!
查看更多
相关文章
DeepSeek宣布开源周计划:将开放五大程序码库
2025-02-24
DeepSeek开源模型网安风险引争议
2025-02-17
欧洲Mistral CEO:DeepSeek将推动开源生态发展
2025-02-18
DeepSeek开源引发AI产业震荡,ASML等乐观以待
2025-02-01
DeepSeek开源模型风靡全球,开发者反响热烈
2025-02-28
热门搜索
现代汽车韩国新建氢燃料电池系统工厂
陈立武出任英特尔CEO
华为
台积电
中芯国际
联发科
高通
英特尔
芯片