国内万卡互联,应对AI算力挑战
来源:ictimes 发布时间:2024-10-06 分享至微信

2024年国内算力大会聚焦本土AI算力挑战,专家提出“算力互联成网”为重点解决方案。面对AI大模型时代算力需求,云端业者需解决算力资源短缺和高效利用两大问题。


由于本土GPU单卡性能有限,万卡GPU不等于万卡集群。中媒经济观察报指出,国内电信营运商正开发技术,将上万张GPU加速卡和上千台服务器互连,确保稳定运行。


百度等厂商已积累“万卡集群”AI基础设施经验,推出多芯混合训练的AI集群。百度百舸AI异构运算平台最新版本4.0,构建GPU和多类型AI芯片组成的单一智算集群,兼容国内外主流AI芯片,性能损失控制在较低水平。


一云多芯成为算力集群主流选择,可遮罩硬件差异,利用弹性供应链体系,摆脱单一芯片依赖,灵活调配算力资源。百度百舸4.0在万卡规模AI任务上的有效训练时长占比达99.5%,实现昂贵运算资源最大化利用。


未来需更充分释放万卡集群算力潜能,确保训练阶段稳定性和效率,以应对AI算力挑战。


[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!