超微进军AI软件,推出小型语言模型AMD-135M
来源:ictimes 发布时间:2024-10-05 分享至微信

超微(AMD)在AI领域展现新雄心,除新硬件外,积极布局软件市场,挑战NVIDIA主导地位。


近日,超微发布首个小型语言模型AMD-135M,专为私人企业设计,隶属于Llama系列。该模型或与超微近期收购的Silo AI有关,旨在满足特定客户需求,利用超微硬件进行推论。


AMD-135M采用推测解码技术,通过草稿模型生成多个候选词元,再传递给更大、更准确的目标模型验证。推出两个版本:AMD-Llama-135M和AMD-Llama-135M-code,分别优化特定任务,加速推论效能。


前者从零开始训练,耗时6天,使用6,700亿个通用数据词元;后者则额外微调200亿个编码词元,耗时4天。超微认为,两模型经进一步优化后,效能将持续提升。


[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!