超微进军AI软件,推出小型语言模型AMD-135M
来源:ictimes 发布时间:2024-10-05 分享至微信
超微(AMD)在AI领域展现新雄心,除新硬件外,积极布局软件市场,挑战NVIDIA主导地位。
近日,超微发布首个小型语言模型AMD-135M,专为私人企业设计,隶属于Llama系列。该模型或与超微近期收购的Silo AI有关,旨在满足特定客户需求,利用超微硬件进行推论。
AMD-135M采用推测解码技术,通过草稿模型生成多个候选词元,再传递给更大、更准确的目标模型验证。推出两个版本:AMD-Llama-135M和AMD-Llama-135M-code,分别优化特定任务,加速推论效能。
前者从零开始训练,耗时6天,使用6,700亿个通用数据词元;后者则额外微调200亿个编码词元,耗时4天。超微认为,两模型经进一步优化后,效能将持续提升。
[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!
ictimes
聚焦于半导体行业芯闻
查看更多
相关文章
新爱世科技推出AI风险评估模型AlphaLoan,进军亚洲市场
2024-10-23
MiniMax趁AI大模型市场兴起,进军海外
2024-10-21
超微Turin芯片进军AI市场,服务器大厂积极响应
2024-10-25
和硕OCP峰会展出新款AI服务器,专注AI和大语言模型训练
2024-10-17
联想与Meta合作推出基于Llama大模型的AI助手AI Now
2024-10-17
热门搜索