超微进军AI软件,推出小型语言模型AMD-135M
来源:ictimes 发布时间:5 小时前 分享至微信
超微(AMD)在AI领域展现新雄心,除新硬件外,积极布局软件市场,挑战NVIDIA主导地位。
近日,超微发布首个小型语言模型AMD-135M,专为私人企业设计,隶属于Llama系列。该模型或与超微近期收购的Silo AI有关,旨在满足特定客户需求,利用超微硬件进行推论。
AMD-135M采用推测解码技术,通过草稿模型生成多个候选词元,再传递给更大、更准确的目标模型验证。推出两个版本:AMD-Llama-135M和AMD-Llama-135M-code,分别优化特定任务,加速推论效能。
前者从零开始训练,耗时6天,使用6,700亿个通用数据词元;后者则额外微调200亿个编码词元,耗时4天。超微认为,两模型经进一步优化后,效能将持续提升。
[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!
ictimes
聚焦于半导体行业芯闻
查看更多
相关文章
AI界掀起“瘦身”革命,小型模型成新宠
2024-08-21
Magic AI新创融资超预期,领跑商用模型规模
2024-09-03
英伟达拟收购软件初创公司OctoAI,加强AI模型部署能力
2024-09-18
超微引领AI超级周期,加速市场布局
2024-09-12
通富微电携手AMD,领跑AI封装新纪元
2024-08-28
热门搜索