​苹果发布DCLM小模型,性能卓越且开源
来源:ictimes 发布时间:2024-07-25 分享至微信

苹果继OpenELM后,再推DCLM小模型,性能直逼Gemma、Llama 3等业界巨头,同时运算资源更为节省。


DCLM全称为“DataComp for Language Models”,提供1.4B和7B两种版本,已在Hugging Face平台上线。该模型由苹果与多所大学及丰田研究院合作开发,以大数据为基础,采用先进预训练方法。


DCLM 7B在MMLU测试中表现优异,超越Mistral 7B,与Llama 3 8B等顶尖模型比肩,且资源消耗减少40%。而DCLM 1.4B则在同类小型模型中脱颖而出,展现了卓越的性能。


苹果强调DCLM模型“真正开源”,公开训练数据、模型权重及代码,促进AI领域的发展。DCLM作为早期研究项目,虽不直接应用于产品,但为苹果AI技术探索树立了新标杆。


此外,苹果与OpenAI合作的小模型GPT-4o mini也即将亮相iOS 18,通过Apple Intelligence系统为用户提供服务,进一步展现苹果在AI领域的雄心与实力。


[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!