苹果发布DCLM小模型,性能卓越且开源
来源:ictimes 发布时间:2024-07-25 分享至微信
苹果继OpenELM后,再推DCLM小模型,性能直逼Gemma、Llama 3等业界巨头,同时运算资源更为节省。
DCLM全称为“DataComp for Language Models”,提供1.4B和7B两种版本,已在Hugging Face平台上线。该模型由苹果与多所大学及丰田研究院合作开发,以大数据为基础,采用先进预训练方法。
DCLM 7B在MMLU测试中表现优异,超越Mistral 7B,与Llama 3 8B等顶尖模型比肩,且资源消耗减少40%。而DCLM 1.4B则在同类小型模型中脱颖而出,展现了卓越的性能。
苹果强调DCLM模型“真正开源”,公开训练数据、模型权重及代码,促进AI领域的发展。DCLM作为早期研究项目,虽不直接应用于产品,但为苹果AI技术探索树立了新标杆。
此外,苹果与OpenAI合作的小模型GPT-4o mini也即将亮相iOS 18,通过Apple Intelligence系统为用户提供服务,进一步展现苹果在AI领域的雄心与实力。
[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!
ictimes
聚焦于半导体行业芯闻
查看更多
相关文章
Meta震撼发布Llama 3.1:顶尖开源AI模型引领新纪元
2024-07-25
谷歌Gemma 2 2B小模型:SLM技术引领开源“逆袭”新时代
2024-08-07
摩尔线程正式开源音频,理解大模型MooER
2024-08-28
Meta开源模型热潮背后:盈利迷局与风险隐忧
2024-09-05
热门搜索