苹果发布DCLM小模型,性能卓越且开源
来源:ictimes 发布时间:2024-07-25
分享至微信

苹果继OpenELM后,再推DCLM小模型,性能直逼Gemma、Llama 3等业界巨头,同时运算资源更为节省。
DCLM全称为“DataComp for Language Models”,提供1.4B和7B两种版本,已在Hugging Face平台上线。该模型由苹果与多所大学及丰田研究院合作开发,以大数据为基础,采用先进预训练方法。
DCLM 7B在MMLU测试中表现优异,超越Mistral 7B,与Llama 3 8B等顶尖模型比肩,且资源消耗减少40%。而DCLM 1.4B则在同类小型模型中脱颖而出,展现了卓越的性能。
苹果强调DCLM模型“真正开源”,公开训练数据、模型权重及代码,促进AI领域的发展。DCLM作为早期研究项目,虽不直接应用于产品,但为苹果AI技术探索树立了新标杆。
此外,苹果与OpenAI合作的小模型GPT-4o mini也即将亮相iOS 18,通过Apple Intelligence系统为用户提供服务,进一步展现苹果在AI领域的雄心与实力。
[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!

ictimes
聚焦于半导体行业芯闻
查看更多
相关文章
国产大模型公司MiniMax推出开源推理模型M1,性能媲美国际领先水平
2025-06-19
阿里巴巴开源32款适配苹果MLX架构的Qwen 3模型
2025-06-18
Arm平台成功适配阿里开源模型Qwen3
2025-05-11
小红书开源AI模型,助力开发者社群扩展
2025-06-10
韩国两大运营商开源韩语AI模型
4 天前
热门搜索
大联大调整!诠鼎、友尚、品佳,3合1
台积电拟退出氮化镓市场
华为
台积电
中芯国际
联发科
高通
英特尔
芯片