DeepSeek-V3夺开源模型第一，引发技术突破与集成之争-icspec

DeepSeek-V3夺开源模型第一，引发技术突破与集成之争

来源:陈超月发布时间:1 天前

分享至微信

2024年12月26日，深度求索（DeepSeek）发布了其最新的人工智能大模型DeepSeek-V3，并同步开源。这一模型在两年内开发完成，性能与国际顶尖AI模型相当，但成本仅为557万美元，远低于OpenAI的GPT-4的7800万美元训练成本。

DeepSeek-V3在聊天机器人竞技场（Chatbot Arena）的最新排名中位列第七，成为前十名中唯一的开源国产模型，并被评为全球前十中性价比最高的模型。

DeepSeek-V3在风格控制、复杂问题和代码领域表现出色，位列前三。业内人士指出，DeepSeek-V3是首个创新融合使用了FP8、MLA、MoE三项技术的大模型，可以视为实质性的技术突破。FP8是一种新的数值表示方式，用于深度学习的计算加速，相比传统的FP32和FP16，进一步压缩了数据位数，提升了硬件计算效率. MLA（多头潜在注意力）机制由DeepSeek团队自主提出，极大地降低了缓存使用，而MoE（混合专家）架构则通过精简有效的设计，优化了模型的性能和效率。

尽管有人质疑DeepSeek-V3只是现有优化技术的集成，但其在技术上的创新和应用前景仍然得到了广泛认可。DeepSeek-V3的性价比优势使其成为构建面向客户的AI应用程序的理想选择，尤其是在推理、数学和编程等方面表现出色.其API的输入价格为每百万Token 0.1元人民币，远低于其他模型，进一步增强了其市场竞争力。

icspec【芯片求购】https://www.icspec.com/inquiry/index/1/0

[ 新闻来源：陈超月，更多精彩资讯请下载icspec App。如对本稿件有异议，请联系微信客服specltkj]