DeepSeek发布强大开源模型DeepSeek-V3-icspec

DeepSeek发布强大开源模型DeepSeek-V3

来源:林慧宇发布时间:2024-12-30

分享至微信

中国AI企业DeepSeek发布新一代开源模型DeepSeek-V3，拥有671B参数，主打长文本、程序码、数学题目及中文处理。DeepSeek-V3评测表现超越多个知名开源模型，且生成速度较V2.5快3倍。

TechCrunch称DeepSeek-V3为目前最强大的开源模型之一，其预训练数据达14.8T词元。不过，AI模型需好硬件支撑，未优化前可能性能过剩。

DeepSeek-V3提供API服务，优惠期价格极低，原价也远低于市场水平，引发AI模型价格战。DeepSeek由幻方量化支持，储备有NVIDIA A100，是中国少数具备此条件的企业。

DeepSeek创始人梁文峰表示，DeepSeek-V2开发者均来自中国顶尖大学，无海归人才。DeepSeek的低价策略让字节跳动、阿里巴巴等企业跟进，成为中国AI模型价格战的源头。

[ 新闻来源：林慧宇，更多精彩资讯请下载icspec App。如对本稿件有异议，请联系微信客服specltkj]

全部评论

暂无评论哦，快来评论一下吧！

林慧宇

开创IC领域，共创美好未来!

10 小时前

2024-12-30

2024-11-26

2024-12-18

2024-11-21

热门搜索