DeepSeek发布强大开源模型DeepSeek-V3
来源:林慧宇 发布时间:2024-12-30 分享至微信

中国AI企业DeepSeek发布新一代开源模型DeepSeek-V3,拥有671B参数,主打长文本、程序码、数学题目及中文处理。DeepSeek-V3评测表现超越多个知名开源模型,且生成速度较V2.5快3倍。


TechCrunch称DeepSeek-V3为目前最强大的开源模型之一,其预训练数据达14.8T词元。不过,AI模型需好硬件支撑,未优化前可能性能过剩。


DeepSeek-V3提供API服务,优惠期价格极低,原价也远低于市场水平,引发AI模型价格战。DeepSeek由幻方量化支持,储备有NVIDIA A100,是中国少数具备此条件的企业。


DeepSeek创始人梁文峰表示,DeepSeek-V2开发者均来自中国顶尖大学,无海归人才。DeepSeek的低价策略让字节跳动、阿里巴巴等企业跟进,成为中国AI模型价格战的源头。


[ 新闻来源:林慧宇,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!