DeepSeek发布强大开源模型DeepSeek-V3
来源:林慧宇 发布时间:2024-12-30 分享至微信
中国AI企业DeepSeek发布新一代开源模型DeepSeek-V3,拥有671B参数,主打长文本、程序码、数学题目及中文处理。DeepSeek-V3评测表现超越多个知名开源模型,且生成速度较V2.5快3倍。
TechCrunch称DeepSeek-V3为目前最强大的开源模型之一,其预训练数据达14.8T词元。不过,AI模型需好硬件支撑,未优化前可能性能过剩。
DeepSeek-V3提供API服务,优惠期价格极低,原价也远低于市场水平,引发AI模型价格战。DeepSeek由幻方量化支持,储备有NVIDIA A100,是中国少数具备此条件的企业。
DeepSeek创始人梁文峰表示,DeepSeek-V2开发者均来自中国顶尖大学,无海归人才。DeepSeek的低价策略让字节跳动、阿里巴巴等企业跟进,成为中国AI模型价格战的源头。
[ 新闻来源:林慧宇,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!
林慧宇
开创IC领域,共创美好未来!
查看更多
相关文章
DeepSeek-V3重磅发布:低成本挑战行业巨头
2024-12-30
DeepSeek发布新LLM,思维链能力引关注
2024-11-26
图森未来发布图生视频大模型“Ruyi”并开源Ruyi-Mini-7B
2024-12-18
中国开源AI模型崛起,阿里巴巴Qwen2.5-Coder媲美美国顶尖模型
2024-11-21
热门搜索