中国AI新星DeepSeek推出高性价比推理模型R1
来源:万德丰 发布时间:2025-01-22
分享至微信

中国AI公司DeepSeek推出大型语言模型DeepSeek-R1,效能与OpenAI的o1相当,但价格更便宜90%。
DeepSeek-R1拥有660B参数,结合强化学习和监督式微调技术,能处理复杂任务。在数学测试中,DeepSeek-R1表现优异,与o1不相上下。在程序码解题平台Codeforce上,其准确率也接近o1。
DeepSeek-R1的性价比极高,输入每百万个token仅需人民币1元(快取命中)或4元(快取未命中),输出为16元,远低于o1的价格。用户可在Hugging Face平台或DeepSeek聊天平台上体验该模型。
DeepSeek还通过DeepSeek-R1蒸馏出6个小模型,开放给开源社群使用。其中,Qwen 1.5B在数学基准测试中表现甚至优于大模型GPT-4o和Claude 3.5 Sonnet。
DeepSeek-R1具备“思维链”推理能力,能展示思考步骤,增加模型透明度和可信度。DeepSeek成立于2023年4月,专注于开发先进AI技术,其母公司为中国私募基金幻方量化。
[ 新闻来源:万德丰,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!

万德丰
开创IC领域,共创美好未来!
查看更多
相关文章
阿里云开源QwQ-32B推理模型,性能比肩DeepSeek-R1
2025-03-08
高通CEO:DeepSeek R1模型对高通有利
2025-02-08
Anthropic推出混合推理模型,可自行启动推理能力
2025-03-03
亚马逊开发推理模型Nova
2025-03-05
比亚迪与Deepseek R1大模型合作,智驾技术全面升级
2025-02-11
热门搜索
现代汽车韩国新建氢燃料电池系统工厂
陈立武出任英特尔CEO
华为
台积电
中芯国际
联发科
高通
英特尔
芯片