中国AI新星DeepSeek推出高性价比推理模型R1
来源:万德丰 发布时间:6 小时前 分享至微信
中国AI公司DeepSeek推出大型语言模型DeepSeek-R1,效能与OpenAI的o1相当,但价格更便宜90%。
DeepSeek-R1拥有660B参数,结合强化学习和监督式微调技术,能处理复杂任务。在数学测试中,DeepSeek-R1表现优异,与o1不相上下。在程序码解题平台Codeforce上,其准确率也接近o1。
DeepSeek-R1的性价比极高,输入每百万个token仅需人民币1元(快取命中)或4元(快取未命中),输出为16元,远低于o1的价格。用户可在Hugging Face平台或DeepSeek聊天平台上体验该模型。
DeepSeek还通过DeepSeek-R1蒸馏出6个小模型,开放给开源社群使用。其中,Qwen 1.5B在数学基准测试中表现甚至优于大模型GPT-4o和Claude 3.5 Sonnet。
DeepSeek-R1具备“思维链”推理能力,能展示思考步骤,增加模型透明度和可信度。DeepSeek成立于2023年4月,专注于开发先进AI技术,其母公司为中国私募基金幻方量化。
[ 新闻来源:万德丰,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!
万德丰
开创IC领域,共创美好未来!
查看更多
相关文章
阿里云发布AI推理模型QwQ,推理能力媲美OpenAI o1
2024-12-01
OpenAI 推出全新推理模型和开发者工具
2024-12-19
Google发布推理模型Gemini 2.0 Flash Thinking
2024-12-24
OpenAI发布新款推理模型o3及o3-mini,提升AI推理能力
2024-12-24
热门搜索