中国AI新星DeepSeek推出高性价比推理模型R1-icspec

中国AI新星DeepSeek推出高性价比推理模型R1

来源:万德丰发布时间:2025-01-22

分享至微信

中国AI公司DeepSeek推出大型语言模型DeepSeek-R1，效能与OpenAI的o1相当，但价格更便宜90%。

DeepSeek-R1拥有660B参数，结合强化学习和监督式微调技术，能处理复杂任务。在数学测试中，DeepSeek-R1表现优异，与o1不相上下。在程序码解题平台Codeforce上，其准确率也接近o1。

DeepSeek-R1的性价比极高，输入每百万个token仅需人民币1元（快取命中）或4元（快取未命中），输出为16元，远低于o1的价格。用户可在Hugging Face平台或DeepSeek聊天平台上体验该模型。

DeepSeek还通过DeepSeek-R1蒸馏出6个小模型，开放给开源社群使用。其中，Qwen 1.5B在数学基准测试中表现甚至优于大模型GPT-4o和Claude 3.5 Sonnet。

DeepSeek-R1具备“思维链”推理能力，能展示思考步骤，增加模型透明度和可信度。DeepSeek成立于2023年4月，专注于开发先进AI技术，其母公司为中国私募基金幻方量化。

[ 新闻来源：万德丰，更多精彩资讯请下载icspec App。如对本稿件有异议，请联系微信客服specltkj]

全部评论

暂无评论哦，快来评论一下吧！

万德丰

开创IC领域，共创美好未来!

2025-03-08

2025-02-08

2025-03-03

2025-03-05

2025-02-11

热门搜索

现代汽车韩国新建氢燃料电池系统工厂陈立武出任英特尔CEO 华为台积电中芯国际联发科高通英特尔芯片