DeepSeek发布新LLM，思维链能力引关注-icspec

DeepSeek发布新LLM，思维链能力引关注

来源:ictimes 发布时间:10 小时前

分享至微信

DeepSeek，对冲基金公司幻方量化的人工智能子公司，最新发布的大型语言模型R1-Lite-Preview，在逻辑推论、数学推理和实时问题解决方面表现突出。据称，该模型在多个标竿测试中的表现与OpenAI的o1-preview不相上下。

R1-Lite-Preview的亮点在于其“思维链”推理能力，能够向用户展示回应查询和输入所依赖的思维过程，并解释其作为及动机。

这种透明推理过程使得模型在复杂数学和逻辑事件上表现游刃有余，甚至在GPQA和Codeforces等推理标竿测试中获得了可与顶级模型媲美的分数。

尽管DeepSeek尚未发布完整程序码或开放独立第三方分析，但R1-Lite-Preview的透明推理过程为AI系统带来了当责与信任元素，这是许多专利AI系统所欠缺的。

目前，用户可通过DeepSeek Chat使用R1模型，而DeepSeek也计划在未来释出R1系列模型的开放源码版本及相关API。然而，值得注意的是，DeepSeek-R1似乎会屏蔽过于政治敏感的查询。

[ 新闻来源：ictimes，更多精彩资讯请下载icspec App。如对本稿件有异议，请联系微信客服specltkj]

全部评论

暂无评论哦，快来评论一下吧！

ictimes

聚焦于半导体行业芯闻

2024-11-01

一周前

2024-10-29

5 天前

2024-10-06

热门搜索