DeepSeek发布新LLM,思维链能力引关注
来源:ictimes 发布时间:10 小时前 分享至微信

DeepSeek,对冲基金公司幻方量化的人工智能子公司,最新发布的大型语言模型R1-Lite-Preview,在逻辑推论、数学推理和实时问题解决方面表现突出。据称,该模型在多个标竿测试中的表现与OpenAI的o1-preview不相上下。


R1-Lite-Preview的亮点在于其“思维链”推理能力,能够向用户展示回应查询和输入所依赖的思维过程,并解释其作为及动机。


这种透明推理过程使得模型在复杂数学和逻辑事件上表现游刃有余,甚至在GPQA和Codeforces等推理标竿测试中获得了可与顶级模型媲美的分数。


尽管DeepSeek尚未发布完整程序码或开放独立第三方分析,但R1-Lite-Preview的透明推理过程为AI系统带来了当责与信任元素,这是许多专利AI系统所欠缺的。


目前,用户可通过DeepSeek Chat使用R1模型,而DeepSeek也计划在未来释出R1系列模型的开放源码版本及相关API。然而,值得注意的是,DeepSeek-R1似乎会屏蔽过于政治敏感的查询。

[ 新闻来源:ictimes,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!