DeepSeek推理模型预览版上线,解密o1推理过程
佚名
2024-11-27 22:00:57
0

IT之家 11 月 20 日消息,DeepSeek 宣布,全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。

官方表示,DeepSeek R1 系列模型使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 OpenAI o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程。

DeepSeek-R1-Lite 预览版模型在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等评测中,超越了 GPT-4o 等知名模型。

推理解码谜题_推理解密题目及答案_

DeepSeek-R1-Lite 的推理过程长,并且包含了大量的反思和验证。下图展示了模型在数学竞赛上的得分与测试所允许思考的长度紧密相关。

推理解密题目及答案_推理解码谜题_

▲ 红色实线展示了模型所能达到的准确率与所给定的推理长度呈正相关

IT之家注意到,DeepSeek-R1-Lite 目前仍处于迭代开发阶段,仅支持网页使用,暂不支持 API 调用。DeepSeek-R1-Lite 所使用的也是一个较小的基座模型,无法完全释放长思维链的潜力。

官方称正式版 DeepSeek-R1 模型将完全开源,并公开技术报告和部署 API 服务。

相关内容

科技顶流盛会GITEX A...
上周末,科技顶流盛会 GITEX ASIA 2025 在滨海湾金沙...
2025-04-30 23:08:01
第十六届中国国际核电工业展...
第十六届中国国际核电工业展览会正在北京举行,本届核电展共吸引了20...
2025-04-30 23:07:57
4月30日2025湖南汽车...
4月30日,2025湖南汽车展览会暨长沙市汽车促消费活动在湖南国际...
2025-04-30 22:32:12
2025第二届拉萨进口商品...
中新网拉萨4月24日电(泽塔雍措)记者24日从2025第二届拉萨进...
2025-04-30 09:30:00
4月26日拜城县2025年...
为激活房地产市场活力,推动行业平稳健康发展,4月26日,以 “美好...
2025-04-30 09:11:54
2025珠海国际海洋智能科...
中新网珠海4月24日电 (记者 邓媛雯)2025珠海国际海洋智能科...
2025-04-30 08:16:58

热门资讯

靠七天无理由退货赚了200万?... 漏洞不是随便钻的。
英国首相为“AI 校园”揭幕:... IT之家 11 月 28 日消息,据路透社报道,当地时间 27 日,英国首相基尔・斯塔默(Keir ...
刚刚,OpenAI首个智能体提... 刚刚,OpenAI首个智能体提前曝光!高级编码AI剑指400万年薪L6级工程师,编程,工程师,智能体...
96GB大容量,芝奇推出DDR... 该套装将于2025年第一季度在全球各地陆续开售。
中国改变全球创新药估值!生物技... 中国改变全球创新药估值!生物技术的“DeepSeek时刻”已来,中国,医药,制药,创新药,生物技术,...
国产雷克萨斯终于来了,但我怀疑... 国产的雷克萨斯电车,不可能再给你玩加价那一套了
谷歌Pixel 9a手机渲染图... IT之家 2 月 10 日消息,爆料人士 Evan Blass 曝光了谷歌 Pixel 9a 的渲染...
连雷军都在劝你学AI,但这课我... 连雷军都在劝你学AI,但这课我劝你别买。。。,雷军,宇宙,编程,电脑,李飞飞,人工智能
一文看懂索尼、三星、豪威的各种... 1,三大厂家名词统一首先,“双原生ISO”这个词最先在手机端出现,还得追溯至绿厂 Find X2 P...
华米 Ov 们把手机电池搞得大... 话说,今年的国产旗舰手机,有一个特质很突出 —— 电池容量大。除了少数几款标准版机型,大多新机的电池...