刚刚,DeepSeek 开源了最新的数学推理模型
最近国外 Gemini、Claude 神仙打架,小鲸鱼又活过来了。
这不仅仅是一次普通的模型迭代,根据在国际数学奥林匹克和普特南数学竞赛上的表现来看,这可能是 开源模型在数学推理领域的一个里程碑时刻。
数学推理新王登基了。
IMO 2025 金牌水平 。
01 项目简介

IMO 2025(国际数学奥林匹克):金牌水平
而且 超越 DeepThink 不是一个点,而是 10 个点。 紧跟在它们后面的是 GPT-5、Grok4 等模型。
Putnam 2024(普特南数学竞赛):118/120 分
02 为什么提升这么多?
① 核心架构
V3.2-Exp-Base

② 验证者-生成器双核驱动

Generator(生成器) : 负责提出解题思路和证明步骤。
Verifier(验证者): 像人类数学家一样,一步步审查推理过程的严谨性。
③ Test-Time Compute Scaling
03
这个模型
04
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237