DeepSeek 今天把两款新模型推上了正式版:一个是 DeepSeek V3.2,另一个叫 V3.2-Speciale。官网、手机 App 和对外 API 都已经把正式版切到 V3.2;Speciale 暂时只开放成了临时 API,给社区和研究人员用来评估。消息是 DeepSeek 官微放出来的。
先说发布形式。官方把 V3.2 当作稳定版在自家页面和客户端上线了,接口也切到这个版本,外部开发者通过常规 API 能拿到正式版功能。Speciale 没放到网页端或 App,上线方式是临时 API 服务,官方的说法是为了社区评测和科研用途开放,意味着还不算面向大众的长期服务。
说说功能亮点。官方介绍里把 V3.2 描述为把“思考”过程跟工具调用合在一起的尝试。通俗点讲,这个版本在调用外部工具(比如搜索、计算器、插件之类)的同时,会把内部的推理步骤当成一部分流程来运行。更重要的是,它支持两种调用方式:一种是在“思考模式”下先内部推演、再决定如何使用工具;另一种是直接调用工具、按结果组织回答。官方强调两种模式都能用。
要把这套流程想清楚,可以用一个简单的场景来说明。假设用户问一个需要多步求证的问题,模型在思考模式下会先把解决思路在内部梳理清楚,判断要不要去查阅网页、用计算器核算或调用专门插件,然后按步骤调用这些工具、把返回结果整合,最后给出答案。非思考模式则更像直接把用户的问题包给某个工具,让工具去跑一遍再拿回结果,不会在内部做复杂的推理路径选择。官方没有把内部实现细节全盘公开,但这种“边想边用”与“直接用工具”并存的设计,明显是为了应对不同场景的需求。
再回到 Speciale。把这个版本以临时 API 的形式放出来,目的是让研究者和社区用户试用、跑评测,把实际表现和边界情况暴露出来。换句话说,Speciale 更像是一个限时的试验场,而不是正式向所有终端用户推送的稳定版本。官方这样做通常有两层考虑:一是避免在大众环境下出现不可控的问题,二是通过社区反馈快速调整策略。
这次发布放在今天推的官微里,配合网页和客户端的更新,一时间用戶和开发者会有机会直接上手。对开发者来说,切换到 V3.2 意味着在 API 层面可以调用新的行为模式;对普通用户而言,App 和网页端的体验可能会变得更会“想办法”完成复杂任务。官方没有透露 Speciale 需要什么样的申请流程,只是说明是临时开放以供研究与评估。
从更大的角度看,把推理流程纳入工具调用,是当前模型演进的一个方向,目标是让模型在面对复杂任务时能更稳、更灵活。但这种设计也带来额外的工程量:需要有调用编排、结果校验、异常处理的机制,社区评测的反馈就会很关键。说白了,这回是给模型装了层更复杂的决策逻辑,能先考虑再动手,或者按需直接动手,两种模式并行。
如果想试,直接去 DeepSeek 官网或在 App 里查看当前版本,开发者可以通过官方 API 使用 V3.2;想做深度测试的研究者,可以关注 Speciale 的临时 API 开放窗口。消息和说明以 DeepSeek 官微及相关报道为准,第一财经也有对应的报道。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237