> 自媒体 > (AI)人工智能 > DeepSeek V3.2的隐藏更新,却意外暴露了MiniMax
DeepSeek V3.2的隐藏更新,却意外暴露了MiniMax
来源:夕小瑶科技说
2025-12-05 08:27:15
210
管理

就在本周,DeepSeek V3.2 正式上线。当天我写了一篇分析,提到了这次技术上可能被忽视的突破:

一个是 DSA 稀疏注意力,另一个是思考模式的工具调用的突破。

显然评论区的小伙伴对第二个讨论更激烈。

模型先进行初步推理(Thinking 1.1),然后发起第一次工具调用(Tool call 1.1),拿到返回结果(Tool result 1.1)之后,继续往下思考(Thinking 1.2),并再次调用工具(Tool call 1.2)……

等等,我总觉得这个路径好像在哪见过。。

我翻了一下资料,原来两周前在 AIE 大会上,MiniMax 也重点讲了这个。

他们的叫法是——Interleaved Thinking(交错思维链)。

甚至这俩的图都好像。。。这可就有意思了。

两大国产之光,同时盯上了同一项新技术——Interleaved Thinking。

Interleaved thinking 是什么?

简单说,它让模型学会“边想边干”。

过去,大多数模型的工作方式很“直男”:接到任务,想一遍,立刻去做。做完就交差,中间不再思考。

你可能觉得够用了,但其实这种方式有很多隐藏的毛病。比如工具查回来的结果模型理解错了,但它已经开始输出了。或者它原本想好了三步计划,查完工具结果后一拍脑袋直接跳到第四步,前后不连贯。

更常见的,是它根本没能基于新信息重新组织思路,只是机械地堆出一段回应。

这,就是旧式 AI 推理的通病——逻辑中断。

而 Interleaved Thinking 的出现,就是为了解决这个问题。

它允许模型在每次工具调用之后立刻再进行一次思考,评估新信息是否推翻了旧计划,是否需要重新规划下一步。也就是说 Interleaved Thinking 让模型像人一样,一边干活一边思考、实时修正。

你可以看这张图:

具体来说,M2 会在每一次工具调用前后都进行明确的推理步骤,而这些推理的内容不会丢失,而是被结构化保存在一个字段里,并自动带入下一轮。

这样的设计直接改变了以前常见的问题:模型查完工具结果后,不再能“续上”之前的思路,导致逻辑断裂、计划跳步、甚至重复犯错。

而在 M2 里,推理过程被完整保留下来,模型可以随时回看、更新和修正自己的判断,使得长流程任务的执行更加稳定、连贯。

这种设计,彻底打破了“每次调用都是一次重启”的传统范式,把推理链条首次变成了系统级结构。

从 MiniMax 的实测结果看,这种“是否保留思维链”的差异,可不只是略有影响,而是直接决定了模型能不能用、稳不稳定:

在长流程逻辑任务 Tau² 中,开启 Interleaved Thinking 后,成功率从 64% 飙升至 87%,提升 35.9%在依赖网页信息处理与工具结合的 BrowseComp 任务中,提升 40.1%在多轮计划和状态传递要求较高的 GAIA、xBench 上,稳定提升分别为 11.5% 和 9.1%哪怕在相对静态的代码修复任务 SWE‑Bench Verified 上,也有 3.3% 的增长

这些任务覆盖了当前主流 Agent 应用的几乎所有核心方向:信息查找、多轮执行、工具控制、错误修复、推理链验证。一个共通点是:只要任务链长、工具多、状态复杂,Interleaved Thinking 就是硬门槛。

图示中你可以直观看到这个结构差异:

普通模型(左图)只在第一轮思考,后续工具调用中推理内容断档,状态丢失;未正确实现回传机制的模型(中图)哪怕模型能生成推理块,也无法从接口层传入下一轮,依然断链;而 M2 所构建的(右图),是从 API 到模型都支持完整链路的结构:思考-行动-回传-再思考,每一段状态都保留并持续演进。

这一步,看似只是多了一条回传路径,实则改变了模型的工作逻辑。

它让模型第一次具备了真正的连续意识。

MiniMax 怎么让它成为行业共识?

当 MiniMax 发布 M2 时,社区对 Interleaved Thinking 的支持几乎为零。

OpenAI 的 Chat API 不支持 reasoning 回传,Anthropic 的格式虽然有,但生态没人用。

MiniMax 团队为此干了三件关键的事:

开源 Mini-Agent,作为开发者实践标准参考实现(700 Star);这是第一个完全实现 Interleaved Thinking 的开源 Agent 框架。它用最小代码展示了完整的“思考-行动-反思”循环,让开发者一目了然。推动生态联动与 Kilo Code、Cline、RooCode、OpenRouter、Ollama 等平台联合,提交多项 PR,让这些第三方平台原生支持 Interleaved Thinking Native Tool Call,并通过跨平台实测确保一致性。建立标准语义与测试机制在 API 层面定义了 reasoning_details、thinking_block 等字段格式。并以内部 Benchmark 验证不同实现的正确性,为行业提供了“可复现的标准”。

这一套动作下来,Interleaved Thinking 从一个理念变成了工程标准。

这套机制的意义,不止在技术层面。

就在本周的 AWS re:Invent 2025 大会上,MiniMax M2 被正式纳入 Amazon Bedrock 模型库,与 Google Gemma、NVIDIA Nemotron 等模型一同登场,成为登陆 AWS Bedrock 的中国模型之一(CEO直接开麦点名,排面拉满)。

在 MiniMax 的评论区,我看到这样一条留言:

那一刻,我突然有点出神。

这个概念,最早是西方团队提出来的,但真正把它跑通、落地、做成体系的,却是中国的团队。

有点魔幻,也有点象征意味。

算力让 AI 更快,思维链让 AI 更稳。

而这一刻,国产 AI 已经率先想明白了。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
三菱退出中国?官方回应:将与现有伙伴继续合作
6月23日,有媒体报道称,三菱汽车将逐步取消包括欧洲、中国在内的市场业..
2026款三菱帕杰罗曝光,第二代超选四驱+2.4T/2.0T双动力..
硬派越野圈的“老将”居然换小排量了?2026款三菱帕杰罗刚露出消息,就把..
恩智浦计划退出5G功率放大器业务;三星或将退出SATA SSD市场;三菱化学出售..
五分钟了解产业大事每日头条芯闻 恩智浦计划退出5G功率放大器业务我国首..
实拍三菱全新欧蓝德!搭1.5T四缸,内饰配大屏,不比奇骏香?..
在重庆车展上,全新一代三菱欧蓝德终于在国内亮相了,相比其国外的发布时..
试驾广汽三菱奕歌:小巧灵动
■ 阅车试驾车型:广汽三菱奕歌长/宽/高(mm):4405/1805/1685轴距(mm..
新车 | 四驱越野MPV/配侧滑门/2.2T柴油机,新款三菱Delica D:5亮相..
文:懂车帝原创 高帅鹏[懂车帝原创 产品] 日前,2025东京车展开幕,新款..
三菱集团的传奇发家史
“三菱”两个字,在日本就像一把瑞士军刀:银行、飞机、汽车、火箭、寿司..
2026款三菱Montero曝光,S-AWC四驱+差速锁全配,普拉多见了..
当 “普拉多见了都得慌” 的话题在越野圈炸锅,2026 款三菱 Montero 的曝..
日韩巨擘数据,三星2.1万亿三菱21万亿,中国第一谁?..
图片来源于网络2025年,让人火大的资本较量又来一波。韩国三星手里握着2...
关于作者
国务院环卫工..(普通会员)
文章
1711
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索