2025年12月1日,梁文锋的深度求索AI团队,正式发布了最新大模型版本,DeepSeekV3.2、DeepSeek-V3.2-Speciale。
该版本号称开源最强。

这次版本,主要有两个重要升级点:
①引入了稀疏注意力(DSA)机制,降低计算复杂性,保持模型性能,并针对长上下文场景进行优化。
②提升了将推理融入工具使用的能力,开发了合成管道,更新了聊天模板,强化“使用工具思考”功能
为了便于大家理解,下面针对本次两个重要升级点,进行通俗易懂的介绍:
01.稀疏注意力(DSA)机制原理是什么上文提到,这次引入的DSA机制,能够在保持模型性能基础上,降低计算复杂度。

DSA技术原理示意图
如上图技术原理,可以看到稀疏注意力(DSA)机制是采取了分步做法来降低计算复杂度。
下面使用一个简单例子,给大家做个通俗介绍。
假若让AI分析一份500页的财务报告,传统AI技术手段会从第一页开始逐一阅读分析,但稀疏注意力(DSA)机制会像专业的分析人员一样,采取有步骤、有策略的阅读分析。
专业的分析人员会怎么做呢??
第一步会先看财报的目录,通过查看财报目录,快速定位到财报中比较关注的“利润表”“资产负债表”等关键章节。这一步对应着稀疏注意力机制的“压缩注意力”环节,也就是上图中的第一步“Comperssion”。
第二步会重点翻阅核心内容,深入分析异常数据所在的页面,比如针对利润表亏损部分进行重点分析。这一步对应着稀疏注意力机制的“选择注意力”环节,也就是上图中的第二步“Selection”。
第三步会进行前后对照分析,关联查看相邻年度、季度的同类数据趋势变动。这一步对应着稀疏注意力机制的“滑动注意力”环节,也就是上图中的第二步“Sliding”。
通过这种“精准定位 局部精读”的模式,让DeepSeekV3.2处理10万字长文本时速度能够提升3倍以上,内存占用减少60%。
这就好比让AI分析一本百万字的长篇小说,想要找一下小说中关于跨海旅行的情节,传统的AI技术手段会从第一页逐字逐句翻完整本书,然后找到对应情节进行分析,这种方式很慢、很费内存。而DeepSeek V3.2的稀疏注意力(DSA)技术,却会优先翻看目录,找对类似章节,然后重点分析并关联比对,效率大大提升。
02.DeepSeek V3.2聊天模板做了哪些更新,如何强化“使用工具思考”功能使用过AI工具的人都遇到过很多AI难以准确理解用户意图,回答的结果不尽人意的情况。
比如,让AI帮忙算一下个税,很难算清楚,还必须要手动梳理税率表。
DeepSeek V3.2通过更新聊天模板,一定程度上解决了这个问题。
首先,新版聊天模板支持自动调用标准化工具接口,比如调用天气预报工具、税率计算工具、读写转换工具等,提升了回答准确度和用户满意。
其次,新版聊天模板新增了“thinking with tools”能力,也就是“使用工具思考”功能。
当你想要询问“从上海到洛杉矶的旅游,如何规划”,DeepSeekV3.2会自主进行推理计算,并调用合适的工具给出合理结果:
“用户需要旅游攻略推荐,应该先调用签证办理工具,查询签证办理步骤,然后调用航班查询API获取所有航班,再用筛选工具按价格和时间排序,最后计算单位时间成本,再查询周边酒店...”
这个过程DeepSeekV3.2会调用航班、酒店、签证等不同第三方工具,来推理出最合理的攻略,有点类似于前期Manus的功能。
以上就是DeepSeekV3.2新版本的通俗介绍,感谢大家关注与支持。
- END -
培养一颗有趣的灵魂,找寻更美好的远方
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237