Deepseek V3.1 看似只是一次版本迭代,实则是迈向“通用智能”的关键一步。本文全面解析新版本的能力提升、使用场景与背后意义,帮助你理解这款国产大模型如何在技术演进中稳扎稳打,走出自己的节奏。

官方文章在开篇就给出了三点。第一点,混合推理架构。我们知道,此前Deepseek的模型,按照推理和非推理,是分为R1和V3两个模型的。这次版本,Deepseek团队就将这两个模型进行了合并,也就是一个模型同时支持思考模式与非思考模式。不过它和GPT-5的自动路由机制不同。GPT-5是模型自己根据用户的提问来判断是否要调用推理模型,而DeepseekV3.1依然是用户控制。
尽管我们都不是AI方面的技术专家。但也不难猜测,要将两个独立的AI模型合并应该不是一件简易的事。那为什么Deepseek团队要费劲合并两个模型呢?那肯定是因为“收益大于付出”嘛,这就得提到后续的第二点、第三点了。
首先是更高的思考效率。按照官方的说法,“经过思维链压缩训练后,V3.1-Think 在输出 token 数减少 20%-50% 的情况下,各项任务的平均表现与 R1-0528 持平”,“同时,V3.1 在非思考模式下的输出长度也得到了有效控制,相比于 DeepSeek-V3-0324 ,能够在输出长度明显减少的情况下保持相同的模型性能”。

思考效率的提升直接带来的收益就是API价格的下降,这对于各大开发者就是实打实的“帮家人们把价格打下来”了。我们来对比一下,Deepseek的API价格变化。

搜索智能体:
对于Deepseek V3.1的夸赞与吐槽在距离此次V3.1发布的一周多后,我利用Deepseek总结了目前网络上用户对于这次新版本的使用感受,并按“夸赞”和“吐槽”进行分类。
我们先来看看“夸赞”的内容,其实基本上与这次版本的更新内容是重叠的,因此我们也不作展开论述。
模型推理速度更快,这一点我个人也有体会,体感上有大约10%-20%的提速。Agent(智能体)能力增强,编程能力提升显著。上下文长度从64K扩展到128K,能更好地处理长文本和复杂逻辑任务。成本效益高,输入/输出token价格有所降低。接下来我们重点来看看关于这次更新的一些吐槽。使用问题:网上就有部分用户反馈使用新模型时“感觉”更容易出现幻觉,这可以说是Deepseek的一个恒久问题了。个别用户也反馈遇到过翻译时偶尔会漏词的表现。生成预期以外的内容:部分用户反映生成内容中不必要的中英文混杂现象有所增多。代码生成中曾出现随机插入“极/極/extreme”等token的离谱Bug,影响编译(关于这个问题,腾讯的CodeBuddy称已经和DeepSeek团队取得联系,确认将在最近的一个版本中进行修复)。API更替策略激进:DeepSeek选择用V3.1直接覆盖旧版API,且不提供旧版本访问途径,这直接就引起了部分B端用户的投诉。对于这一点我十分能够理解,因为调试适配一个AI模型本来就要花费不少工夫,而且有不少调试可能就是针对模型的某个版本定制的。直接覆盖旧版API,可能会让原本稳定的AI应用受到稳定性和兼容性的影响。而B端客户最怕的就是“服务的不稳定不可靠”。
说实在的,外网对DeepSeek V3.1的整体评价仍然是积极占主导,吐槽方面不算多。如果硬要再补一条,那就是“期待落空”。即传说中的R2推理模型还是没见着,用户提到像多模态能力仍然缺失,在功能全面性有所不足。这方面基本上跟我之前一次关于R2的可能更新方向是重叠的。
总结:Deepseek的“一小步”DeepSeek-V3.1的混合推理架构被视为大模型发展的一个重要方向。它标志着行业竞赛的重点正从一味追求参数规模,转向如何更精巧地整合多种能力于一体,并在性能、速度、成本之间找到最佳平衡点。
此外,模型的Agent能力也将会是后续重点发展的方向。Agent能力指向的是AI模型解决复杂问题的能力,这一点从这次Deepseek官方的宣传点“迈向Agent时代的第一步”便可得知,毕竟,得先有“Agent时代”存在,才有“迈向第一步”这么一说嘛。
还有就是对于国产芯片的支持。在AI三要素——模型、数据、算力——当中,算力是目前我们依然被卡脖子的、亟待突破的领域。而Deepseek推动“软硬结合”的做法,有助于打破卡脖子,推动我国AI产业建立从底层芯片、算法框架到上层应用的闭环体系。
我将V3.1的更新称为Deepseek的“一小步”,无论是混合推理模型、Agent能力、国产芯片软硬结合,都是面向未来却又充满未知的领域。这些探索,可能成功,亦可能失败,但我们不能也不甘于永远都在AI行业充当一个“追赶者”的角色,总需要有人去到这些领域尝试开拓。
愿Deepseek的“一小步”,能成为国产AI的“一大步”。
作者:产品经理崇生,公众号:崇生的黑板报
本文由作者原创投稿/授权发布于人人都是产品经理。未经作者许可,禁止转载
题图来自 unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237