热议！DeepSeek V3.1惊现神秘「极」字 Bug，模型故障了？-脚本导航

> 自媒体 > （AI）人工智能 > 热议！DeepSeek V3.1惊现神秘「极」字 Bug，模型故障了？

热议！DeepSeek V3.1惊现神秘「极」字 Bug，模型故障了？

来源：机器之心Pro

2025-08-30 10:03:28

管理

机器之心报道

编辑：Panda

这个先进的 AI 为何会突然对一个汉字「情有独钟」？DeepSeek 最新的 V3.1 模型上线不到一周，就因一个离奇的 Bug 引发社区热议：无论任务是写代码还是整理物理试卷，模型总会莫名其妙地在文本中插入「极」字，甚至在自我修复时也无法幸免。

上周三，DeepSeek 开源了新的基础模型，但不是万众期待的 V4，而是 V3.1-Base，而更早时候，DeepSeek-V3.1 就已经上线了其网页、App 端和小程序。

经过这差不多一周时间的真实用户测试，DeepSeek-V3.1 却被发现存在一个相当让人无语的问题：其某些输出 token 会被随机替换为「极」。

具体来说，据知乎用户 Fun10165 描述，她在调用火山引擎版 DeepSeek V3.1 帮助整理一份物理试卷时发现，该模型的输出中会莫名出现一些「极」字。

图源：知乎 @Fun10165

她表示：「实测，官方网页 / API 能复现，概率不高，但多试几次就能出来。VolcEngine API 复现概率非常高。」

帖子下方，也有一些其他用户分享了类似的发现。

比如知乎用户「去码头整点薯条」分享说 R1 也存在类似的问题，他还简单猜想了原因：「使用 R1 0528 的时候就遇到了很多次，我观察到的现象更离谱，会在代码里面插入 “极客园”，而且遇到不止一次，怀疑是不是学习的时候吃进去了什么电子水印吃坏肚子了。」

知乎用户「琪洛」则发现 V3-0324 也存在类似问题，只不过这一次输出的是「极速赛车开奖直播」字符串。

图源：Reddit u/Kitano_o

总体而言，对于 DeepSeek-V3.1 这个可以说相当严重的问题的原因，网友给出的猜测更多还是「数据污染」。

比如阶跃星辰黄哲威表示：「我认为是本身 sft 数据合成甚至是构造预训练数据的时候没洗干净引入了 “极长的数组” 这种怪东西（从 R1 的行为看，似乎大量使用了 RAG 方法来造难题的解答），然后 RL 的时候模型直接把这个字当某种终止符或者语言切换标记使用了。」

图源：知乎 @hzwer 黄哲威

他还提到：「其实推理出 bug，大概率都是数据问题，很多人都知道。只是 R1 的其它 bug 没有这么高频发生，社区不太关注而已。」

这次事件也给所有模型开发者敲响了警钟：在追求更高性能的 AI 模型时，最基础的数据质量，才是决定 AI 是否会「行为异常」的关键。

我们也把相关事件发送给了 DeepSeek 本尊，让它分析了一下可能的原因：

你遇到过这个问题吗？觉得可能的原因是什么？

赏礼

赏钱

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

没有了

软银官宣！清仓英伟达套现58亿美元，转投OpenAI……

18天前