玩酷网

DeepSeek惊现极你太美BugDeepSeek极字Bug将在新版修复Deep

DeepSeek惊现极你太美BugDeepSeek极字Bug将在新版修复

DeepSeek V3.1的bug大秀“极你太美”,可谓是让全网热议了一波。

起因是,有开发者在调用DeepSeek V3.1的API时,发现模型会在输出中随机插入一个“极”字,像这样:【图1】,国外Reddit上也是讨论声一片,重灾区是“extreme”、“极”和“極”【图2】。

这个问题不仅出现在火山引擎等部署平台上,甚至DeepSeek官方API本身也出现了。

而随着更多人实测,问题愈发诡异:

- 有人在整理物理试卷时,各种“极”如潮水般涌来,如“极板”【图3】;

- 有人跑代码,突然出现“极客园”等奇怪链接【图4】;

- 腾讯CodeBuddy生成网页代码时,竟然输出了“极速赛车开奖”等广告词,乍一看还以为是腾讯内嵌广告,扒一扒发现根源竟是DeepSeek【图5】。

Reddit有网友发现Qwen3系列、GLM部分版本模型,也同样出现了“极”字异常,而且在编码任务和结构化输出中经常出现【图6】。

关于具体原因,官方尚未做出说明。不过网友的一个猜测逐渐浮出水面:

可能有一批中文训练语料,在多个模型项目中被共享或采买,这批语料中混入了特定格式的广告或带有“极”的模板,模型“照葫芦画瓢”,都学会了。

如果真是这样的话,这类“污染token”一旦被强化学习或自蒸馏机制放大,还真可能出现“看不懂就插极”的离谱现象,甚至成为模型逃避思考的标志位。

猜测归猜测,不过大家已经统一将问题的矛头指向了DeepSeek V3.1模型本身,以及CodeBuddy帮忙问了:

已经和DeepSeek团队取得联系,将在最新的版本中进行修复。

网友也提供了一些暂时规避的方法,如使用prompt补丁、设置输出过滤等,但本质仍需从模型训练链路上彻底解决。