当前位置:首页 > Deepseek最新资讯 > 正文内容

热议!DeepSeek V3.1惊现神秘「极」字 Bug,模型故障了?

8个月前 (08-26)Deepseek最新资讯489

  上周三,DeepSeek 开源了新的基础模型,但不是万众期待的 V4,而是 V3.1-Base,而更早时候,DeepSeek-V3.1 就已经上线了其网页、App 端和小程序。

  经过这差不多一周时间的真实用户测试,DeepSeek-V3.1 却被发现存在一个相当让人无语的问题:其某些输出 token 会被随机替换为「极」。

  具体来说,据知乎用户 Fun10165 描述,她在调用火山引擎版 DeepSeek V3.1 帮助整理一份物理试卷时发现,该模型的输出中会莫名出现一些「极」字。

  有意思的是,她还尝试了调用官方 API 修复这个问题。结果,在修复的过程中又出现了这个问题。

  她表示:「实测deepseek,官方网页 / API 能复现,概率不高,但多试几次就能出来。VolcEngine API 复现概率非常高。」

  比如知乎用户「去码头整点薯条」分享说 R1 也存在类似的问题,他还简单猜想了原因:「使用 R1 0528 的时候就遇到了很多次,我观察到的现象更离谱,会在代码里面插入 “极客园”,而且遇到不止一次,怀疑是不是学习的时候吃进去了什么电子水印吃坏肚子了。」

  知乎用户「琪洛」则发现 V3-0324 也存在类似问题,只不过这一次输出的是「极速赛车开奖直播」字符串。

  她猜想道:「怀疑可能数据没洗干净,即便重新训了 base 这个问题还是留下了,题主和其他回答所述「极」和「极速」可能就是这个词的残余痕迹。」

  发帖者用户 u/notdba 表示,在测试 DeepSeek V3.1 时,他发现模型会莫名地在某些意料之外的位置输出如下 token:

  他继续描述到,除了这 3 种「极」 token 在贪婪解码中成为首选的情况之外,这些「极」 token 也经常在其他意想不到的地方潜伏为第二或第三选择。

  他的猜测是该问题可能会被 MTP(多 token 预测)掩盖,并且当推理堆栈不支持 MTP 时就会变得更加明显,比如 llama.cpp 就还不支持 MTP。这个猜想的合理之处在于支持 MTP 的 DeepSeek 官方 API 更不容易遇到这种情况,而第三方部署的同款模型则更容易出现这个问题。

  他给出的可能解释是:「极」的 token 是 2577,而省略号「...」的 token 是 2576。这两者可能被模型混淆了。

  还不只是「极」,也有用户发现 DeepSeek-V3.1 还存在多语言混用的问题,u/Kitano_o 分享说:「我使用 3.1 从中文翻译成俄语时,遇到一些奇怪的行为。它开始混合多种语言 —— 添加英文词,也留下些中文词。有时这些问题会占到文本的 5%,有时只占 1%,甚至 0%。而且使用 OpenRouter 的不同提供商都会出现这个问题,即使我使用 DeepSeek 作为提供商也会。」

  总体而言,对于 DeepSeek-V3.1 这个可以说相当严重的问题的原因,网友给出的猜测更多还是「数据污染」。

  比如阶跃星辰黄哲威表示:「我认为是本身 sft 数据合成甚至是构造预训练数据的时候没洗干净引入了 “极长的数组” 这种怪东西(从 R1 的行为看,似乎大量使用了 RAG 方法来造难题的解答),然后 RL 的时候模型直接把这个字当某种终止符或者语言切换标记使用了。」

  他还提到:「其实推理出 bug,大概率都是数据问题,很多人都知道。只是 R1 的其它 bug 没有这么高频发生,社区不太关注而已。」

  这次事件也给所有模型开发者敲响了警钟:在追求更高性能的 AI 模型时,最基础的数据质量,才是决定 AI 是否会「行为异常」的关键。原文出处:热议!DeepSeek V3.1惊现神秘「极」字 Bug,模型故障了?,感谢原作者,侵权必删!

标签: deepseek

“热议!DeepSeek V3.1惊现神秘「极」字 Bug,模型故障了?” 的相关文章

寒武纪:已同步实现对DeepSeek-V3.2-Exp的适配

寒武纪:已同步实现对DeepSeek-V3.2-Exp的适配

  观点网讯:9月29日,寒武纪公众号发文表示deepseek,2025年9月29日,寒武纪已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎v...

DeepSeek预测:皇家马德里VS西班牙人!姆巴佩领衔银河战舰冲击五连胜,西班

DeepSeek预测:皇家马德里VS西班牙人!姆巴佩领衔银河战舰冲击五连胜,西班

  西甲第5轮焦点战即将打响,领头羊皇家马德里坐镇伯纳乌迎战黑马西班牙人。皇马目前4战全胜积12分领跑,而西班牙人3胜1平积10分排名第三,这场对决将直接影响榜首格局。...

DeepSeek预测:布莱顿vs热刺!海鸥军团主场狙击欧冠区狂魔,三笘薰能否撕裂

DeepSeek预测:布莱顿vs热刺!海鸥军团主场狙击欧冠区狂魔,三笘薰能否撕裂

  北京时间9月20日22:00,英超第5轮将上演布莱顿与热刺的攻防大战。主队布莱顿目前4轮积4分排名第13,距离降级区仅1分优势;客队热刺则以9分高居第3,与榜首利物浦相差3分。两队近5...

智博会首发!拓维信息联合芯鸿数智重磅发布“重庆造”AI新品服务器

智博会首发!拓维信息联合芯鸿数智重磅发布“重庆造”AI新品服务器

  9月5日-9月8日,2025世界智能产业博览会(简称:智博会)在重庆成功举行。本届智博会以“智汇八方,博采众长”为理念,聚焦“人工智能+”与“智能网联新能源汽车”主题,既是全球智能产业...

开源生态迈向“价值共创”,魔乐社区迎来第二批理事会成员

开源生态迈向“价值共创”,魔乐社区迎来第二批理事会成员

  7月26日,2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC)在上海盛大启幕。在“智算技术创新与行业实践”论坛上,重磅举行了魔乐社区Modelers理事会第二批成员单位发...

DeepSeek预测:尤文图斯VS都灵!弗拉霍维奇领衔斑马军团主场碾压公牛?

DeepSeek预测:尤文图斯VS都灵!弗拉霍维奇领衔斑马军团主场碾压公牛?

  意甲第11轮将上演都灵德比,尤文图斯(6th)与都灵(13th)在安联球场狭路相逢。斑马军团目前与欧战区同分但净胜球劣势,而公牛距离降级区仅7分优势。本赛季尤文进攻端场均1.4球(联赛...