DeepSeek V3.1出现“极”字Bug,影响编码流程

互联网 0 56
互联网资讯
三言科技 互联网资讯 发布于 8月27日 09:15
本条新闻为单纯事实消息的时事新闻,转载自三言科技,版权归源站所有,如有侵权,烦请联系我们

日前,DeepSeek最新版V3.1被发现存在严重Bug,会在代码生成中随机插入“极/極/extreme”等token,导致代码无法正常编译。这一问题不仅出现在第三方量化部署中,官方全精度版本也受影响,给依赖自动化编码的团队带来极大困扰。此前DeepSeek曾出现过写作任务语言混杂、代码任务过拟合等问题,但此次“极”字Bug更为严重,直接导致系统崩溃或代理流程卡死。

开源社区用户复现了多种场景,发现即便在保守解码参数下,该问题依然无法避免。初步推测可能是解码概率分布偏移所致,模型在机械地基于概率拼凑文本,而非真正理解文本含义,导致高频token错误插入标识符中。类似稳定性问题在AI领域并非个例,Gemini也曾出现过代码场景下的“自我否定无限循环”Bug,最终被定性为安全层、对齐层、解码层交互问题。

大模型的稳定性一直是行业痛点。今年年初,OpenAI社区就曾大量反馈记忆体系异常导致用户历史上下文丢失。Gemini的人像生成功能也曾因“多样化”需求,将历史人物生成为风格不符的样貌,最终不得不临时下线。此外,模型提供商常做的“热修”也可能引发问题,如换系统提示、微调温度、更新tokenizer等,这些看似无害的调整可能打破原本的平衡,导致代理链在函数签名、JSON严格性、工具返回格式等细节处崩溃。

越来越多的Agent与工具链结合,其脆弱性也逐渐暴露。多智能体系统往往在“工具调用—状态清理—重试策略”链条中出现问题,如超时无兜底、失败后无法还原上下文等。DeepSeek和Gemini的案例提醒我们,AI从“能干活”到“能托付”,最关键的并非仅仅是模型层的SOTA,而是产品层面工程的稳定性,即那种即使犯错也能被预测和控制的“确定性”。

点赞 0 收藏(0)  分享
0个评论
  • 消灭零评论
本版公告

欢迎访问资讯板块,我们将在本版块为您带来最新最全最热的资讯,包含互联网、科技、数码、电脑、科普、体育、娱乐、国内等新闻。所有新闻都为单纯事实消息的时事新闻,转载均注明了来源,版权归源站所有,如有侵权,烦请联系我们

更多【互联网】资讯...
别用纯“互联网”逻辑理解京东做外卖 0
阿里云AI相关收入占比已超20% 0
吴泳铭:8月即时零售月活买家达3亿,带动淘宝Ap 0
爱奇艺Q2净利润承压,AI和海外市场成增长亮点 0
蒋凡:天猫超市将全面从B2C远场模式升级为近场 0
蒋凡:淘宝闪购八月周日均订单8000万,用户侧闪 0
蒋凡:阿里正针对部分城市测试和探索到店业务 0
被遗忘的社区团购 0
部分商家“恶意营销”引发消费纠纷,支付宝:对 0
从“三国杀”到“全品类即时零售争夺战” 即时 0