OpenAI于12月11日发布了ChatGPT-5.2,并称其为首个在表现上达到或超过人类专家水平的版本。然而,这一说法在一项基础测试中受到质疑。

当地时间12月18日,据外媒Futurism报道,在为小学生生成按英文字母顺序排列的动物挂图测试中,ChatGPT-5.2漏洞百出。这一问题最早由BCA Research首席全球策略师彼得贝雷津发现。他在11月测试ChatGPT-5.1时,模型生成的内容只包含25个字母,遗漏了“Z”。
在测试ChatGPT-5.2时,问题依然存在。模型生成的字母表只覆盖了24个字母,遗漏了“U”和“Z”,并在“T”之后直接跳到“Y”,对应“Yak”。生成的字母表最终以“X”结束,对应“X-ray fish”,但插图却是一只斑马。
此外,插图本身也存在明显异常,如肢体结构怪异的袋鼠、长着两条尾巴的鬣蜥、五官混乱的独角鲸,以及带有猫脸特征的刺猬。在后续提示中,情况并未改善。模型生成了25个字母,“Y”再次取代了“U”,并被解释为“Unicorn”。结尾处出现两个“X”,一个对应“fish”,另一个对应“X-ray fish”,却仍旧使用了一张斑马插图。
更令人困惑的是,模型还将提示语本身混入生成内容,“A is for alligator,B is for bear…”直接出现在海报标题中。