ChatPGT 被哥布林入侵,Codex 被迫立下「永遠不准提 Goblin」禁令

OpenAI 在 Codex CLI 的系统提示詞中明文禁止模型提及哥布林与巨魔等生物,起因是 GPT-5.5 在 OpenClaw 代理框架下出现人格漂移,把程式错誤稱为「goblins」,引发一连串迷因討論。
(前情提要:OpenAI新推工程師代理人Codex!AI可寫功能、修Bug、跑測試…限3種使用者搶先用)
(背景補充:OpenAI Codex 重大升級:后臺操控 Mac、內建瀏覽器、影像生成,上線 111 个新外掛)

本文目錄

Toggle

  • 从 GitHub 倉庫曝光的一行規則
  • 代理框架让模型的个性开始漂移
  • 明文禁令背后,是对齐问題的现实

OpenAI 的工程師在 Codex CLI 的系统提示詞中,逐字寫下了一條規則:「永远不要提及哥布林、妖精、浣熊、巨魔、食人魔、鴿子或其他动物与生物,除非与使用者的问題絕对且明確相关。」

这條規則不是玩笑,而是正式上線的生产環境指令。它被嵌入 Codex CLI 的 GitHub 倉庫,面向所有使用 Codex 生成程式碼的开发者。

问題在於:为什麼 OpenAI 需要告訴自家最新的模型,不要在寫程式时突然聊起哥布林?

从 GitHub 倉庫曝光的一行規則

事情的起点是研究者 @arb8020 在 X 发文指出,Codex CLI 的系统提示詞中,这條禁止令不只出现一次,而是重複數次,貼文迅速在开发者社群擴散。

多名用戶回应,@TaraViswanathan 在 X 回应「我就在想为什麼我的 claw 最近突然變成了一个拿著 Codex 5.5 的哥布林」@LeoMozoloa 也回应「它真的停不下来,一直把程式错誤叫做 gremlins 和 goblins,超好笑。」

!!! I was wondering why my claw suddenly became a goblin with codex 5.5 😭💀😂 pic.twitter.com/AACWtNcgQl

— Tara Viswanathan (@TaraViswanathan) April 28, 2026

該事件也迅速演變为迷因,出现了 AI 生成的资料中心妖精圖片,以及让 Codex 进入「妖精模式」的第三方外掛。

OpenAI Codex 團队成員 Nik Pash 在 X 的回覆中確认,这條禁令的设立「確实有这方面的原因」。CEO Sam Altman 也加入梗文,在 X 发文截圖一條 ChatGPT 提示詞,上面寫著:「开始訓練 GPT-6 吧,整个集群都給你用。額外加派哥布林」

pic.twitter.com/PR7C3NPxqk

— Sam Altman (@sama) April 28, 2026

代理框架让模型的个性开始漂移

要理解这件事为什麼发生,需要先理解 OpenClaw 的运作方式。

OpenClaw 是一个「代理框架」,它让 AI 模型可以自动控制电腦桌面与应用程式,代替使用者執行複雜任務,例如回覆电郵、在網頁上購物。

OpenClaw 的运作机制是在模型的提示詞中疊加大量指令:长期記憶、选定的人格、当前任務说明,全部同时输入。GPT-5.5 本月稍早以強化的程式设计能力上線,但这个模型在處理 OpenClaw 的複合提示詞时,出现了一个意外副作用:它开始把程式错誤(bug)稱呼为「goblins」和「gremlins」。

这不是随机故障。AI 模型的运作原理是预測給定提示詞后最可能出现的下一个字,这種机率性质让它們有时会产生意料之外的行为。

当代理框架往提示詞裡疊入大量額外资訊,模型等於在處理一个更複雜、更充滿干擾的输入環境。OpenClaw 允許使用者为 AI 助理选擇不同的「人格」,这些人格设定进一步影響了模型的回应风格。幾種因素疊加在一起,让模型的语言習慣开始向某个意料之外的方向偏移。

明文禁令背后,是对齐问題的现实

OpenAI 的应对方式耐人尋味:不是从架構層面修正模型在代理環境下的行为漂移,而是在系统提示詞裡直接寫下「不準说哥布林」,並且重複數次。

这个解法揭露了一个现实:即使是 2026 年最先进的商业模型,行为控制在某些情境下仍然依賴明文規則的硬性壓制,而不是模型自身对语境的理解。这不是 OpenAI 獨有的问題,而是整个代理 AI 产业目前面臨的共同挑戰:当模型被套上複雜的代理框架,行为对齐的难度以非線性的方式上升。

Altman 以迷因梗回应了整件事,幽默是真实的,但问題不会因为一个迷因而消失。当 AI 代理框架成为主流的产品形態,提示詞裡的明文禁令能走多远,將是这个产业下一階段必須正視的技術債。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论