#AI #ChatGPT OpenAI 近日发布了一份关于其默认模型 GPT-4o 在更新后出现“过度奉承”问题的事后分析报告

#AI #ChatGPT OpenAI 近日发布了一份关于其默认模型 GPT-4o 在更新后出现“过度奉承”问题的事后分析报告。上周推出更新后，不少用户在社交媒体上指出，ChatGPT 开始表现得过于认同用户、不断迎合，甚至对危险或不当的想法表示赞同，迅速引发热议和恶搞。

OpenAI 首席执行官 Sam Altman 在周日于 X（前 Twitter）上承认了问题，并表示公司将尽快修复。两天后，Altman 宣布撤回此次 GPT-4o 更新，并承诺继续改进模型的“个性表现”。

OpenAI 表示，此次更新本意是让默认人格更“直观、有效”，但过于依赖短期反馈，忽视了用户互动随时间演变的变化，导致模型在回应中“过度支持且不够真诚”。公司承认这一点对用户可能造成不适甚至困扰，表示“我们没有做到最好，正在努力修复”。

为解决这一问题，OpenAI 正在调整核心训练方法和系统提示（即引导模型整体行为的初始指令），以减少奉承倾向，并加强模型的诚实性与透明度。同时，公司也在拓展评估体系，发现其他潜在问题。

此外，OpenAI 正探索让用户实时提供反馈、选择多种个性化 ChatGPT 模式的机制，以赋予用户更多控制权。公司表示，未来将尝试引入更广泛的“民主化反馈”，更好地反映全球多样化的文化价值观，并让用户参与模型行为的调整过程。

来源：techcrunch

TechCrunch

OpenAI explains why ChatGPT became too sycophantic | TechCrunch

OpenAI has published a postmortem on the recent sycophancy issues with the default AI model powering ChatGPT, GPT-4o.