#AI #ChatGPT OpenAI 近日发布了一份关于其默认模型 GPT-4o 在更新后出现“过度奉承”问题的事后分析报告。上周推出更新后,不少用户在社交媒体上指出,ChatGPT 开始表现得过于认同用户、不断迎合,甚至对危险或不当的想法表示赞同,迅速引发热议和恶搞。

OpenAI 首席执行官 Sam Altman 在周日于 X(前 Twitter)上承认了问题,并表示公司将尽快修复。两天后,Altman 宣布撤回此次 GPT-4o 更新,并承诺继续改进模型的“个性表现”。

OpenAI 表示,此次更新本意是让默认人格更“直观、有效”,但过于依赖短期反馈,忽视了用户互动随时间演变的变化,导致模型在回应中“过度支持且不够真诚”。公司承认这一点对用户可能造成不适甚至困扰,表示“我们没有做到最好,正在努力修复”。

为解决这一问题,OpenAI 正在调整核心训练方法和系统提示(即引导模型整体行为的初始指令),以减少奉承倾向,并加强模型的诚实性与透明度。同时,公司也在拓展评估体系,发现其他潜在问题。

此外,OpenAI 正探索让用户实时提供反馈、选择多种个性化 ChatGPT 模式的机制,以赋予用户更多控制权。公司表示,未来将尝试引入更广泛的“民主化反馈”,更好地反映全球多样化的文化价值观,并让用户参与模型行为的调整过程。

来源:techcrunch OpenAI explains why ChatGPT became too sycophantic | TechCrunch
 
 
Back to Top