就在 Anthropic Claude 陷入降智风波时,OpenAI 刚刚推出了 GPT-5-Codex——这是基于 GPT-5 优化后的 Codex 专用版本,专门针对「自主编程」进行了训练。
这次升级确实有些分量。
聚焦于真实的软件工程场景的 GPT-5-Codex,不仅能处理日常的编程交互,还能独立完成复杂耗时的工程项目。

它能像真正的程序员一样,连续工作超过 7 个小时,在复杂项目上不断迭代、修 bug、跑测试,最后交付一个完整可用的解决方案。
从四月份推出 CLI 版本,到五月份上线网页版,再到现在的全面升级,Codex 就是要把编程这件事彻底「自动化」。
现在无论你在终端、IDE、网页还是手机上开发,Codex 都能提供一致的编程辅助体验,而且已经整合进 ChatGPT 账号体系,本地和云端可以无缝切换。

代码重构评测更是涵盖了 Python、Go 甚至 OCaml 等语言, 比如一个来自 Gitea 的 pull request 案例,修改了 232 个文件、3541 行代码,将 ctx 变量贯穿到应用逻辑中。
代码审查功能也很实用,它会在代码库中浏览分析,运行测试验证正确性,给出的审查意见准确性不错。在 OpenAI 内部,Codex 现在会审查大部分 PR,每天能发现数百个问题,很多时候比人工审查更早发现潜在 bug。

值得一提的是, 目前 GPT-5-Codex 的系统提示词已经被网友扒出, 只有原始 GPT-5 的三分之一, 感兴趣的开发者可以研究一下。
系统提示词地址:
https://github.com/elder-plinius/CL4R1T4S/blob/main/OPENAI/Codex_Sep-15-2025.md

知名博主 Dan Shipper 在体验完 GPT-5-Codex 之后,给出的评价是:
我们在 @every 上测试了几天,结果相当震撼:
- 它会根据任务动态选择「思考」时间——难题上能长时间工作,简单问题则能即时给出答案。
- 在我们的生产代码库测试中,它可以自主运行 长达 35 分钟 ——相比之下,GPT-5 往往过于谨慎,这是一次明显的升级。
- 它支持 本地与网页开发环境的无缝切换。你可以在 VS Code 中启动一个任务,然后在去购物时把它交给 Codex Web 继续完成。
- 它配备了 代码审查智能体,会真正运行你的代码,因此能发现更多 bug。
以下是我们经过大量内部测试后的整体感受:
- 这是一次非常出色的升级,让 Codex CLI 成为了 Claude Code 的有力替代品。
- 不过,它需要合理的提示才能表现出最佳效果。比如 @kieranklaassen 最多只能让它运行 5 分钟,而 @DannyAziz97 找到了诀窍。
- 有时候它会「偷懒」——在某些任务上可能思考不足,或者如果认为任务过大就会直接拒绝。
- 我整个周末都在用 Codex CLI 为 @CoraComputer 提交一个新的 PR,体验下来发现它非常好用、易于引导——这是一个很棒的模型。

OpenAI Codex 产品负责人 Alexander Embiricos 表示,性能的大幅提升主要归功于 GPT-5-Codex 动态的「思考能力」。
Embiricos 解释说,GPT-5-Codex 的工作方式类似,但它内部没有路由器,而是能实时调整在某项任务上投入的时间。
Embiricos 指出,这比路由机制更具优势:后者在一开始就必须决定要为某个问题分配多少算力和时间,而 GPT-5-Codex 则可以在处理任务 5 分钟后决定「还需要再多花一个小时」。
最近几个月,几乎所有 AI 大厂的重磅更新都指向同一个方向——编程能力。相比之下,如果你仔细观察就会发现,针对普通用户的「优化」其实是在不断减少。
表面上看,这可能是因为面向普通消费者的 AI 产品已经陷入瓶颈期。聊天、写文案、做翻译,这些功能已经比较成熟,很难再有突破性进展。
但更深层的原因,还是绕不开商业逻辑。
开发先进的 AI 模型本就需要天文数字的巨额投入,这些成本总要有人承担。与其指望海量低付费用户慢慢回血,不如直接锁定那些真正愿意掏钱的高价值客户。而程序员是最愿意为 AI 工具付费、且粘性较高的群体之一。

新模型上线不久后, OpenAI CEO 山姆・奥特曼兴奋地透露,GPT-5-Codex 已经占据了 Codex 总流量的近四成,他判断在今天之内,这个比例就会反超,成为平台的主要来源。
从这个角度来说,放弃技术平权的营销叙事,AI 的未来可能比我们想象的更加「精英化」。这不一定是坏事,但至少我们应该对此有清醒的认识。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237