9月16日凌晨,OpenAI 发布了新模型 GPT-5-Codex。这是基于 GPT-5 专门为软件工程优化的版本,旨在进一步提升 Codex 的 智能体编程(Agentic Coding) 能力。

你可以把它想象成一个超级 AI 程序员,能帮你写新功能、修 bug、跑测试,甚至还会主动给你提建议。
最酷的是,你可以在云端同时让好几个这样的AI 程序员一起工作,处理一大堆任务。你只要把任务丢给它,然后就可以去忙别的,过一会儿再回来收成果。
这种 异步开发的模式,真的会让你 工作效率直接起飞。
在官方博客中,OpenAI 提到 GPT-5-Codex 的训练重点是实际的软件工程工作,能根据任务的复杂性 动态调整思考时间。
在大型复杂任务上,它甚至能 独立工作超过7小时。在基准测试中,与 GPT-5 相比,GPT-5-Codex 在准确率和代码审查的高影响力评论概率方面都实现了提升。
发布后两个多小时,OpenAI CEO 萨姆·阿尔特曼就在 X 上透露,GPT-5-Codex 的流量占比已达到 Codex 总流量的 40%左右,预计 很快就会超过一半。

目前,GPT-5-Codex 可用于所有使用 Codex 的场景,并且是 云端任务和代码审查的默认工具。开发者也可以通过 Codex 命令行界面(CLI)或集成开发环境(IDE)将其用于本地任务。
为了提供更流畅的体验,OpenAI 在两周前将 Codex 整合为一个通过 ChatGPT 账户连接的单一产品,让开发者能够在本地和云端环境之间 无缝切换,而不会丢失上下文。
Codex 包含在 ChatGPT Plus、Pro、Business、教育和企业用户 的订阅套餐中。OpenAI 也计划很快通过 API 密钥向开发者提供 GPT-5-Codex。
这个新工具一出来,大家自然会问:它跟现在市面上的强者,比如 Anthropic 的 Claude Code 比,到底怎么样?

我的原则很简单:只用最先进的生产力工具,谁强就用谁,不站队。
在权威的 SWE-bench 测试集上,Claude Code 曾以 72.7% 的准确率 小幅领先,这让它一度成为 AI 程序员界的顶尖玩家。
但随着 GPT-5-Codex 的发布,情况瞬间反转。新模型在 SWE-bench 上的准确率冲到了 72.8%,首次超越 了 Claude Code。这代表,在纯粹的技术实力上,OpenAI 这次正式坐上了 最强的宝座。
不过,跑分归跑分,实际用起来两者感觉完全不同:
Claude Code像个经验老道的资深工程师。它的界面用起来很顺手,交互体验也更好。但有时候会有点奔放,比如你要求它按特定文件结构来写,它可能直接一股脑把所有代码塞到一个文件里。它的逻辑是:先干了再说,搞砸了再道歉。
Codex则非常谨慎,做事之前会跟你再三确认,严格按照指令来。虽然这保证了精准,但有时会因为频繁的权限请求打断你的工作。不过,GPT-5-Codex 已经优化了这点,它会 根据任务复杂度调整速度,小任务更快,大任务会花更多时间去思考。
在解决问题的思路上,它们的脑回路也不同。比如一个任务需要从 GitHub 拿版本信息,Codex 会聪明地从 Atom feed 里找结构化数据,而 Claude Code 则会直接调用 GitHub 的 API。
说了这么多,到底该怎么选?很简单,这就像你组建一个技术团队一样,你需要考虑的不是谁单挑最强,而是 谁最适合你的项目,以及 谁能跟你配合得最好。
当你处理 复杂、多文件的大项目,需要 AI 有很强的全局理解能力时,Claude Code就一个经验丰富的高级工程师,它依然是个很好的选择。
如果你想 快速开发,专注于精确的单点任务,或者对 成本比较敏感,那 Codex CLI就是一个听话的天才实习生,它的 开源和高性价比 会非常有优势。
最后别忘了,这个牌桌上不止这两个玩家,Google 的 Gemini 3 也快来了。工具的进化速度超乎想象,身为使用者,我们只要 保持开放的心态,拥抱变化,用最好的工具来武装自己就对了。
以上内容来自于2025年9月7日C哥的AI成长圈的日课。
如果你想成为 AI 时代的超级个体,真正做到 AI 落地,欢迎加入我的 AI 成长圈,已经有 500 位朋友在这边一起成长。知识星球搜索“C 哥的 AI 成长圈”即可加入。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237