北京时间9月16号OpenAI 升级全新codex编程工具GPT-5-Codex:基于 GPT-5、专为真实工程场景训练模型,配上工具链与更强的代码推理审查,支持本地/云端无缝切换,定位就是“能独立干活的编程程序员”。

3)时间线回顾
4 月:首发 Codex CLI。5 月:上线 Codex Web。两周前:把 Codex 统一成由 ChatGPT 账户驱动的单一产品体验,本地与云端无缝切。9月15号 直接发布新版GPT-5-Codex编程模型,有点对飙 Claude code的火药味道。
4)模型本体的关键能力
基准成绩SWE-bench Verified(n=500):74.5%(GPT-5 为 72.8%)。困难重构任务(Python/Go/OCaml 等):从 33.9% 提升到 51.3%。真实案例:处理过来自 Gitea 的 PR,涉及 232 文件 / 3,541 行修改。动态思考时间简单请求:响应更快、token 用量显著缩减(内部数据:最简单 10% 的任务,token 减 93.7%)。复杂重构:允许更长计算与自我迭代(最复杂 10% 的任务,token 增 102.2%),可连续独立工作超 7 小时,直到测试通过、方案收敛。更专业的代码审查不正确评论占比:13.7% → 4.4%。高影响评论占比:39.4% → 52.4%。评论更克制:每个 PR 平均评论数 1.32 → 0.93,更聚焦关键问题。前端与多模态能产出美观的桌面/移动端界面。支持图像/截图作为输入;在云端作业时,可回传进度截图给用户查看。5)生态与工作流
终端/IDE/GitHub/网页/移动端一体化,贯穿从构建到审查的全流程。本地 ↔ 云端 无缝切换,长上下文不中断。官方建议:与通用 GPT-5 不同,更适合在 Codex 或类似“代理式编程”环境中使用,发挥长时执行与上下文管理优势。
6)能解决哪些“真问题”
从零起步拉起完整项目骨架并补齐测试。大范围重构(跨语言/多模块),持续跑测修复直到绿灯。在 PR 里自动抓关键漏洞,少水评,多给能落地的改动。前端快速出样式好看的界面,边做边可视化进度。7)怎么上手(总结版)
订阅任一 ChatGPT 付费方案即可用(额度随方案)。终端装好 Codex CLI,在 IDE/网页/GitHub 或 iOS 端直接调用。等 API 开放后,可接入你现有的自动化与平台化工作。相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237