编辑:桃子 定慧
【新智元导读】OpenAI 2025开发者日上,全场座无虚席。奥特曼重磅官宣四大更新:首发Apps SDK要把ChatGPT打造为「操作系统终极入口」,一键拖拽构建智能体AgentKit,无代码Codex开发,以及Sora 2等三大API登场。OpenAI的野心,彻底藏不住了。
OpenAI 2025开发者日,奥特曼的精彩演讲引爆全场!

最最重磅的,还是Apps SDK,所有人皆可在ChatGPT中构建原生应用,其意义堪比2023年首发的GPTs。
这预示着,ChatGPT又将成为一个新时代的「APP Store」!

这个功能完全反映了OpenAI的野心!
奥特曼想把ChatGPT打造成未来的操作系统。

目前公布支持的APP包括:Booking.com、Canva、coursera、Expedia、Figma、Spotify和Zillow。

新功能名为AgentKit,是面向开发者和企业的一整套构建、部署和优化智能体的工具。
AgentKit包含三个工具:
Agent Builder:可视化画布Connector Registry:管理数据和工具如何连接ChatKit: 嵌入定制聊天界面的工具包
ChatKit可以生成各种各样的聊天工具,提供独一无二的Chat体验。

此外,OpenAI这次还提供了评估智能体能力的Eval指标。

奥特曼现场展示了Albertsons如何构建智能体来分析销量。

使用Agent Builder无需写任何一行代码,全程只需要拖拽和参数配置。


就比如,在Codex加持下,拖放搭建智能体工具从0开发仅用6周完成。

仅仅用按钮控制相机还不够,下一步,让Xbox无线手柄实现相机控制。
通过Codex IDE扩展发送指令,Codex便会迅速制定计划、分析文件,自动识别Xbox的输入逻辑,并将摇杆映射为控制的最佳方式。


更令人兴奋的是,它还集成了语音交互功能。
通过Codex的Realtime API和智能体语音,可以将自然语言引入这款应用。
只需说一句,「将灯光聚焦到观众席」,Codex便通过MCP服务器控制会场灯光系统,瞬间点亮观众席。

三大API,Sora 2也上线了
最后,奥特曼带来了三大API——GPT-5 Pro、gpt-realtime-mini、Sora 2。
开发者们可以抢先一步,享用最强GPT-5 Pro智能,其在指令遵循方面能力大幅提升,体验更优。

在处理那些高精度、深度推理复杂任务,GPT-5 Pro更拿手,尤其是在金融、法律、医疗保健等众多行业。
如今,OpenAI API即可支持GPT-5 Pro的调用。
它的训练截止时间是2024年9月30日,400k上下文窗口,最大支持272k token输出。
输入价格:15美元/百万token,输出价格:120美元/百万token。目前支持文本、图像输入,仅文本输出。

最新的API定价,再次刷新了价格天花板。
GPT-5 Pro输入价格是GPT-5 15倍,输出价格是GPT-5 12倍。


同时,OpenAI还在API中发布了一款语音模型——gpt-realtime-mini。
这是两个月前高级语音模型的缩小版,成本降低了70%,但语音质量和性能保持不变。

奥特曼称,「就我个人而言,我认为语音将成为人们与 AI 交互的主要方式之一。而这次发布正是迈向这一现实的一大步」。
值得一提的是,几天前刚刚上线的Sora 2,预览版的API也正式上线。
视频长度、宽高比、分辨率,全程可控。

这意味着,任何一款APP直接可以用Sora API,生成出令人惊叹的视频。
可控性,是Sora 2最大的优势。比如,拍摄iPhone视图,Sora即可扩展成一个全景电影宽镜头。
首次实现音画同步,Sora 2直出背景、环境音效。
甚至,人们还可以将现实世界的片段融入Sora。比如,将自家狗照片上传,就可以瞬间为它造出「赛博狗友」。

在电商广告中,Sora 2还可以做概念开发。

一个用户案例是,OpenAI联手MATTEL,将创意师的产品创意瞬间变为现实。

演讲的最后,奥特曼激动表示,「我们正见证一个前所未有的时代」。
曾几何时,开发一款软件需要数月,甚至数年的周期。
而今天,有了AI,一个想法可以在几分钟内落地成型。
开发者不再需要一个庞大的团队,只需一个好的创意,就能超越以往的速度,将灵感变为现实。
我们的愿景,是让AI真正为每一个人所用。
而这个愿景,离不开你们每一个人的参与。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237