目 录CONTENT

文章目录

OpenAI 推出新的 macOS 应用,旨在支持代理式编程

Administrator
2026-02-03 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://techcrunch.com/2026/02/02/openai-launches-new-macos-app-for-agentic-coding/

原文作者:Russell Brandom


人工智能已经在软件编写方式上产生了巨大的影响,编程中大量的繁重工作现在由一群代理(agents)和子代理来完成。但随着开发者试验新的人机协作界面和形态,即使是最先进的人工智能实验室也难以跟上步伐。

当前趋势是代理式软件开发——即AI代理可以独立完成编码任务的系统——以 Claude Code 和 Cowork 等应用为代表。与此同时,OpenAI 一直在逐步构建其 Codex 工具,该工具于去年 4 月以命令行工具的形式发布,并在一个月后扩展到 Web 界面

现在,OpenAI 正朝着迎头赶上的目标迈出重要一步。周一,该公司发布了一款新的 Codex macOS 应用,集成了过去一年中流行的许多代理式实践。这款新应用旨在与多个代理并行工作,集成了 Agent Skills 和其他最先进的工作流程。此次发布正值 OpenAI 发布其最强大的编码模型 GPT-5.2-Codex 不到两个月之后,该公司希望这将足以吸引 Claude Code 用户转向。

“如果你真的想对复杂的事情做精细的工作,5.2 是迄今为止最强大的模型,”首席执行官 Sam Altman 在与记者的电话会议上说。“然而,它更难使用,所以我们将这种模型能力放入一个更灵活的界面中,我们认为这会产生相当大的影响。”

虽然 Altman 对 GPT-5.2 的信心可以理解,但编码基准测试显示了一个更复杂的故事。截至发稿时,GPT-5.2 确实在 TerminalBench(一项衡量 AI 处理命令行编程任务能力的测试)中保持领先地位。但来自 Gemini 3 和 Claude Opus 的代理也记录了大致相当的分数——略低,但在基准测试的误差范围内。SWE-bench(另一个测试 AI 修复现实世界软件错误的基准)的结果也类似,没有显示出 GPT-5.2 的明显优势。然而,代理式用例一直难以有效进行基准测试,而且最先进模型的用户体验可能存在显著差异。

Codex 应用还带来了一系列新功能,OpenAI 表示这些功能将帮助它实现与各种 Claude 应用持平,甚至在某些情况下超越它们。Codex 应用将允许设置在后台按自动计划运行的自动化任务,并将结果放入队列中,供用户返回时进行审查。用户还可以根据自己的工作风格为代理选择不同的个性——从务实到富有同情心。

但对公司而言,最大的卖点是 AI 所实现的纯粹开发速度。“你可以从一张白纸开始,全新的,在几个小时内构建出一套非常复杂的软件,”Altman 说。“我输入新想法的速度有多快,构建的速度就有多快。”




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区