OpenAI 推出新的 macOS 应用，旨在支持代理式编程-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://techcrunch.com/2026/02/02/openai-launches-new-macos-app-for-agentic-coding/

原文作者：Russell Brandom

人工智能已经在软件编写方式上产生了巨大的影响，编程中大量的繁重工作现在由一群代理（agents）和子代理来完成。但随着开发者试验新的人机协作界面和形态，即使是最先进的人工智能实验室也难以跟上步伐。

当前趋势是代理式软件开发——即AI代理可以独立完成编码任务的系统——以 Claude Code 和 Cowork 等应用为代表。与此同时，OpenAI 一直在逐步构建其 Codex 工具，该工具于去年 4 月以命令行工具的形式发布，并在一个月后扩展到 Web 界面。

现在，OpenAI 正朝着迎头赶上的目标迈出重要一步。周一，该公司发布了一款新的 Codex macOS 应用，集成了过去一年中流行的许多代理式实践。这款新应用旨在与多个代理并行工作，集成了 Agent Skills 和其他最先进的工作流程。此次发布正值 OpenAI 发布其最强大的编码模型 GPT-5.2-Codex 不到两个月之后，该公司希望这将足以吸引 Claude Code 用户转向。

“如果你真的想对复杂的事情做精细的工作，5.2 是迄今为止最强大的模型，”首席执行官 Sam Altman 在与记者的电话会议上说。“然而，它更难使用，所以我们将这种模型能力放入一个更灵活的界面中，我们认为这会产生相当大的影响。”

虽然 Altman 对 GPT-5.2 的信心可以理解，但编码基准测试显示了一个更复杂的故事。截至发稿时，GPT-5.2 确实在 TerminalBench（一项衡量 AI 处理命令行编程任务能力的测试）中保持领先地位。但来自 Gemini 3 和 Claude Opus 的代理也记录了大致相当的分数——略低，但在基准测试的误差范围内。SWE-bench（另一个测试 AI 修复现实世界软件错误的基准）的结果也类似，没有显示出 GPT-5.2 的明显优势。然而，代理式用例一直难以有效进行基准测试，而且最先进模型的用户体验可能存在显著差异。

Codex 应用还带来了一系列新功能，OpenAI 表示这些功能将帮助它实现与各种 Claude 应用持平，甚至在某些情况下超越它们。Codex 应用将允许设置在后台按自动计划运行的自动化任务，并将结果放入队列中，供用户返回时进行审查。用户还可以根据自己的工作风格为代理选择不同的个性——从务实到富有同情心。

但对公司而言，最大的卖点是 AI 所实现的纯粹开发速度。“你可以从一张白纸开始，全新的，在几个小时内构建出一套非常复杂的软件，”Altman 说。“我输入新想法的速度有多快，构建的速度就有多快。”

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

目录CONTENT

OpenAI 推出新的 macOS 应用，旨在支持代理式编程

评论区