OpenAI公司近日对其Codex AI编程助手进行了重大升级,此次更新不仅增强了其核心功能,还拓展了多平台操作能力。最引人注目的是,Codex现在能够直接控制Mac桌面应用程序,通过独立光标实现屏幕内容查看、界面元素点击和文字输入等操作。这一突破性功能使开发者可以高效测试应用程序、迭代前端界面,同时支持多个智能体并行运行,确保用户工作流不受干扰。
记忆功能的强化是本次升级的另一亮点。Codex现在能够自动保存用户偏好设置、重复性工作流和技术栈信息,即使任务暂停后也能通过对话线程无缝恢复工作。更值得关注的是,该系统具备自主调度能力,可规划跨数天甚至数周的长期任务,并根据项目上下文、记忆数据和已连接插件主动提供操作建议。这种智能化改进显著提升了复杂项目的执行效率。
在浏览器操作方面,新版本引入了应用内评论功能,允许用户直接在页面标注指令,为智能体提供更精确的任务指引。OpenAI透露,后续版本将实现完整浏览器控制能力,包括自主访问网站、执行用户流程、截图验证输出结果等高级功能。图像生成领域也迎来革新,集成gpt-image-1.5模型后,用户可快速创建产品概念图和界面原型,支持多终端标签同步操作。
插件生态系统同步扩容,新增90余个专业插件,涵盖技能组合、应用集成和MCP服务器连接等功能。这些扩展工具显著增强了Codex的上下文获取能力,使其能够更精准地理解项目需求并执行复杂操作。特别值得关注的是GitHub评论处理功能的加入,以及侧边栏直接预览PDF和电子表格的实用改进,进一步提升了开发协作效率。













