DIGIPUNK
去投稿
发表于:15 hours ago

OpenAI推出GPT-5.3-Codex智能编码模型

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🚀 OpenAI推出GPT-5.3-Codex模型,整合前代编程性能和推理能力
  • 🏆 在SWE-Bench Pro等基准测试中创下行业新纪录
  • 💻 视野扩展至软件生命周期和知识工作,支持多元化任务
  • 🖥️ 发布专为macOS的Codex桌面应用,管理并行智能体
  • 🔒 部署全面网络安全防护体系,防范潜在风险

数智朋克讯,OpenAI近日推出了其最新的智能编码模型GPT-5.3-Codex,标志着其代理式人工智能技术进入了新的阶段。该模型不仅融合了前代GPT-5.2-Codex在编程性能上的前沿优势,还整合了GPT-5.2在复杂推理与专业领域知识方面的能力,使得单一模型能够承担涉及研究、工具使用和复杂执行的长周期任务。处理速度的提升让用户能够更高效地构建项目,同时在任务执行过程中,开发者可以像与同事协作一样,实时进行引导与交互,模型能够保持上下文理解。

一个引人注目的现象是,GPT-5.3-Codex的早期版本在其自身的开发过程中扮演了关键角色。研究团队利用这些版本调试训练过程、管理部署流程并分析评估结果,这种利用AI加速自身迭代的开发模式,显著改变了OpenAI内部工程师与研究人员的工作范式。

在能力评估方面,GPT-5.3-CodexSWE-Bench ProTerminal-Bench 2.0等基准测试中创下了新的行业纪录,并在OSWorldGDPval等衡量现实世界任务与知识工作的评测中表现出色。其编程能力覆盖了多种语言,并能以更少的计算资源完成更多工作。在网页开发领域,该模型能够从零开始,在数天内构建出功能复杂的游戏与应用,仅需初始指令即可自主进行数百万次迭代。对于日常网站创建,模型对用户意图的理解也更加精准,即使是模糊的提示也能生成具备更佳功能性的起点。

模型的视野已从单纯的代码生成扩展至整个软件生命周期乃至更广泛的知识工作。它被设计用于支持调试、部署、撰写产品需求文档、编辑文案、用户研究等多元化任务,其代理能力甚至延伸至创建演示文稿和数据分析等非纯软件领域。这种在编码、前端开发、计算机使用及现实任务上的综合表现,预示着其正演变为一个能够跨领域推理、构建与执行的通用型智能体。

为了应对日益强大的模型能力所带来的管理挑战,OpenAI同时发布了专为macOS设计的Codex桌面应用程序。这款应用旨在成为管理多个并行运行智能体的指挥中心,它通过项目线程隔离不同任务,允许用户无缝切换而不丢失上下文。应用内置了对工作树的支持,允许多个代理在同一代码库的不同隔离副本上工作,从而无冲突地探索不同开发路径。用户的会话历史与配置可以从现有的Codex CLI和IDE扩展无缝迁移。

Codex正从一个编码代理演变为一个利用代码在计算机上完成工作的全能助手。这一转变的核心是“技能”机制,它将指令、资源和脚本打包,使Codex能够可靠地连接各类工具并执行团队定制的工作流。例如,通过结合图像生成技能与网页游戏开发技能,Codex能够独立承担从设计、开发到质量测试的全过程。OpenAI内部已构建了数百个此类技能,用于从运行评估、监控训练任务到起草文档等多样化场景。新应用还引入了“自动化”功能,允许用户设定计划任务,让Codex在后台按预定时间表执行重复性工作。

在安全层面,OpenAI对GPT-5.3-Codex采取了更为审慎的部署策略。这是该公司首个在网络安全领域被归类为“高能力”的模型,也是首个经过专门训练以识别软件漏洞的模型。尽管没有确凿证据表明其能够端到端地自动化网络攻击,但公司仍基于防范性原则,部署了迄今为止最全面的网络安全防护体系,包括安全训练、自动化监控和可信访问控制。为了平衡技术的双刃剑效应,OpenAI启动了“网络安全可信访问”试点计划,并承诺提供一千万美元的API信用额度,以加速开源软件和关键基础设施系统的防御性研究。

该模型现已通过付费版ChatGPT计划提供,用户可在Codex应用、命令行界面、IDE扩展及网页端使用。得益于基础设施与推理堆栈的优化,模型响应速度得到了进一步提升。OpenAI表示,正在努力安全地开放API访问权限,并计划未来将Codex应用扩展至Windows平台。

本文链接: https://www.shuzhipunk.com/articles/auIZeh2s3F4
转载请注明文章出处

文章所属标签
GPT-5.3-Codex
智能编码模型
软件生命周期
网络安全
代理式人工智能