核心要点👉
- 🚀 性能提升:在SWE-Bench Pro和Terminal-Bench测试中刷新纪录,准确率达56.4%和64.0%
- 🔒 网络安全跃升:连续三次性能飞跃,接近"高"级别能力门槛
- 🔍 实际应用案例:Privy工程师发现React框架三个未知安全漏洞
- 🛡️ 安全措施:增加专项训练、智能体沙箱和可信访问计划
- ⏳ 部署策略:向付费用户开放,API用户逐步接入以平衡可用性与安全
数智朋克讯,OpenAI正式推出新一代智能编码模型GPT-5.2-Codex,该模型基于GPT-5.2架构并针对代码生成任务进行了深度优化。新版本通过上下文压缩技术显著提升了长序列任务处理能力,在大型代码重构与迁移项目中展现出更强性能,同时在Windows环境下运行效率获得明显改善。
该模型在多项基准测试中刷新纪录,其中在SWE-Bench Pro测试中达到56.4%的准确率,在Terminal-Bench 2.0测试中取得64.0%的成绩。这些测试要求模型在真实终端环境中执行代码编译、模型训练和服务器配置等复杂任务,体现了其在实际软件开发环境中的实用价值。
网络安全能力的跃升成为本次升级的突出特点。评估数据显示,从GPT-5-Codex到GPT-5.1-Codex-Max再到当前版本,模型在专业夺旗赛等安全测试中连续实现三次性能飞跃。虽然按照准备框架标准,该模型尚未达到"高"级别网络安全能力,但开发团队已为未来模型跨越这一门槛做好技术准备。
一个具体案例展示了该技术的实际应用价值:Privy公司首席安全工程师Andrew MacPherson使用前代模型配合Codex CLI工具,在研究已知漏洞过程中意外发现了React框架中三个此前未知的安全漏洞,并在七天内完成了从发现到披露的全过程。
针对模型能力提升可能带来的双重用途风险,OpenAI实施了多层次防护措施。在模型层面增加了针对有害任务和提示注入的专项训练,在产品层面引入了智能体沙箱和可配置网络访问机制。同时启动了仅限邀请的可信访问计划,允许经审查的安全专家在防御性场景中使用更强大的模型版本。
目前GPT-5.2-Codex已向付费ChatGPT用户开放所有Codex平台访问权限,API用户的接入工作将在未来数周内逐步完成。这种渐进式部署策略旨在平衡技术可用性与安全防护之间的关系,为后续更大范围的访问权限开放积累实践经验。







粤公网安备44030002001270号