DIGIPUNK
去投稿
发表于:7 hours ago

OpenAI推出新一代智能编码模型GPT-5.2-Codex

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🚀 性能提升:在SWE-Bench Pro和Terminal-Bench测试中刷新纪录,准确率达56.4%和64.0%
  • 🔒 网络安全跃升:连续三次性能飞跃,接近"高"级别能力门槛
  • 🔍 实际应用案例:Privy工程师发现React框架三个未知安全漏洞
  • 🛡️ 安全措施:增加专项训练、智能体沙箱和可信访问计划
  • ⏳ 部署策略:向付费用户开放,API用户逐步接入以平衡可用性与安全

数智朋克讯,OpenAI正式推出新一代智能编码模型GPT-5.2-Codex,该模型基于GPT-5.2架构并针对代码生成任务进行了深度优化。新版本通过上下文压缩技术显著提升了长序列任务处理能力,在大型代码重构与迁移项目中展现出更强性能,同时在Windows环境下运行效率获得明显改善。

该模型在多项基准测试中刷新纪录,其中在SWE-Bench Pro测试中达到56.4%的准确率,在Terminal-Bench 2.0测试中取得64.0%的成绩。这些测试要求模型在真实终端环境中执行代码编译、模型训练和服务器配置等复杂任务,体现了其在实际软件开发环境中的实用价值。

网络安全能力的跃升成为本次升级的突出特点。评估数据显示,从GPT-5-Codex到GPT-5.1-Codex-Max再到当前版本,模型在专业夺旗赛等安全测试中连续实现三次性能飞跃。虽然按照准备框架标准,该模型尚未达到"高"级别网络安全能力,但开发团队已为未来模型跨越这一门槛做好技术准备。

一个具体案例展示了该技术的实际应用价值:Privy公司首席安全工程师Andrew MacPherson使用前代模型配合Codex CLI工具,在研究已知漏洞过程中意外发现了React框架中三个此前未知的安全漏洞,并在七天内完成了从发现到披露的全过程。

针对模型能力提升可能带来的双重用途风险,OpenAI实施了多层次防护措施。在模型层面增加了针对有害任务和提示注入的专项训练,在产品层面引入了智能体沙箱可配置网络访问机制。同时启动了仅限邀请的可信访问计划,允许经审查的安全专家在防御性场景中使用更强大的模型版本。

目前GPT-5.2-Codex已向付费ChatGPT用户开放所有Codex平台访问权限,API用户的接入工作将在未来数周内逐步完成。这种渐进式部署策略旨在平衡技术可用性与安全防护之间的关系,为后续更大范围的访问权限开放积累实践经验。

本文链接: https://www.shuzhipunk.com/articles/5VMIMMMOuwq
转载请注明文章出处

文章所属标签
GPT-5.2-Codex
OpenAI
代码生成
网络安全
基准测试