核心要点👉
- 🚀 GPT-5.2模型全面推送, 作为免费'智能+'模式
- 💡强化多步骤、高复杂度任务处理能力
- 📊GDPval测试中70.9%案例超越人类专家
- ⚙️软件工程基准得分领先, SWE-Bench达55.6%和80%
- 🏆多项测试高分, 包括AIME满分和GPQA 92.4%
数智朋克讯, 微软Copilot现已面向网页、Windows及移动端用户全面推送GPT 5.2模型,该版本被命名为“智能+”模式(Smart Plus)。作为一项免费升级服务,其与此前基于GPT 5.1的“智能”模式并行运行,用户可自由选择不同级别的AI辅助。
这一模型被定位为GPT 5.2的“思考”变体(Thinking Variant),重点强化了处理多步骤、高复杂度任务的能力。微软明确将其称为“专家级”办公助手,可显著提升用户制作电子表格、生成演示文稿、编写与检查程序代码、解析长文本及图像处理等方面的工作效率。
在涵盖44类职业的知识型工作任务评估(GDPval)中,GPT-5.2 Thinking在70.9%的测试案例中达到或超越人类专家的水平。相比之下,GPT-5仅实现了38.8%的同类表现,显示出代际间的显著进步。
多项基准测试进一步印证了其技术优势。在软件工程领域,该模型于SWE-Bench Pro和SWE-bench Verified分别取得55.6%与80%的得分,全面领先于GPT-5.1 Thinking。此外,GPT 5.2在AIME 2025中获得满分,GPQA Diamond达到92.4%,CharXiv推理(含Python)部分取得88.7%成绩,并在ARC-AGI等认知测试中实现大幅度性能提升。







粤公网安备44030002001270号