DIGIPUNK
去投稿
发表于:3 hours ago

微软Copilot全面推送GPT 5.2模型, 命名为'智能+'模式

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🚀 GPT-5.2模型全面推送, 作为免费'智能+'模式
  • 💡强化多步骤、高复杂度任务处理能力
  • 📊GDPval测试中70.9%案例超越人类专家
  • ⚙️软件工程基准得分领先, SWE-Bench达55.6%和80%
  • 🏆多项测试高分, 包括AIME满分和GPQA 92.4%

数智朋克讯, 微软Copilot现已面向网页、Windows及移动端用户全面推送GPT 5.2模型,该版本被命名为“智能+”模式(Smart Plus)。作为一项免费升级服务,其与此前基于GPT 5.1的“智能”模式并行运行,用户可自由选择不同级别的AI辅助。

这一模型被定位为GPT 5.2的“思考”变体(Thinking Variant),重点强化了处理多步骤、高复杂度任务的能力。微软明确将其称为“专家级”办公助手,可显著提升用户制作电子表格、生成演示文稿、编写与检查程序代码、解析长文本及图像处理等方面的工作效率。

在涵盖44类职业的知识型工作任务评估(GDPval)中,GPT-5.2 Thinking70.9%的测试案例中达到或超越人类专家的水平。相比之下,GPT-5仅实现了38.8%的同类表现,显示出代际间的显著进步。

多项基准测试进一步印证了其技术优势。在软件工程领域,该模型于SWE-Bench ProSWE-bench Verified分别取得55.6%80%的得分,全面领先于GPT-5.1 Thinking。此外,GPT 5.2AIME 2025中获得满分,GPQA Diamond达到92.4%CharXiv推理(含Python)部分取得88.7%成绩,并在ARC-AGI等认知测试中实现大幅度性能提升。

本文链接: https://www.shuzhipunk.com/articles/isvODZfdJ5l
转载请注明文章出处

文章所属标签
GPT 5.2
微软Copilot
智能+模式
AI性能
基准测试