DIGIPUNK
去投稿

OpenAI推出GDPval评估基准,量化AI模型真实经济价值表现

OpenAI正式推出GDPval评估基准,覆盖九大行业44个知识型职业的1320项专业任务,由平均14年经验专家设计。评估采用专家盲评机制,测试显示模型完成任务速度比人类快100倍且成本仅1%,同时揭示当前版本局限性及扩展计划。

2025年09月28日