谷歌开放Gemini 2.5 Pro预览版API试用通道,开发者可提前体验企业级功能

核心要点👉

🚀 谷歌开放Gemini 2.5 Pro预览版API试用，预计数周后正式发布
📈 基准测试双突破：LMArena分数提升24分，WebDevArena跃升35分登顶
💻 编码性能全面领先：Aider Polyglot测试占优，科学推理评估卓越
🤝 Trae平台集成Gemini 2.5 Pro，强化前端开发与UI设计支持
🌐 DeepSeek R1-0528全球第二：数学/代码分数双提升，支持JSON输出

数智朋克讯，谷歌近期面向开发者开放了Gemini 2.5 Pro 升级预览版的 API 试用通道，该版本预计在几周后正式发布，标志着其在 AI 模型领域的持续优化。通过 Google AI Studio 和 Vertex AI 平台，开发者可提前体验这一企业级应用支持的功能，新模型在响应结构和创意输出上进行了改进，基于用户反馈优化了格式化和内容生成能力。

在基准测试方面，Gemini 2.5 Pro 预览版展现出显著优势，其在 LMArena 的 Elo 分数提升 24 分至 1470 分，同时在 WebDevArena 的评分跃升 35 分达到 1443 分，位居榜首位置。编码性能尤其突出，模型在 Aider Polyglot 等高难度测试中保持领先，并在 GPQA 和 Humanity’s Last Exam 等科学推理评估中表现卓越，验证了其在数学、知识和逻辑能力上的强化。

Trae 平台已集成 Gemini 2.5 Pro Preview（I/O 版），为前端开发和 UI 设计提供更强大的工具支持，这一整合使 Trae 在 Web 应用构建领域迈出关键一步。Gemini 2.5 Pro Preview 在 WebDev Arena 的领先地位，以 1443 分超越 Claude 3.7 Sonnet 和 GPT-4.1 等对手，凸显其在代码生成和界面设计上的高效性。

开源模型领域，DeepSeek R1-0528 通过后训练强化学习实现了性能跃升，在 Artificial Analysis Intelligence Index 中与 Gemini 2.5 Pro 并列全球第二，超越 Grok 3 mini 和 Llama 4 Maverick 等主流模型。未更改架构的前提下，其数学 AIME 提升 21 分、代码生成 LiveCodeBench 增加 15 分，同时优化了前端功能并降低幻觉率，支持 JSON 输出与函数调用。

成本控制成为 Gemini 2.5 Pro 的另一亮点，谷歌在官方博客中对比了 ChatGPT 和 Claude 等模型的 API 价格，强调新增的成本预算机制帮助开发者更好地管理延迟和资源消耗。

谷歌开放Gemini 2.5 Pro预览版API试用通道,开发者可提前体验企业级功能

数智资讯订阅