DIGIPUNK
去投稿
发表于:11 hours ago

谷歌开放Gemini 2.5 Pro预览版API试用通道,开发者可提前体验企业级功能

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🚀 谷歌开放Gemini 2.5 Pro预览版API试用,预计数周后正式发布
  • 📈 基准测试双突破:LMArena分数提升24分,WebDevArena跃升35分登顶
  • 💻 编码性能全面领先:Aider Polyglot测试占优,科学推理评估卓越
  • 🤝 Trae平台集成Gemini 2.5 Pro,强化前端开发与UI设计支持
  • 🌐 DeepSeek R1-0528全球第二:数学/代码分数双提升,支持JSON输出

数智朋克讯,谷歌近期面向开发者开放了Gemini 2.5 Pro 升级预览版的 API 试用通道,该版本预计在几周后正式发布,标志着其在 AI 模型领域的持续优化。通过 Google AI Studio 和 Vertex AI 平台,开发者可提前体验这一企业级应用支持的功能,新模型在响应结构和创意输出上进行了改进,基于用户反馈优化了格式化和内容生成能力。

在基准测试方面,Gemini 2.5 Pro 预览版展现出显著优势,其在 LMArena 的 Elo 分数提升 24 分至 1470 分,同时在 WebDevArena 的评分跃升 35 分达到 1443 分,位居榜首位置编码性能尤其突出,模型在 Aider Polyglot 等高难度测试中保持领先,并在 GPQA 和 Humanity’s Last Exam 等科学推理评估中表现卓越,验证了其在数学、知识和逻辑能力上的强化。

Trae 平台已集成 Gemini 2.5 Pro Preview(I/O 版),为前端开发和 UI 设计提供更强大的工具支持,这一整合使 Trae 在 Web 应用构建领域迈出关键一步。Gemini 2.5 Pro Preview 在 WebDev Arena 的领先地位,以 1443 分超越 Claude 3.7 Sonnet 和 GPT-4.1 等对手,凸显其在代码生成和界面设计上的高效性。

开源模型领域,DeepSeek R1-0528 通过后训练强化学习实现了性能跃升,在 Artificial Analysis Intelligence Index 中与 Gemini 2.5 Pro 并列全球第二,超越 Grok 3 mini 和 Llama 4 Maverick 等主流模型。未更改架构的前提下,其数学 AIME 提升 21 分代码生成 LiveCodeBench 增加 15 分,同时优化了前端功能并降低幻觉率支持 JSON 输出与函数调用

成本控制成为 Gemini 2.5 Pro 的另一亮点,谷歌在官方博客中对比了 ChatGPT 和 Claude 等模型的 API 价格,强调新增的成本预算机制帮助开发者更好地管理延迟和资源消耗。

本文链接: https://www.shuzhipunk.com/articles/iro6F1ktTNf
转载请注明文章出处

文章所属标签
Gemini 2.5 Pro
开源模型
AI模型