DIGIPUNK
去投稿
发表于:5 hours ago

Google DeepMind推出Lyria 3音乐AI模型,Google发布Gemini 3.1 Pro旗舰AI

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🎵 Lyria 3专为音乐生成,能创作乐曲、歌词和人声
  • 🧠 Gemini 3.1 Pro具备原生多模态推理能力
  • 📊 支持100万token输入和64K token输出
  • 🚀 在基准测试中显著超越前代模型
  • 🔒 遵循前沿安全框架,安全性能优越

数智朋克讯,来自Google DeepMind的Lyria 3模型正式亮相,这款专为音乐生成而设计的人工智能系统能够创作从古典到流行等多种风格的高品质乐曲。它不仅能够生成旋律,还能创作与之匹配的歌词和人声部分。该模型基于一个庞大的音乐与歌词数据集进行训练,并运用先进的机器学习技术,确保其产出的音乐兼具创意性与结构连贯性。公司计划通过API接口向开发者与音乐人开放这一模型,旨在为创作者提供全新的音乐制作与作曲工具。预计Lyria 3将对音乐产业产生深远影响,催生前所未有的创意形式与合作模式。与此同时,谷歌也推出了其旗舰模型系列的最新成员Gemini 3.1 Pro。作为Gemini 3系列中的下一代模型,它被定位为目前谷歌处理复杂任务最先进的解决方案。Gemini 3.1 Pro具备原生多模态推理能力,能够理解来自文本、音频、图像、视频乃至整个代码仓库等海量多模态信息源,并处理其中的庞大数据集与复杂问题。该模型支持高达100万token的上下文窗口用于输入,并能输出长达64K token的文本。在一系列基准测试中,Gemini 3.1 Pro在需要增强推理与多模态能力的任务上,其表现显著超越了前代Gemini 3 Pro。该模型特别适用于需要智能体性能、高级编码、长上下文或多模态理解以及算法开发的应用场景。它通过包括Gemini应用、Google Cloud / Vertex AI、Google AI Studio、Gemini API在内的多个渠道进行分发。在安全层面,Gemini 3.1 Pro遵循严格的“前沿安全框架”进行评估,该框架覆盖了化学、生物、放射性与核信息风险、网络安全、有害操纵、机器学习研发以及模型错位五大风险领域。评估结果显示,该模型在所有关键能力等级的警报阈值之下,尤其是在先前模型曾触及警报的网络安全领域,Gemini 3.1 Pro也保持了在阈值之下的表现。内部安全评估亦表明,其在安全性与语调控制方面整体优于Gemini 3 Pro,同时将不合理的拒绝率保持在较低水平。

本文链接: https://www.shuzhipunk.com/articles/ZQu3xP90RBk
转载请注明文章出处

文章所属标签
AI音乐生成
多模态AI
Gemini模型
机器学习
API开放