DIGIPUNK
去投稿

昆仑天工Mureka V8音乐大模型亮相 超越Suno并启动Mureka Studio内测

昆仑天工旗下Mureka V8音乐大模型正式发布,在旋律创作、人声表现力等核心维度超越行业标杆Suno。同时启动Mureka Studio内测,提供单轨生成等功能,降低AI音乐创作门槛,并推动AI音乐向可发布品质迈进。

2026年01月29日
小米开源端到端语音模型Xiaomi-MiMo-Audio,实现语音领域三重技术突破

小米正式开源原生端到端语音模型Xiaomi-MiMo-Audio,基于上亿小时训练数据实现少样本泛化能力,并在多项基准测试中超越同规模开源模型及闭源模型。该模型通过三重技术创新突破传统语音范式,全套技术方案已开源发布。

2025年09月20日
阿里通义实验室推出空间音频生成模型OmniAudio,实现全景视频到空间音频实时合成

阿里通义实验室推出空间音频生成模型OmniAudio,通过解析360°全景视频直接合成三维声场。该项目已全面开源,提供完整模型架构与Sphere360数据集,显著降低技术研发门槛。

2025年06月04日
阿里通义大模型推出Qwen2-Audio,实现无文本语音问答功能

阿里通义大模型家族再添新成员,Qwen2系列新增音频语言模型Qwen2-Audio,可直接进行语音问答。通义团队还发布了新的音频理解模型测评基准,相关研究已入选ACL 2024国际会议。

2024年08月15日
亚马逊云科技推出Amazon App Studio,简化企业级应用开发

在纽约峰会上,亚马逊云科技发布了由生成式AI驱动的Amazon App Studio,助力用户通过自然语言快速创建企业级应用程序。预览版现已在美国西部区域上线。

2024年07月12日