DIGIPUNK
去投稿
阿里通义实验室推出空间音频生成模型OmniAudio,实现全景视频到空间音频实时合成

阿里通义实验室推出空间音频生成模型OmniAudio,通过解析360°全景视频直接合成三维声场。该项目已全面开源,提供完整模型架构与Sphere360数据集,显著降低技术研发门槛。

2025年06月04日
阿里通义大模型推出Qwen2-Audio,实现无文本语音问答功能

阿里通义大模型家族再添新成员,Qwen2系列新增音频语言模型Qwen2-Audio,可直接进行语音问答。通义团队还发布了新的音频理解模型测评基准,相关研究已入选ACL 2024国际会议。

2024年08月15日
亚马逊云科技推出Amazon App Studio,简化企业级应用开发

在纽约峰会上,亚马逊云科技发布了由生成式AI驱动的Amazon App Studio,助力用户通过自然语言快速创建企业级应用程序。预览版现已在美国西部区域上线。

2024年07月12日
虹软PhotoStudio AI入驻抖店市场,助力电商高效图像生成

虹软PhotoStudio AI(PSAI)近日入驻抖店服务市场,为电商提供AI图像生成及商品图优化服务,显著提高商品展示效率,降低拍摄成本。此外,PSAI的AIGC视频生成功能也在阿里1688平台上线,为商家提供新的营销工具,进一步提升商品竞争力和品牌影响力。

2024年07月02日