谷歌为Gemini平台的视频模型Veo 3.1推出多款新预设模板,强化用户通过照片或文本定制视频的能力。同时,图像生成功能“Nano Banana”引入两种模型,包括支持高级特性的Gemini 3 Pro Image。
Lyria 3是专为音乐生成设计的AI系统,能创作高品质乐曲、歌词和人声,计划通过API开放。Gemini 3.1 Pro是谷歌最新旗舰模型,具备多模态推理能力,在复杂任务上表现卓越,安全性能优越。
豆包App面向部分用户灰度测试Seedance 2.0视频生成模型,支持多模态输入和自动分镜规划。该模型显著降低视频创作成本,推动AI视频进入工业可用阶段。
蚂蚁集团开源全模态大模型Ming-Flash-Omni 2.0,在基准测试中表现优异,部分指标超越谷歌Gemini 2.5 Pro。该模型实现全场景音频统一生成,推理效率高,为开发者提供可复用技术底座。
阿波罗全球管理正敲定数十亿美元信贷,定向支持xAI购置英伟达AI芯片,凸显私人信贷深度介入AI基础设施构建;同时,大众汽车南非投资依赖政策支持,美国能源部长评论石油供应灵活性,白宫启动犯罪记录共享程序。
Seedance2.0模型允许用户提供多达12份参考素材生成视频,处理速度提升十倍并减少无效生成。其技术如首尾帧控制和原生音视频同步,重塑内容生产流程并压缩制作成本。
OpenAI首席执行官山姆·奥尔特曼通过内部通讯表示公司发展势头强劲,ChatGPT月度增长率已超过10%,升级对话模型即将推出。同时,公司面临谷歌和Anthropic的竞争挑战,Codex增长显著,并筹备千亿美元融资。
小红书研发团队正在内部测试独立AI应用OpenStoryline,旨在通过自然语言交互降低视频编辑门槛。同时,公司成立Red&Live部门聚焦短视频业务,以应对用户增长压力并构建AI赋能闭环。
苹果计划在未来数月内引入对第三方AI语音助手的支持,这是其车载生态战略的显著转向。尽管开放策略有限,苹果同时推进Siri升级,强化实时信息检索能力。
Meta内部备忘录显示,代号'Avocado'的AI模型已完成预训练,在内部测试中表现超越当前领先模型。然而,其真实性能需外部验证,具体发布计划尚未公布。