火山引擎在FORCE原动力大会上发布了视频生成模型Seedance 1.0 pro,具备三种生成模式。同期亮相豆包大模型1.6等模型,豆包大模型日均tokens处理量大幅增长。
阿里千问APP正式集成万相2.6视频生成模型,面向全体用户免费开放。该模型支持角色扮演、多镜头生成等功能,用户可通过AI小剧场创建个性化视频内容。
潞晨科技开源110亿参数视频生成模型Open-Sora 2.0,以20万美元成本完成训练,显著降低行业技术门槛。公司同步聚焦高创新业务领域,优化资源投入并加速产品迭代。
谷歌推出Veo 3.1视频生成模型升级版,在音频输出、图像转视频效果及编辑控制方面取得显著突破。新版本支持60秒连续视频生成、1080p高清输出及多场景提示功能,显著提升视觉叙事能力。
数智朋克获悉,快手可灵AI基座模型完成迭代升级,推出可灵2.5 Turbo视频生成模型,在文本理解、运动生成和视觉呈现三大核心模块实现突破性进展。商业化策略同步调整,1080P模式下5秒视频生成成本直降近三成,单位算力成本进入新阶段。
快手可灵2.1视频生成模型推出首尾帧功能内测,聚焦提升视觉流畅度和控制精度,解决AI视频转场生硬问题。新功能实现电影级运镜控制,高效输出模式适用于产品宣传片等专业场景,用户规模超4500万。
阿里巴巴开源的通义万相Wan2.2视频生成模型引入MoE架构,节省50%计算资源并新增电影美学控制系统。开源的三款模型支持高清视频生成,其中TI2V-5B可在消费级显卡快速处理高清视频。
国内 AI 企业阶跃星辰发布开源视频生成模型 Step-Video-TI2V,该模型基于 30B 参数架构实现物理运动与镜头语言双向调控。VBench-I2V 测试显示其动态连贯性指标刷新行业纪录,动漫特效模拟精度提升 47%。
豆包大模型团队与北京交通大学和中国科学技术大学联合开发的“VideoWorld”模型,突破了传统多模态模型的限制,首次实现无语言模型的世界认知。该模型通过纯视觉信号进行学习和推理,在视频生成和理解方面展现了强大的创新能力。
谷歌推出了Veo 2视频生成模型和Imagen 3图像生成模型,均达到了当前领域的最先进水平,为创作者提供了更高质量的创作体验。Veo 2的4K视频生成和精准艺术控制,以及Imagen 3在图像创作上的突破,标志着谷歌在AI创作工具领域的领导地位进一步巩固。