开源创新
VFusion3D通过使用视频扩散模型作为数据生成引擎,突破了3D数据稀缺的限制。通过生成大量合成多视角数据,该模型实现了高效的3D生成,从单张图像生成3D模型,并在性能上超越现有的同类技术。该方法展示了如何通过扩展数据和模型规模来提升3D生成的效果和应用潜力。
星动纪元与清华大学 ISRLab 团队开发的 VPP 机器人大模型通过视频扩散模型与操作策略的知识迁移,构建出具备时空感知的智能决策框架。该模型在工业场景中实现毫秒级响应,其开源协议为多领域认知智能升级提供底层支持。
快手科技与浙江大学、清华大学及香港中文大学联合发布了全球首个多视角视频生成工具SynCamMaster,该工具结合视频扩散模型和6自由度相机姿势,突破传统技术限制,为影视创作、虚拟拍摄等领域带来创新机遇。