开源创新
VFusion3D通过使用视频扩散模型作为数据生成引擎,突破了3D数据稀缺的限制。通过生成大量合成多视角数据,该模型实现了高效的3D生成,从单张图像生成3D模型,并在性能上超越现有的同类技术。该方法展示了如何通过扩展数据和模型规模来提升3D生成的效果和应用潜力。
计算机视觉领域顶尖学者何恺明宣布以兼职形式加入谷歌 DeepMind 担任杰出科学家,同时保留麻省理工学院终身教职。作为深度残差网络 (ResNet) 主要奠基者,其研究成果支撑着多项 AI 突破性技术演进。
eBay 推出 AI 驱动的视频内容生成系统,通过计算机视觉技术解析商品信息并自动生成短视频。该系统支持多平台分发,并计划接入 3D 模型数据实现 360 度产品展示。