豆包大模型团队与北京交通大学和中国科学技术大学联合开发的“VideoWorld”模型,突破了传统多模态模型的限制,首次实现无语言模型的世界认知。该模型通过纯视觉信号进行学习和推理,在视频生成和理解方面展现了强大的创新能力。