DIGIPUNK
去投稿

字节跳动推出OmniHuman-1.5视频生成框架,双系统理论实现数字人动态建模

字节跳动智能创作团队发布OmniHuman-1.5视频生成框架,通过认知引擎与渲染引擎协同机制将静态图像转化为上下文感知动态影像。该框架在唇同步准确率达98.7%,手势动态方差提升32%,并已开源应用于影视制作、虚拟教育等跨领域场景。

20 hours ago
新加坡国立大学推出NExT-GPT,提升多模态AI处理能力

新加坡国立大学NExT++研究中心发布多模态大语言模型NExT-GPT,凭借创新架构与轻量级训练方法,在多模态数据处理上实现显著突破。该模型为多模态生成与理解领域开创了新方向,展示出更加接近人类交流方式的AI潜力。

2025年01月15日