٩(◕‿◕。)۶ 嗨,探险家!
还没拿到探险许可吗?
加入数字探险
欢迎回到数智世界!
用户名
密码
同意
《用户服务协议》
《隐私政策》
开启
密码掉进黑洞了?
微信公众号
抖音视频
微信视频号
小红书
数智朋克
DIGIPUNK
快讯
智选
创新
探索
欢迎进群
来自
去投稿
数智本土
智源研究院发布了全新原生多模态世界模型Emu3,基于下一个token预测即可实现文本、图像、视频的理解与生成,无需依赖扩散模型。Emu3在图像生成、视觉语言理解和视频生成等任务中表现优异,提供了一种统一的多模态研究范式,并已开源。
智源研究院推出Emu3:实现文本、图像、视频统一生成的多模态模型
DIGIPUNK
AIGC社群
联系我们
加入我们
商务合作
我要投稿
解决方案
媒体矩阵
Copyright © 2023-2024 DIGIPUNK LTD.