图像生成
Stable Diffusion XL是一款专门针对超高分辨率图像生成的AI工具
英国人工智能初创公司 Stability AI 获得超过 1 亿美元投资,并任命前维塔数码 CEO Prem Akkaraju 为新任 CEO。此次投资将推动公司进一步发展其开源文本到图像生成模型 Stable Diffusion,并扩展在人工智能领域的业务。
Stability AI 创始人 Emad Mostaque 日前宣布辞去首席执行官及董事会职务,转向去中心化人工智能领域。公司任命 Shan Shan Wong 和 Christian Laforte 为临时联席CEO,同时积极寻找长期首席执行官。
Stability AI最近推出了其图像至视频生成模型Stable Video Diffusion (SVD),并已将其加入API中,供第三方平台使用。
Stability AI最近发布了新模型Stable Video Diffusion,这是一个能将文字指令转换为影片的扩散模型。目前官方发布了两个版本的预览版,这些版本可以生成每秒3至30帧的高品质影片,但目前模型的最高帧数限制分别为14帧和25帧。Stable Video Diffusion是基于Stable Diffusion模型改造而成的首个影片生成模型,通过在潜在扩散模型(Latent Diffusion Model,LDM)加入时间层,并使用高品质小型影片数据集进行训练,从而实现影片生成。这一新研究定义了影片LDM的三个训练阶段:文字到图像的预训练、影片预训练和高品质影片的微调。官方表示,这些基础模型在用户偏好研究中的表现优于市面上的其他闭源产品