DIGIPUNK
去投稿

字节跳动开源FaceCLIP模型:文本驱动的高保真身份保持型视觉-语言生成系统

数智朋克获悉,字节跳动在Hugging Face平台开源文本驱动的高保真身份保持型视觉-语言生成系统FaceCLIP。该技术通过多模态编码实现身份一致性生成,提供两个优化版本并支持多场景应用,性能指标超越主流方案。

16 hours ago