数智朋克获悉,字节跳动在Hugging Face平台开源文本驱动的高保真身份保持型视觉-语言生成系统FaceCLIP。该技术通过多模态编码实现身份一致性生成,提供两个优化版本并支持多场景应用,性能指标超越主流方案。