华中科技大学软件学院的VLRLab团队最近发布了名为“Monkey”的多模态大模型。这一模型解决了复杂场景和视觉细节处理方面的挑战,通过提升输入分辨率和引入多级描述生成方法实现了显著改进。
字节跳动与新加坡国立大学的合作项目Magic Animate,是AI视频生成领域的另一项创新。这一工具利用先进的AI技术,可以将静态图像转换为动态视频,为用户带来全新的视频创作体验。Magic Animate在TikTok舞蹈数据集上的应用表明,它能够生成高度真实的视频,真实度提升了超过38%。这一技术突破不仅展示了AI在视频生成方面的潜力,也为内容创造者提供了一种全新的表达方式。
阿里巴巴最新开发的AI视频生成工具Animate Anyone,由其智能计算研究院负责研发,标志着AI技术在视频创作领域的一个重要突破。该工具允许用户提供任意静态角色图像,包括真人和卡通角色,然后通过输入动作和姿势提示,将这些图像转换为动画。这种技术可以保留角色的关键细节特征,如面部表情和服装细节,使生成的动画更加逼真和生动。Animate Anyone的推出不仅体现了阿里巴巴在AI技术领域的创新能力,也展示了AI在视频内容生成方面的巨大潜力。
美图公司发布了其最新AI模型MiracleVision 4.0版。这一版在原有基础上增加了AI设计和AI视频功能。计划于2024年1月,此技术将应用于美图秀秀、美颜相机等旗下产品。新功能包括矢量图形生成、文字特效、智能分层和排版,以及基于提示词和图片生成视频的能力。此外,MiracleVision的商业API也已开放,采取分级定价策略。
Stability AI宣布推出其最新成果——Stable Diffusion XL Turbo(简称SDXL Turbo)。这一模型代表了图像生成技术的一个重大飞跃,通过采用先进的“对抗性扩散蒸馏技术”,SDXL Turbo实现了从繁复的50步迭代过程到只需一步迭代的转变,大幅提升了图像处理的速度和效率。SDXL Turbo的核心创新在于其能够在单次迭代中产生高质量的图像,这在技术上标志着对即时文字至图像转换过程的显著优化。
微软高管Mikhail Parakhin近日在推特平台上透露,团队正在努力改进Bing Chat(Copilot),计划在解决某些问题后升级至OpenAI的GPT-4 Turbo版本。Parakhin,微软广告和网络服务部门负责人,最近宣布将担任Windows和Web体验团队的负责人。他在推文中指出,尽管目前尚未升级至GPT-4 Turbo,但团队正在积极解决一些关键问题。Parakhin进一步提到,升级到GPT-4 Turbo之后,将会扩大字符输入限制,目前的最高输入字数为4000字。