来自

果韵映像 (Fruity Rhapsody)：捕捉并呈现每一颗水果独有的色彩、质感和光泽

华中科技大学发布创新多模态AI模型"Monkey"

华中科技大学软件学院的VLRLab团队最近发布了名为“Monkey”的多模态大模型。这一模型解决了复杂场景和视觉细节处理方面的挑战，通过提升输入分辨率和引入多级描述生成方法实现了显著改进。

数智应用

2023年12月14日

酷影动漫坊：专注于打造高质量的动漫角色图

汤姆猫公司海外研发团队接入Google大模型

汤姆猫公司在生成式人工智能领域取得新进展，其海外研发团队已成功接入Google的Vertex AI平台。

数智应用

2023年12月11日

Soul社交平台推出自研大模型“SoulX”

Soul，一家新兴社交平台，近日宣布推出自主研发的语言大模型“SoulX”。该模型以海量数据训练，具备多项先进功能。

数智应用

2023年12月11日

字节跳动与新加坡国立大学联合推出Magic Animate

字节跳动与新加坡国立大学的合作项目Magic Animate，是AI视频生成领域的另一项创新。这一工具利用先进的AI技术，可以将静态图像转换为动态视频，为用户带来全新的视频创作体验。Magic Animate在TikTok舞蹈数据集上的应用表明，它能够生成高度真实的视频，真实度提升了超过38%。这一技术突破不仅展示了AI在视频生成方面的潜力，也为内容创造者提供了一种全新的表达方式。

数智应用

2023年12月06日

阿里巴巴推出Animate Anyone工具，革新AI视频生成

阿里巴巴最新开发的AI视频生成工具Animate Anyone，由其智能计算研究院负责研发，标志着AI技术在视频创作领域的一个重要突破。该工具允许用户提供任意静态角色图像，包括真人和卡通角色，然后通过输入动作和姿势提示，将这些图像转换为动画。这种技术可以保留角色的关键细节特征，如面部表情和服装细节，使生成的动画更加逼真和生动。Animate Anyone的推出不仅体现了阿里巴巴在AI技术领域的创新能力，也展示了AI在视频内容生成方面的巨大潜力。

数智应用

2023年12月06日

美图公司推出全新AI模型MiracleVision 4.0

美图公司发布了其最新AI模型MiracleVision 4.0版。这一版在原有基础上增加了AI设计和AI视频功能。计划于2024年1月，此技术将应用于美图秀秀、美颜相机等旗下产品。新功能包括矢量图形生成、文字特效、智能分层和排版，以及基于提示词和图片生成视频的能力。此外，MiracleVision的商业API也已开放，采取分级定价策略。

数智应用

2023年12月06日

Stability AI革新图像生成领域，推出效率卓越的Stable Diffusion XL Turbo

Stability AI宣布推出其最新成果——Stable Diffusion XL Turbo（简称SDXL Turbo）。这一模型代表了图像生成技术的一个重大飞跃，通过采用先进的“对抗性扩散蒸馏技术”，SDXL Turbo实现了从繁复的50步迭代过程到只需一步迭代的转变，大幅提升了图像处理的速度和效率。SDXL Turbo的核心创新在于其能够在单次迭代中产生高质量的图像，这在技术上标志着对即时文字至图像转换过程的显著优化。

数智应用

2023年11月30日

微软即将升级Bing Chat至GPT-4 Turbo

微软高管Mikhail Parakhin近日在推特平台上透露，团队正在努力改进Bing Chat（Copilot），计划在解决某些问题后升级至OpenAI的GPT-4 Turbo版本。Parakhin，微软广告和网络服务部门负责人，最近宣布将担任Windows和Web体验团队的负责人。他在推文中指出，尽管目前尚未升级至GPT-4 Turbo，但团队正在积极解决一些关键问题。Parakhin进一步提到，升级到GPT-4 Turbo之后，将会扩大字符输入限制，目前的最高输入字数为4000字。

2023年11月30日