开源创新
SEED-Story 是由腾讯ARC开发的多模态长篇故事生成框架,结合了图像和文本生成,能够创建连贯且风格一致的叙事。其创新点包括使用大规模语言模型和专门的数据集StoryStream进行训练和评估。
OpenAI 正式推出 gpt-image-1 模型 API 接口,支持文图混合输入与跨媒介风格转换。该服务采用分层计费模式并内置 C2PA 溯源标识,已在数字创意产业实现多场景应用。
生成式 AI 创意平台 KREA 完成贝恩资本领投的 4700 万美元 B 轮融资,估值突破 5 亿美元。其智能参数适配系统与实时协同编辑功能已助力三星设计团队缩短 40% 开发周期,验证 AI 技术在产业端的应用价值。
Kuaishou 可灵 AI 在 C 端市场完成亿元级商业化验证,通过多模态生成引擎实现动态捕捉精度像素级控制。其视频大模型专属算力集群将实时生成速度提升 47%,开辟电商虚拟主播等新商业场景。
谷歌推出 Gemini 2.0 系列模型,其中 Flash 版本以量子级响应优化移动端多轮对话,Pro 版本则通过混合专家架构赋能企业级运算。实验性 AI Mode 将传统搜索转化为动态对话界面,新型上下文锚定系统实现跨媒介叙事能力突破。
潞晨科技开源全球首个 11B 参数视频生成大模型 Open-Sora 2.0,通过 3D 自编码器与 Flow Matching 框架实现 20 万美元低成本训练,性能指标逼近 OpenAI Sora。该方案完整开放分布式训练协议与模型权重,实测显示物理规律模拟精度提升 47%,光照渲染误差降低 91%。