清华团队联合发布 VPP 机器人大模型，实现视频预测与操作策略融合

星动纪元与清华大学 ISRLab 团队开发的 VPP 机器人大模型通过视频扩散模型与操作策略的知识迁移，构建出具备时空感知的智能决策框架。该模型在工业场景中实现毫秒级响应，其开源协议为多领域认知智能升级提供底层支持。

清

清华团队联合发布 VPP 机器人大模型，实现视频预测与操作策略融合

星动纪元与清华大学 ISRLab 团队开发的 VPP 机器人大模型通过视频扩散模型与操作策略的知识迁移，构建出具备时空感知的智能决策框架。该模型在工业场景中实现毫秒级响应，其开源协议为多领域认知智能升级提供底层支持。

字节跳动加速推进 AI 眼镜研发多项技术突破解决行业痛点

字节跳动 AI 眼镜工程团队攻克高精度影像与低功耗协同技术，成功集成自研豆包大模型与恒玄 2800 芯片实现 4K 影像采集能力。该设备通过分体式供电设计和多模态融合技术，在 AR 导航响应速度上较同类产品提升 40%，量产机型将配备动态瞳孔追踪解决佩戴适配难题。

字

字节跳动加速推进 AI 眼镜研发多项技术突破解决行业痛点

字节跳动 AI 眼镜工程团队攻克高精度影像与低功耗协同技术，成功集成自研豆包大模型与恒玄 2800 芯片实现 4K 影像采集能力。该设备通过分体式供电设计和多模态融合技术，在 AR 导航响应速度上较同类产品提升 40%，量产机型将配备动态瞳孔追踪解决佩戴适配难题。

数智国际

OpenAI 调整技术路线图：o3 与 o4-mini 模型将先行发布，GPT-5 研发获缓冲期

OpenAI 宣布分阶段推出 o3 与 o4-mini 中型模型，为 GPT-5 争取关键技术攻坚时间，同步重启开源计划并升级商业布局。技术团队证实新模型在多轮对话、任务拆解等维度形成代际优势。

O

OpenAI 调整技术路线图：o3 与 o4-mini 模型将先行发布，GPT-5 研发获缓冲期

OpenAI 宣布分阶段推出 o3 与 o4-mini 中型模型，为 GPT-5 争取关键技术攻坚时间，同步重启开源计划并升级商业布局。技术团队证实新模型在多轮对话、任务拆解等维度形成代际优势。

数智国际

谷歌开源 Gemma 3 大模型：27B 版本以 1339 ELO 刷新轻量级模型性能

谷歌最新开源的 Gemma 3 系列大模型通过多模态融合架构与 128k tokens 上下文窗口实现性能突破，其 27B 版本以 1339 ELO 分数刷新轻量级模型上限。该模型支持消费级显卡部署并采用 Apache 2.0 开源协议，加速多模态 AI 技术产业化进程。

谷

谷歌开源 Gemma 3 大模型：27B 版本以 1339 ELO 刷新轻量级模型性能

谷歌最新开源的 Gemma 3 系列大模型通过多模态融合架构与 128k tokens 上下文窗口实现性能突破，其 27B 版本以 1339 ELO 分数刷新轻量级模型上限。该模型支持消费级显卡部署并采用 Apache 2.0 开源协议，加速多模态 AI 技术产业化进程。

数智本土

通义实验室开源全模态情感计算框架 R1-Omni，突破可解释性多模态 AI 技术

通义实验室突破性开源全模态情感计算框架 R1-Omni，通过 RLVR 技术与三维数据流融合实现可视化推理路径，在 DFEW/MAFW 数据集取得 65.83% UAR 值及 35% 性能跃升。该模型 0.8 秒精准捕捉微表情声调组合信号，预判 89% 潜在冲突，推动多模态 AI 进入可解释智能新纪元。

通

通义实验室开源全模态情感计算框架 R1-Omni，突破可解释性多模态 AI 技术

通义实验室突破性开源全模态情感计算框架 R1-Omni，通过 RLVR 技术与三维数据流融合实现可视化推理路径，在 DFEW/MAFW 数据集取得 65.83% UAR 值及 35% 性能跃升。该模型 0.8 秒精准捕捉微表情声调组合信号，预判 89% 潜在冲突，推动多模态 AI 进入可解释智能新纪元。