DIGIPUNK
去投稿
数智朋克 -拥抱数字变革,数字化世界乌托邦! 近一周数智世界共有【3】项数智动态 - 本站智选 AI应用 【210】款 -
数智朋克 -拥抱数字变革,数字化世界乌托邦! 近一周数智世界共有【3】项数智动态 - 本站智选 AI应用 【210】款 -
快讯和更新
关注 数智世界的最新快讯和动态
不要错过数智世界正在发生的一切
全球动态
12 hours ago
谷歌推出Veo 3.1新预设模板和图像生成功能更新
谷歌为Gemini平台的视频模型Veo 3.1推出多款新预设模板,强化用户通过照片或文本定制视频的能力。同时,图像生成功能“Nano Banana”引入两种模型,包括支持高级特性的Gemini 3 Pro Image。
Veo 3.1
O
12 hours ago
OpenAI发布新一代多模态交互模型GPT-Realtime-1.5
OpenAI正式推出GPT-Realtime-1.5多模态模型,支持实时音频和视觉处理,实现低延迟交互。该模型显著优化响应速度,开放API接口,并采用端到端加密和内容过滤确保安全。
GPT-Realtime-1.5
G
12 hours ago
Google DeepMind推出Lyria 3音乐AI模型,Google发布Gemini 3.1 Pro旗舰AI
Lyria 3是专为音乐生成设计的AI系统,能创作高品质乐曲、歌词和人声,计划通过API开放。Gemini 3.1 Pro是谷歌最新旗舰模型,具备多模态推理能力,在复杂任务上表现卓越,安全性能优越。
AI音乐生成
本土快讯
2026年02月12日
字节跳动豆包App启动Seedance 2.0视频生成模型灰度测试
豆包App面向部分用户灰度测试Seedance 2.0视频生成模型,支持多模态输入和自动分镜规划。该模型显著降低视频创作成本,推动AI视频进入工业可用阶段。
Seedance 2.0
2026年02月12日
蚂蚁集团开源全模态大模型Ming-Flash-Omni 2.0
蚂蚁集团开源全模态大模型Ming-Flash-Omni 2.0,在基准测试中表现优异,部分指标超越谷歌Gemini 2.5 Pro。该模型实现全场景音频统一生成,推理效率高,为开发者提供可复用技术底座。
全模态大模型
2026年02月11日
阿里巴巴达摩院开源机器人基础模型RynnBrain
阿里巴巴达摩院发布专为机器人设计的开源基础模型RynnBrain,旨在构建感知、决策与执行的智能核心,使其在真实世界自主处理复杂任务。该模型整合时空记忆与空间推理能力,在权威测试中超越谷歌和英伟达主流模型,并推出全系列开源模型及新评测基准。
RynnBrain
了解更多资讯
先锋广场
朋克大喇叭📣
本站域名https://www.shuzhipunk.com谨防仿冒站!