DIGIPUNK
去投稿

阿里巴巴夸克 AI 超级框集成视觉智能中枢 实现视觉 - 语言双模态跨越

阿里巴巴旗下夸克应用完成 AI 超级框战略升级,通过集成视觉解析引擎与逻辑推演架构实现多模态交互革新。新功能支持 12 类物体实时解析,千亿参数多模态大模型使开放域问答准确率提升 27%。

2025年04月28日
Meta 发布 Llama 4 系列多模态大模型 突破性架构引领参数规模与效率革新

Meta 推出 Llama 4 系列多模态大模型,采用混合专家系统实现参数规模与运算效率突破,旗舰型号总参数达 2 万亿。该系列通过动态门控路由和跨模态注意力机制,在超长文档解析、动态视频处理等场景展现优势,配合硬件适配实现实时推理。

2025年04月06日
阿里巴巴开源 Qwen2.5-Omni-7B 全模态大模型 支持跨模态实时处理

阿里巴巴集团开源通义千问系列最新 Qwen2.5-Omni-7B 模型,该 7B 参数规模模型实现文本 / 图像 / 音频 / 视频跨模态实时处理,通过双核架构与创新算法超越 Google Gemini 等竞品。模型在语音生成质量达专业播音水平,支持智能手机本地部署,并构建全球最大开源模型生态体系。

2025年03月29日
生数科技联合好莱坞巨头 Aura Productions 启动全球首部全 AI 驱动科幻动漫剧集开发

生数科技与 Aura Productions 基于 Vidu 视频大模型开发的 50 集科幻动漫,通过分布式渲染架构将单镜头生成耗时压缩至 10 秒级。该系统突破性解决长视频时序错位难题,并实现 16K 电影级画质输出与 AI 导演运镜方案生成。

2025年03月18日
xAI全资收购生成式AI企业Hotshot 强化视频生成领域技术布局

马斯克旗下xAI完成对视频生成企业Hotshot的全资收购,该并购将增强xAI在动态视觉生成领域的技术储备。Hotshot的时空一致性处理技术与xAI的工程能力结合,或推动生成式AI技术进入新阶段。

2025年03月18日
智元机器人推出通用具身基座大模型 GO-1 实现跨本体技能迁移

智元机器人发布通用具身基座大模型 GO-1,通过 ViLLA 创新架构首次实现跨本体技能迁移能力,其双通道数据处理架构显著提升机器人执行效率。该模型支持七类设备平台快速移植能力,为具身智能规模化落地提供技术基座。

2025年03月11日
乐聚机器人发布智能讲解人形机器人,专为展厅场景打造

乐聚机器人推出了一款专为展厅场景设计的“智能讲解”人形机器人,支持多语言、全展区导航、障碍识别等功能。该机器人搭载可训练大模型,提供个性化讲解服务,并能全天候运行。

2024年11月14日
2024全球机器学习技术大会即将举行:多模态与智能体成焦点

2024全球机器学习技术大会将于11月14-15日在北京盛大开幕,汇聚顶尖AI专家和行业精英,共同探讨智能体、多模态、代码大模型等前沿话题。比尔·盖茨预测未来软件应用数量将大幅减少,此次大会将展现AI技术如何重塑软件市场。

2024年11月11日
OpenAI推出支持结构化输出的模型API,推动AI开发精准控制

OpenAI最新发布的模型API全面支持结构化输出,使开发者能够精确控制AI模型的输出格式,确保数据准确性。JSON Schema匹配率达100%,大幅简化开发流程。

2024年08月14日
中电信推出星辰软件工厂,打造全自动AI开发工具

中电信人工智能科技有限公司与中国电信人工智能研究院发布了星辰软件工厂,这款创新的AI开发工具通过多模态大模型技术,实现自动生成代码、自主测试和纠错,形成全自动软件开发流程。用户只需提供产品文档,即可一键生成、部署并上线软件。

2024年07月10日