来自

阿里通义推出下一代基础模型架构Qwen3-Next并开源80B-A3B系列模型

阿里通义团队发布全新基础模型架构Qwen3-Next，同步开源基于该架构的Qwen3-Next-80B-A3B系列模型。新架构针对上下文长度扩展与参数扩展深度优化，通过混合注意力机制与极致稀疏MoE方案实现训练推理双重突破。

2025年09月13日

阿里巴巴通义万相Wan2.2视频生成模型升级，引入MoE架构并开源三款模型

阿里巴巴开源的通义万相Wan2.2视频生成模型引入MoE架构，节省50%计算资源并新增电影美学控制系统。开源的三款模型支持高清视频生成，其中TI2V-5B可在消费级显卡快速处理高清视频。

2025年07月29日

月之暗面推出万亿参数Kimi K2模型并开源MoE架构

数智朋克获悉月之暗面正式推出万亿参数Kimi K2模型并开源其MoE架构，该模型在多项基准测试中超越主流开源竞品。技术创新聚焦MuonClip优化器，API服务已上线并兼容主流格式，定价明确

2025年07月15日

DeepSeek-V3：突破性MoE语言模型，解锁AI新时代

猎户星空发布Orion-MoE8×7B大模型，推动AI技术与数据服务落地

猎户星空近日发布的Orion-MoE8×7B大模型，结合生成式混合专家架构，具备多语言处理能力，表现出色。与聚云科技合作推出的AI数据宝平台进一步助力大模型商业化，推动企业AI应用突破。

2024年11月29日

DeepSeek发布第二代MoE大模型，性能直逼GPT-4Turbo

幻方量化旗下AI公司DeepSeek发布全新第二代MoE大模型DeepSeek-V2。该模型性能接近GPT-4Turbo，具备2360亿参数，每token激活210亿参数，支持128K上下文长度，成本显著降低。

2024年05月13日

APUS与新旦智能开源千亿级MoE大模型

APUS携手新旦智能，在GitHub上正式开源千亿参数级别的MoE（Mixture of Experts）架构大模型，标志着国内首个此规模的MoE架构模型的诞生。

2024年04月02日

DIGIPUNK AIGC社群

联系我们加入我们

商务合作我要投稿

解决方案媒体矩阵

Copyright © 2023-2024 DIGIPUNK LTD.