核心要点👉
- 🚀 模型采用混合专家架构,总参数量800亿,推理时仅激活30亿参数
- 📊 在SWE-Bench测试中问题解决率超70%,性能超越更大模型
- 🔄 训练过程强调与真实环境交互,边干边学
- 💻 开源基座和指令微调版本,免费供商业使用
- ⚙️ 轻量化激活特性,可集成IDE插件等开发环境
阿里近日向全球开发者社区公开了其新一代智能体编程模型Qwen3-Coder-Next,该模型专为编程智能体及本地开发场景设计,采用了创新的混合专家架构。尤为引人注目的是,尽管模型总参数量达到800亿,但在每次推理时仅需激活30亿参数,这一设计大幅降低了对计算资源和显存的需求,使得在普通家用电脑或轻量级服务器上进行部署成为可能。
性能表现方面,该模型在SWE-Bench Verified等权威编程智能体基准测试中展现出了竞争力。利用SWE-Agent框架,其问题解决率超过了70%,并且在更具挑战性的多语言SWE-Bench-Pro测试中,其性能表现超越了包括DeepSeek-V3.2在内的多个激活参数量更大的开源模型。这意味着,仅以极小的激活参数量,它就能实现与激活参数量为其10至20倍的模型相匹敌的基准性能。
实现这一突破的关键在于其独特的训练范式。与依赖静态文本数据进行训练的常规方法不同,Qwen3-Coder-Next的训练过程强调与真实可执行环境的交互。通过让模型在大规模可验证的编程任务中进行“边干边学”,直接从环境反馈中获取学习信号,模型得以掌握处理长上下文推理、复杂工具使用以及从执行失败中恢复等现实编程挑战的核心能力。
目前,阿里已经开源了该模型的基座版本和指令微调版本,供研究、评估及商业用途免费使用。得益于其轻量化的激活特性,该模型能够灵活集成到多种开发环境中,例如作为IDE插件辅助代码生成与修复,或构建为命令行智能体来管理项目任务,为开发者和企业提供了低成本、高效率的智能体编程解决方案。







粤公网安备44030002001270号