DIGIPUNK
去投稿
发表于:13 hours ago

月之暗面推出万亿参数Kimi K2模型并开源MoE架构

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🚀 万亿参数MoE架构:总参数量1T,含384专家模型,每次激活8个
  • 🏆 基准测试领先:SWE Bench 65.8%、LiveCodeBench 53.7%、MATH-500 97.4%
  • 🤖 强大Agent能力:支持自主编程/工具调用,实现行程规划/旅游攻略生成
  • ⚡ MuonClip优化器:替代Adam方案,确保万亿参数训练零中断
  • 💰 明确API定价:输入tokens每百万4元,输出tokens每百万16元

数智朋克讯月之暗面近日正式推出Kimi K2模型,同步开源这一万亿参数MoE架构基础模型。总参数量达1T,激活参数为32B,采用混合专家设计,包含384个专家模型,每次推理仅激活其中8个。模型分为Kimi-K2-BaseKimi-K2-Instruct两个版本,前者适用于科研场景,后者优化了问答与智能体任务表现。

在关键基准测试中,Kimi K2展现领先性能SWE Bench Verified达到65.8%准确率LiveCodeBench录得53.7%MATH-500则高达97.4%,超越DeepSeek-V3和阿里Qwen3等开源竞品。其Agent能力尤为突出,支持自主编程、工具调用和多步推理,例如自动规划Coldplay巡演行程,完成机票酒店预订、生成日历及HTML行程摘要;实际测试中,根据用户需求生成日本旅游攻略,涵盖餐厅推荐、景点细节及实用贴士,尽管初期HTML输出略显粗糙。

技术创新聚焦MuonClip优化器,替代传统Adam方案,确保万亿参数训练全程零中断,显著提升token处理效率。API服务已上线,兼容OpenAI与Anthropic格式,支持128K上下文,定价设定为每百万输入tokens收费4元,输出tokens收费16元

面对2025年市场竞争加剧,月之暗面用户增长放缓,此次开源策略被视为差异化突围手段。Perplexity CEO公开称赞模型潜力,金山云等企业已接入应用。模型在零售、航空场景的Tau2测试中表现卓越,电信领域得分65.8%,验证其复杂任务处理能力。实际案例还包括分析13万行薪资数据生成可视化图表,以及一键构建期货交易界面,凸显工业级实用性。

本文链接: https://www.shuzhipunk.com/articles/AmaCTug20U4
转载请注明文章出处

文章所属标签
Kimi K2
万亿参数
MoE架构