核心要点👉
- 🚀 原生支持300轮自主操作,基于'模型即Agent'理念
- 🏆 BrowseComp测试60.2%超越人类,刷新SOTA记录
- 🔄 动态循环实现问题分解(思考/搜索/浏览/编程)
- 💻 SWE-Multilingual验证多语言编码能力提升
- 🌟 创意写作/学术研究/情感回应三大基础能力升级
数智朋克讯,月之暗面正式推出开源思考模型Kimi K2 Thinking,标志着其在人工智能领域的又一突破。该模型基于'模型即Agent'理念,原生融合工具调用与多轮思考能力,无需人工干预即可执行高达300轮的自主操作。Humanity's Last Exam基准测试中,Kimi K2 Thinking以44.9%的成绩刷新SOTA水平,BrowseComp网络浏览测试更以60.2%超越人类平均表现,展现出在复杂信息环境中的钻研力。
通过上百轮的动态循环——思考、搜索、浏览网页、再思考及编程——模型能分解开放式问题为可执行子任务,实现逻辑一致的推理。编码能力同样提升,SWE-Multilingual和SWE-bench验证集测试结果证实了其多语言软件工程优势。通用基础能力升级显著:创意写作方面,模型将灵感转化为生动叙述,保持风格连贯;学术研究中,分析深度与逻辑结构增强;个人情感回应则更富同理心,提供细致建议。
开源部署已通过Hugging Face和ModelScope平台提供。







粤公网安备44030002001270号