DIGIPUNK
去投稿
发表于:4 hours ago

月之暗面推出开源思考模型Kimi K2 Thinking,AI领域实现技术突破

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🚀 原生支持300轮自主操作,基于'模型即Agent'理念
  • 🏆 BrowseComp测试60.2%超越人类,刷新SOTA记录
  • 🔄 动态循环实现问题分解(思考/搜索/浏览/编程)
  • 💻 SWE-Multilingual验证多语言编码能力提升
  • 🌟 创意写作/学术研究/情感回应三大基础能力升级

数智朋克讯,月之暗面正式推出开源思考模型Kimi K2 Thinking,标志着其在人工智能领域的又一突破。该模型基于'模型即Agent'理念,原生融合工具调用与多轮思考能力,无需人工干预即可执行高达300轮的自主操作。Humanity's Last Exam基准测试中,Kimi K2 Thinking以44.9%的成绩刷新SOTA水平,BrowseComp网络浏览测试更以60.2%超越人类平均表现,展现出在复杂信息环境中的钻研力。

通过上百轮的动态循环——思考、搜索、浏览网页、再思考及编程——模型能分解开放式问题为可执行子任务,实现逻辑一致的推理。编码能力同样提升,SWE-MultilingualSWE-bench验证集测试结果证实了其多语言软件工程优势。通用基础能力升级显著:创意写作方面,模型将灵感转化为生动叙述,保持风格连贯;学术研究中,分析深度与逻辑结构增强;个人情感回应则更富同理心,提供细致建议。

开源部署已通过Hugging FaceModelScope平台提供。

本文链接: https://www.shuzhipunk.com/articles/4zX6mMJLoqK
转载请注明文章出处

文章所属标签
Kimi K2 Thinking
模型即Agent
开源模型
多轮思考
基准测试