DIGIPUNK
去投稿
发表于:9 hours ago

蚂蚁集团推出万亿参数通用语言模型Ling-1T

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🚀 万亿参数规模:蚂蚁集团迄今最大规模的开源语言模型
  • ⚡ 高效性能:70.42%数学准确率,节省20%计算资源
  • 🔧 技术创新:FP8混合精度训练+128K上下文窗口
  • 🌐 多模态能力:自主完成可视化组件生成与跨平台代码转换
  • 📦 开源生态:同步开放模型权重与全球体验接口

数智朋克讯,蚂蚁集团正式推出其万亿参数通用语言模型Ling-1T,标志着蚂蚁百灵大模型Ling 2.0系列首款旗舰产品落地。该非思考型大模型成为团队迄今规模最大、能力最强的开源语言模型,全程采用FP8混合精度训练技术,支持最高128K上下文窗口。在多项复杂推理基准测试中,Ling-1T展现出突破性的性能平衡:以平均4000+ Token消耗量达成70.42%的AIME竞赛数学准确率,较Gemini-2.5-Pro节省20%计算资源的同时提升0.32个百分点精度

技术架构延续Ling 2.0设计范式,通过20T+高推理浓度语料预训练演进式思维链(Evo-CoT)技术强化模型能力。跨领域泛化表现尤为突出,在未专门训练的情况下,BFCL V3智能体工具调用任务达到70%准确率。该模型可自主完成多模态任务转换,包括将逻辑问题转化为可视化组件、生成跨平台兼容代码,以及多语种文本创作。

当前版本仍存在三项核心局限:基于GQA的注意力架构导致高推理成本,计划引入混合注意力机制优化;智能体在多轮交互与复杂工具调用方面待增强指令遵循偏差问题需通过强化式身份对齐改进。开源社区已同步开放模型权重与体验接口

本文链接: https://www.shuzhipunk.com/articles/8BlbYskVpDQ
转载请注明文章出处

文章所属标签
Ling-1T
FP8混合精度
演进式思维链
多模态任务转换
开源语言模型