DIGIPUNK
去投稿
发表于:2026年01月06日

中国电信AI研究院开源星辰语义大模型TeleChat3系列

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🚀 模型发布:中国电信AI研究院开源星辰语义大模型TeleChat3系列,包含混合专家和稠密架构模型。
  • 🏗️ 训练基础:全程依托上海临港国产计算基础设施,使用15T tokens预处理数据完成训练。
  • 💡 推理创新:集成独创Thinking推理机制,通过触发标记显式展示逻辑推演过程。
  • 📈 性能提升:显著优化知识问答、数学演算等六大维度表现,达到国际主流水准。
  • 💻 技术兼容:与昇腾Atlas 800T A2服务器及昇思MindSpore框架全面适配,代码和权重已开源。

数智朋克讯,中国电信人工智能研究院正式向开源社区释出星辰语义大模型TeleChat3系列,该系列包含采用混合专家架构的千亿参数模型TeleChat3-105B-A4.7B-Thinking及稠密架构的TeleChat3-36B-Thinking。这两款模型全程依托上海临港国产计算基础设施完成训练,使用了规模达15T tokens的预处理数据。

值得关注的是,全系列模型均集成独创的Thinking推理机制,通过在对话模板中植入特定触发标记,使模型能够显式展示逻辑推演过程。这种设计显著提升了模型在知识问答、数学演算、创意生成、代码编写、智能体协作及指令理解六大核心维度的表现水准,达到国际主流模型水准

目前整套技术栈已完成与昇腾Atlas 800T A2训练服务器及昇思MindSpore框架的全面兼容适配,相关代码库与模型权重已在主流开源平台开放获取。

本文链接: https://www.shuzhipunk.com/articles/I8uTxfHtIyj
转载请注明文章出处

文章所属标签
星辰语义大模型
TeleChat3
Thinking推理机制
昇腾Atlas
MindSpore框架