核心要点👉
- 🚀 模型发布:中国电信AI研究院开源星辰语义大模型TeleChat3系列,包含混合专家和稠密架构模型。
- 🏗️ 训练基础:全程依托上海临港国产计算基础设施,使用15T tokens预处理数据完成训练。
- 💡 推理创新:集成独创Thinking推理机制,通过触发标记显式展示逻辑推演过程。
- 📈 性能提升:显著优化知识问答、数学演算等六大维度表现,达到国际主流水准。
- 💻 技术兼容:与昇腾Atlas 800T A2服务器及昇思MindSpore框架全面适配,代码和权重已开源。
数智朋克讯,中国电信人工智能研究院正式向开源社区释出星辰语义大模型TeleChat3系列,该系列包含采用混合专家架构的千亿参数模型TeleChat3-105B-A4.7B-Thinking及稠密架构的TeleChat3-36B-Thinking。这两款模型全程依托上海临港国产计算基础设施完成训练,使用了规模达15T tokens的预处理数据。
值得关注的是,全系列模型均集成独创的Thinking推理机制,通过在对话模板中植入特定触发标记,使模型能够显式展示逻辑推演过程。这种设计显著提升了模型在知识问答、数学演算、创意生成、代码编写、智能体协作及指令理解六大核心维度的表现水准,达到国际主流模型水准。
目前整套技术栈已完成与昇腾Atlas 800T A2训练服务器及昇思MindSpore框架的全面兼容适配,相关代码库与模型权重已在主流开源平台开放获取。







粤公网安备44030002001270号