中国电信AI研究院开源星辰语义大模型TeleChat3系列

核心要点👉

🚀 模型发布：中国电信AI研究院开源星辰语义大模型TeleChat3系列，包含混合专家和稠密架构模型。
🏗️ 训练基础：全程依托上海临港国产计算基础设施，使用15T tokens预处理数据完成训练。
💡 推理创新：集成独创Thinking推理机制，通过触发标记显式展示逻辑推演过程。
📈 性能提升：显著优化知识问答、数学演算等六大维度表现，达到国际主流水准。
💻 技术兼容：与昇腾Atlas 800T A2服务器及昇思MindSpore框架全面适配，代码和权重已开源。

数智朋克讯，中国电信人工智能研究院正式向开源社区释出星辰语义大模型TeleChat3系列，该系列包含采用混合专家架构的千亿参数模型TeleChat3-105B-A4.7B-Thinking及稠密架构的TeleChat3-36B-Thinking。这两款模型全程依托上海临港国产计算基础设施完成训练，使用了规模达15T tokens的预处理数据。

值得关注的是，全系列模型均集成独创的Thinking推理机制，通过在对话模板中植入特定触发标记，使模型能够显式展示逻辑推演过程。这种设计显著提升了模型在知识问答、数学演算、创意生成、代码编写、智能体协作及指令理解六大核心维度的表现水准，达到国际主流模型水准。

目前整套技术栈已完成与昇腾Atlas 800T A2训练服务器及昇思MindSpore框架的全面兼容适配，相关代码库与模型权重已在主流开源平台开放获取。

中国电信AI研究院开源星辰语义大模型TeleChat3系列

数智资讯订阅