钉钉联合通义实验室发布Fun-ASR语音识别大模型

核心要点👉

数智朋克讯，钉钉与通义实验室语音团队联合发布Fun-ASR语音识别大模型，该模型具备跨行业术语解析能力，覆盖家装、畜牧等垂直领域专业词汇。基于上亿小时真实场景音频训练，模型通过企业实际应用数据持续优化，显著提升对品牌名称、项目代号等专属词汇的识别精度。

Fun-ASR创新性融合钉钉生态数据资源，在获得企业授权后，可调用通讯录、日程安排及知识库等上下文信息进行联合推理。这种动态语境理解机制有效抑制了大模型常见的信息失真现象，确保语音转写结果与企业实际业务高度契合。

针对差异化需求，该模型提供定制化训练接口。企业可基于自身场景的语音样本，通过端到端架构对模型参数进行定向优化。这种私有化部署方案已在钉钉会议字幕、实时同声传译、智能会议纪要及语音交互助手等核心功能模块完成集成。

通义实验室语音团队负责人李先刚强调，此次合作聚焦企业级语音智能解决方案的可复制性拓展，后续将持续扩充模型规模与训练数据池。钉钉CTO朱鸿则指出，项目从启动到落地仅耗时三个月，其高效协作模式为行业定制化大模型提供了可行性范式，当前已获得多家头部企业场景验证。

技术团队正在推进方言适配、噪声环境鲁棒性强化、多语言支持等方向的迭代升级，以延伸该语音识别基座在复杂企业环境中的适用边界。

数智资讯订阅