核心要点👉
- 🏗️ 跨行业术语解析能力覆盖家装、畜牧等垂直领域专业词汇
- 🔍 动态语境理解机制融合钉钉通讯录/日程等上下文数据
- 🛠️ 提供定制化训练接口支持企业私有化部署
- ⚡ 项目落地仅耗时三个月获多家头部企业验证
- 🔄 推进方言适配/噪声鲁棒性/多语言支持迭代升级
数智朋克讯,钉钉与通义实验室语音团队联合发布Fun-ASR语音识别大模型,该模型具备跨行业术语解析能力,覆盖家装、畜牧等垂直领域专业词汇。基于上亿小时真实场景音频训练,模型通过企业实际应用数据持续优化,显著提升对品牌名称、项目代号等专属词汇的识别精度。
Fun-ASR创新性融合钉钉生态数据资源,在获得企业授权后,可调用通讯录、日程安排及知识库等上下文信息进行联合推理。这种动态语境理解机制有效抑制了大模型常见的信息失真现象,确保语音转写结果与企业实际业务高度契合。
针对差异化需求,该模型提供定制化训练接口。企业可基于自身场景的语音样本,通过端到端架构对模型参数进行定向优化。这种私有化部署方案已在钉钉会议字幕、实时同声传译、智能会议纪要及语音交互助手等核心功能模块完成集成。
通义实验室语音团队负责人李先刚强调,此次合作聚焦企业级语音智能解决方案的可复制性拓展,后续将持续扩充模型规模与训练数据池。钉钉CTO朱鸿则指出,项目从启动到落地仅耗时三个月,其高效协作模式为行业定制化大模型提供了可行性范式,当前已获得多家头部企业场景验证。
技术团队正在推进方言适配、噪声环境鲁棒性强化、多语言支持等方向的迭代升级,以延伸该语音识别基座在复杂企业环境中的适用边界。