DIGIPUNK
去投稿
发表于:2024年08月21日

科大讯飞发布星火极速超拟人交互,挑战GPT-4o语音功能

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
要点速达👈
  • 🔥 科大讯飞推出星火极速超拟人交互,对标GPT-4o。
  • 🎙️ 具备随时打断、情绪感知、方言切换等超拟人功能。
  • ⏩ 采用端到端建模,大幅提升响应速度和交互流畅度。
  • 🎭 语音属性解耦训练,实现内容、音色、情感等灵活控制。
  • 🔜 8月底向全民开放,用户将可体验超拟人语音交互。

数智朋克消息,科大讯飞股份有限公司近日发布了其最新语音大模型更新,推出对标GPT-4o的语音功能产品——星火极速超拟人交互。这款产品不仅在响应速度上有显著提升,还能实现更高拟人度的交互体验,堪称科大讯飞在语音技术领域的一次重大突破。

星火极速超拟人交互产品的最大亮点在于其高度灵活的交互能力,用户可以随时打断系统发言,并在插话后实时获得回复。同时,该产品还能感知用户的情绪变化,根据对话情境自动调整语调、方言、情感强度,甚至模仿不同角色进行交流。相比传统的语音转文字再生成回复文本的过程,星火极速超拟人通过统一神经网络实现了语音到语音的端到端建模,显著缩短了响应时间,提升了交互的流畅度。

科大讯飞还采用了多维度的语音属性解耦表征训练准则,使得星火极速超拟人能够将内容、音色、情感、语言和风格等元素独立控制,用户可以根据需求对这些元素进行便捷定制。这种灵活性不仅提高了产品的适应性,还为快速落地应用提供了可能。

据科大讯飞透露,星火极速超拟人交互将在8月底向全民开放,用户将能够亲身体验这一超拟人化的语音交互功能。而在今年5月,OpenAI发布了GPT-4o,展示了接近电影《Her》中的人机交互体验,但目前仍只开放了部分语音功能给少数测试者。科大讯飞的此举,显然是在这一领域向GPT-4o发起挑战。

本文链接: https://www.shuzhipunk.com/articles/V8pC6OsLgSb
转载请注明文章出处

文章所属标签
科大讯飞
星火极速超拟人
GPT-4o
语音交互