DIGIPUNK
去投稿
发表于:2024年06月18日

Soul App升级“伶伦”语音大模型,实现虚拟人实时互动

数智朋克

Soul App近期上线了自研语音大模型“伶伦”的升级版,涵盖语音生成、语音识别、语音对话和音乐生成等功能。这些功能支持真实音色生成、语音DIY、多语言切换和多情感拟真人对话,显著提升了用户与虚拟人实时互动的体验。

Soul App的“伶伦”现已应用于“AI苟蛋”、狼人游戏“狼人魅影”以及新产品“异世界回响”等场景,通过技术创新推出多元社交玩法,提升用户社交效率与质量。平台利用语音传递情感和信息,增强用户互动的“情绪温度”和“陪伴感”,使语音社交成为其重要标签。

自2020年起,Soul系统启动AIGC技术研发,积累了智能对话、图像生成、语音技术和虚拟人方面的前沿技术。“伶伦”基于高质量语音数据,提供多模态互动体验,如“Soul次元歌手”和“懒人KTV”等趣味社交活动。此次升级实现了在训练数据规模和模型架构上的创新,具备更真实自然、多样性和细颗粒度的控制效果,支持吸气、喘气、笑声等副语言合成,声音效果更生动。

在实际应用中,“伶伦”显著提升了多模态互动体验,如在狼人游戏“狼人魅影”中实现实时发言和玩法交互,在“异世界回响”中提供沉浸式即时交流。新上线的“语音通话”功能,让用户体验与虚拟人的实时语音通话,提供即时AI交流和陪伴。

根据Soul发布的《2024 Z世代AIGC态度报告》,三分之一的年轻人愿意和AI成为朋友,人机互动已成新趋势。Soul App CTO陶明表示,未来将继续提升技术能力,推进AIGC技术与社交场景的深度融合,创新AI原生社交场景。

本文链接: https://www.shuzhipunk.com/articles/H5b0pXlj1fa
转载请注明文章出处

文章所属标签
大模型
Soul
虚拟人