DIGIPUNK
去投稿

OpenAI推出gpt-realtime语音模型,开启语音AI代理新阶段

OpenAI发布端到端语音模型gpt-realtime,显著降低响应延迟并整合多模态能力。该模型在语音质量、智能理解、API支持及安全合规等方面实现全面升级,适用于多领域场景。

20 hours ago
豆包发布实时语音大模型,提升语音交互流畅度与表现力

豆包APP正式推出其实时语音大模型,突破传统模式,带来更流畅的语音对话体验。该技术通过端到端的语音生成与理解,优化了语音控制力和情绪承接,解决了语音延迟和打断问题。

2025年01月21日