DIGIPUNK
去投稿

OpenAI推出gpt-realtime语音模型,开启语音AI代理新阶段

OpenAI发布端到端语音模型gpt-realtime,显著降低响应延迟并整合多模态能力。该模型在语音质量、智能理解、API支持及安全合规等方面实现全面升级,适用于多领域场景。

2025年08月29日
谷歌发布Gemini 2.0 Flash,AI竞争力进一步提升

谷歌推出Gemini 2.0 Flash,标志着其AI模型的重大升级,性能大幅超越前代,并首次支持生成图像与音频。该模型还增强了与第三方应用的整合,提升了AI在实际任务中的应用灵活性。

2024年12月13日
谷歌推新AI代理“Project Jarvis”:12月亮相,应对OpenAI竞争

谷歌正在加紧推出新AI“Project Jarvis”,旨在接管用户的浏览器,处理日常任务,计划12月预览。这一代理将搭载即将发布的Gemini下一代模型,聚焦浏览器自动化,以缩短谷歌在AI领域与OpenAI的差距。

2024年10月28日