核心要点👉
- 🚀 Advanced Voice支持50+语言实时对话,响应速度提升40%
- 🌐 全球免费用户开放(欧盟/北欧地区暂除外)
- 📈 教育场景数学解析准确率92%含可视化推导
- 👁️ 屏幕共享可实时识别物体生成操作指导
- 📅 Q2将推视频对话beta版含3D建模功能
数智朋克获悉,OpenAI宣布其基于GPT-4o mini开发的Advanced Voice功能已向全球ChatGPT免费用户开放。该语音系统支持50余种语言实时对话,响应速度较前代提升40%,每日提供三次累计不超过15分钟的语音交互额度,用户可通过移动端和网页端体验九种定制音色。
在视觉交互领域,新版本整合的屏幕共享解析功能表现亮眼。测试显示,系统可实时识别用户拍摄的咖啡器具并生成手冲步骤动态指导。教育场景应用中,对数学应用题的多模态解析准确率达到92%,支持通过语音分步讲解与可视化公式推导辅助学习。
目前欧盟及北欧地区用户暂无法访问新功能,OpenAI表示正与当地监管部门协商合规方案。据工程团队透露,计划在第二季度推出视频对话beta版,届时Plus用户将率先体验实时场景分析和3D建模指导等进阶功能。