OpenAI全球免费用户开放GPT-4o语音功能新增视觉交互与教育解析能力

核心要点👉

数智朋克获悉，OpenAI宣布其基于GPT-4o mini开发的Advanced Voice功能已向全球ChatGPT免费用户开放。该语音系统支持50余种语言实时对话，响应速度较前代提升40%，每日提供三次累计不超过15分钟的语音交互额度，用户可通过移动端和网页端体验九种定制音色。

在视觉交互领域，新版本整合的屏幕共享解析功能表现亮眼。测试显示，系统可实时识别用户拍摄的咖啡器具并生成手冲步骤动态指导。教育场景应用中，对数学应用题的多模态解析准确率达到92%，支持通过语音分步讲解与可视化公式推导辅助学习。

目前欧盟及北欧地区用户暂无法访问新功能，OpenAI表示正与当地监管部门协商合规方案。据工程团队透露，计划在第二季度推出视频对话beta版，届时Plus用户将率先体验实时场景分析和3D建模指导等进阶功能。

OpenAI全球免费用户开放GPT-4o语音功能 新增视觉交互与教育解析能力