DIGIPUNK
去投稿
发表于:2025年02月26日

OpenAI全球免费用户开放GPT-4o语音功能 新增视觉交互与教育解析能力

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🚀 Advanced Voice支持50+语言实时对话,响应速度提升40%
  • 🌐 全球免费用户开放(欧盟/北欧地区暂除外)
  • 📈 教育场景数学解析准确率92%含可视化推导
  • 👁️ 屏幕共享可实时识别物体生成操作指导
  • 📅 Q2将推视频对话beta版含3D建模功能

数智朋克获悉,OpenAI宣布其基于GPT-4o mini开发的Advanced Voice功能已向全球ChatGPT免费用户开放。该语音系统支持50余种语言实时对话,响应速度较前代提升40%,每日提供三次累计不超过15分钟的语音交互额度,用户可通过移动端和网页端体验九种定制音色。

在视觉交互领域,新版本整合的屏幕共享解析功能表现亮眼。测试显示,系统可实时识别用户拍摄的咖啡器具并生成手冲步骤动态指导。教育场景应用中,对数学应用题的多模态解析准确率达到92%,支持通过语音分步讲解与可视化公式推导辅助学习。

目前欧盟及北欧地区用户暂无法访问新功能,OpenAI表示正与当地监管部门协商合规方案。据工程团队透露,计划在第二季度推出视频对话beta版,届时Plus用户将率先体验实时场景分析和3D建模指导等进阶功能。

本文链接: https://www.shuzhipunk.com/articles/8raFezfIgdu
转载请注明文章出处

文章所属标签
GPT-4o mini
语音交互
多模态解析