OpenAI 最新 GPT-4o 模型针对不同用户群体实施差异化水印策略,非付费用户生成图像将嵌入隐形标识,ChatGPT Plus 订阅者享有无痕输出权限。技术升级后的数字水印具备抗压缩、跨平台追踪特性,同时平衡商业价值与技术伦理,或成行业新基准。
OpenAI 通过 GPT-4o 实现生成式 AI 领域首个端到端多模态集成,用户无需切换模型即可在对话中生成自定义图像。该系统已向全量用户开放,并与 Sora 视频平台形成技术协同。
OpenAI 宣布 ChatGPT 免费用户现已支持 Advanced Voice 语音交互系统,新增九种定制音色与屏幕共享解析功能。欧盟地区暂未开放访问,视频对话 beta 版计划第二季度向 Plus 用户推出。
微软近期宣布,将Azure OpenAI服务中的GPT-4o与LlamaParse Premium以及Azure AI Search紧密整合,推动了大规模AI解决方案的企业级应用。该创新不仅增强了搜索和数据解析能力,为企业提供了更高效的智能化工具,助力其业务创新。
Nvidia发布多模态大型语言模型NVLM 1.0,展示了在视觉语言与文本任务上的强大表现,特别是在OCR和自然图像理解方面。该模型权重与程序代码已开源,性能接近GPT-4o和Llama 3-V。
OpenAI 可能会在 9 月 24 日正式发布 ChatGPT 的高级语音模式,该功能此前仅对部分 Plus 用户开放。代码中的日期提示及 FAQ 页面更新均暗示将有更多用户受邀体验这一功能。
微软推出Microsoft 365 Copilot的最新更新,借助GPT-4o的强大性能,大幅提升响应速度与用户满意度。此次升级进一步增强了AI助理功能,推动办公智能化发展,并为国产办公软件带来挑战与机遇。
OpenAI发布新功能,允许企业客户利用自身数据微调GPT-4o模型,提升应用的精准度和效率。此举应对了企业在AI投资回报上的压力,并强化了数据安全保障。
科大讯飞发布了新一代语音功能产品——星火极速超拟人交互,具备随时打断、情绪感知、方言切换等功能,挑战GPT-4o的语音交互体验。该产品将在8月底向公众开放使用。
OpenAI发布报告,介绍了GPT-4o模型的系统卡及其核心“准备框架”,重点评估网络安全、模型自主性等领域的风险,并通过与外部红队合作加强模型的安全性。