OpenAI 发布包含标准版、mini 和 nano 的 GPT-4.1 系列,全系支持百万 token 量级文本处理,推理成本降低 26%。新系列在代码生成准确率提升 18.7%,并启动 GPT-4.5 模型的 API 接口过渡计划。
OpenAI 最新 GPT-4o 模型针对不同用户群体实施差异化水印策略,非付费用户生成图像将嵌入隐形标识,ChatGPT Plus 订阅者享有无痕输出权限。技术升级后的数字水印具备抗压缩、跨平台追踪特性,同时平衡商业价值与技术伦理,或成行业新基准。
OpenAI 通过 GPT-4o 实现生成式 AI 领域首个端到端多模态集成,用户无需切换模型即可在对话中生成自定义图像。该系统已向全量用户开放,并与 Sora 视频平台形成技术协同。
OpenAI 推出 1750 亿参数的 GPT-4.5 模型,率先向付费订阅用户开放访问并集成微软 Azure 平台。该模型在多轮对话场景实现 97% 需求捕捉准确率,但相较 STEM 专用模型存在 12% 效能差距,商业化部署采用梯度定价机制并新增智能积分系统。
OpenAI 宣布 ChatGPT 免费用户现已支持 Advanced Voice 语音交互系统,新增九种定制音色与屏幕共享解析功能。欧盟地区暂未开放访问,视频对话 beta 版计划第二季度向 Plus 用户推出。
OpenAI首席执行官Sam Altman透露,GPT-5将在未来几个月内发布,集成更多技术进步,同时GPT-4.5将作为过渡版本发布,标志着非思维链模型的逐步淘汰。
OpenAI最新发布的O1-full和O1-pro版本不仅强化了编程能力,还引入了图像输入功能和更新后的视觉语言模型(VLM)。未来,OpenAI可能通过多Agent体系、Sora图像生成技术及GPT-4.5等多项技术创新,进一步拓展AI应用边界。
微软近期宣布,将Azure OpenAI服务中的GPT-4o与LlamaParse Premium以及Azure AI Search紧密整合,推动了大规模AI解决方案的企业级应用。该创新不仅增强了搜索和数据解析能力,为企业提供了更高效的智能化工具,助力其业务创新。
Nvidia发布多模态大型语言模型NVLM 1.0,展示了在视觉语言与文本任务上的强大表现,特别是在OCR和自然图像理解方面。该模型权重与程序代码已开源,性能接近GPT-4o和Llama 3-V。
OpenAI 可能会在 9 月 24 日正式发布 ChatGPT 的高级语音模式,该功能此前仅对部分 Plus 用户开放。代码中的日期提示及 FAQ 页面更新均暗示将有更多用户受邀体验这一功能。