开源创新
微软发布的OmniParser v2.0,作为其原始版本的升级版,带来了性能和精度的显著提升。通过支持更多交互元素的解析和优化的处理速度,它使得视觉代理能够更加高效地执行任务,尤其是在复杂的UI界面中。OmniParser v2.0不仅增强了跨平台应用支持,还简化了开发者的使用流程,为AI开发带来了新的突破。
微软正式开源 OmniParser,突破现有 AI 在复杂图形用户界面(GUI)识别中的局限性。该工具无需依赖 HTML 等基础数据,直接识别屏幕交互元素,极大提升了视觉解析的精准度。