DIGIPUNK
去投稿

微软推出开源工具 OmniParser,优化复杂用户界面交互解析

微软正式开源 OmniParser,突破现有 AI 在复杂图形用户界面(GUI)识别中的局限性。该工具无需依赖 HTML 等基础数据,直接识别屏幕交互元素,极大提升了视觉解析的精准度。

2024年10月30日