大模型之家讯 近日,阿里巴巴正式发布第三代GUI智能体框架Mobile-Agent-v3,同时开源了多模态跨平台GUI虚拟层模型GUI-Owl。这款基于GUI-Owl构建的跨平台多智能体框架专门针对图形用户界面自动化而设计,其覆盖范围横跨移动设备和桌面操作系统的各个角落。框架的核心使命是通过高度智能化的任务分解、精准规划与高效执行,实现真正意义上的跨应用程序无缝操作。
目前,这一技术组合已经在超过10项权威GUI基准测试中展现了令人瞩目的卓越性能,特别是在AndroidWorld和OSWorld这两个业界公认的权威测试平台上,分别创下了73.3%和37.7%的惊人成功率记录,一举达到当前行业的最高水准。