大模型之家讯 近日,昆仑万维Skywork与新加坡南洋理工大学联合发布多智能体协作框架 AgentOrchestra,并开放了完整代码与技术报告。该系统以“分层指挥、多智能体协同”为核心结构,在多个国际通用智能评测中表现优异,展现出向通用人工智能(AGI)演进的重要潜力。

大型语言模型(LLMs)在理解与生成方面取得突破,但在面对需要多步骤推理、工具调用、多模态整合等复杂任务时,仍面临泛化能力有限、执行流程僵化、扩展性受限等结构性瓶颈。AgentOrchestra 正是针对这些长期存在的系统性问题,提出了“智能体交响乐团”式的协作范式。
在这一框架中,不同功能的智能体被抽象为“乐手”,顶层由“指挥”智能体统筹全局策略与任务拆解。各类子智能体根据任务需求进行动态分工与联动,系统整体具备更强的弹性、适应性和模块化扩展能力。
AgentOrchestra 采用分层架构,顶层的 Planning Agent 负责规划与调度,底层则由三类子智能体承担任务执行:信息检索智能体(Deep Researcher Agent)、网页交互智能体(Browser Use Agent)、多模态分析智能体(Deep Analyzer Agent)。三者分别处理数据收集、操作执行与复杂推理分析等任务,构建起完整的“任务解决闭环”。

这一设计不仅支持自然语言理解与结构化交互,还可无缝调用网页浏览、PDF解析、代码执行等多种工具。系统通过标准化接口(如 OpenAI Function Calling 与 JSON 调用)实现不同智能体之间的高效协作,并具备支持本地和云端多模型部署的能力,涵盖从商业模型(如 GPT-4、Claude)到开源模型(如 Qwen2.5)的自由切换。
在基础架构层面,AgentOrchestra 引入异步协程调度机制,使各智能体可并发运行,显著提升处理效率和系统吞吐率。此外,其兼容 Anthropic MCP 协议,具备良好的安全性与上下文适配能力。

为了验证其实用性和通用能力,研究团队将 AgentOrchestra 应用于多个权威评测任务中,包括 SimpleQA、GAIA 与 HLE 等。在 GAIA validation 数据集中,其 pass@1 得分达到 82.42,显著优于多个当前主流系统。在 HLE 评测中,其综合表现超越了包括 Perplexity Deep Research 等竞品系统,显示出在开放任务环境下的出色泛化能力与系统协同效率。
这些结果从多个维度验证了多智能体系统在处理复杂任务时的协同优势,也进一步印证了“交响式架构”在推进通用智能方面的实际可行性。
从智能系统的发展趋势来看,AgentOrchestra 的意义不仅仅在于其当前取得的技术成果,更在于提出了一种可推广、可扩展的智能体协作范式。通过模块化设计与分工协作机制,它有效突破了单一模型在认知和执行上的能力边界,为构建更大规模、更强自适应能力的智能系统提供了实践路径。
AgentOrchestra 的论文和代码已对外开放,有望加速该方向在学术界与产业界的双向共建。随着昆仑万维 Skywork 团队持续推进相关研究,该系统的多模态扩展、自适应调度机制以及专业化智能体体系将进一步演化,推动通用人工智能从理念走向可用实践。
参考资料:
论文地址:https://arXiv:2506.12508
项目代码:https://github.com/SkyworkAI/DeepResearchAgent
原创文章,作者:志斌,如若转载,请注明出处:http://www.damoai.com.cn/archives/11385