昆仑万维发布Skywork Deep Research Agent v2，聚焦多模态深度调研与复杂任务能力

志斌 • 2025年8月14日下午4:55 • 人工智能

大模型之家讯 2025年8月14日，昆仑万维正式发布Skywork Deep Research Agent v2，这是天工超级智能体（Skywork Super Agents）的核心引擎。自2025年5月22日Skywork Deep Research Agent上线以来，该产品已在AI办公（AI Office）领域中承担了大量信息处理和文档生成任务。新版v2在多模态处理、浏览器智能体能力以及复杂任务执行方面进行了显著升级。

昆仑万维发布Skywork Deep Research Agent v2，聚焦多模态深度调研与复杂任务能力

多模态深度调研首次整合检索、理解与生成

行业内现有的深度调研Agent通常依赖网页文本检索，而忽略了图文混排信息——如财报图表、论文实验图、社交媒体对比图和流程图等。昆仑万维此次推出的多模态深度调研功能，将文字、图片等多模态信息的检索、理解与跨模态生成整合于同一流程中。

技术实现方面，Skywork团队开发了多模态爬取技术（MM-Crawler）、长距离多模态信息收集机制、异步并行Multi-Agent理解架构，以及多模态结果呈现能力。这些技术使得研究人员在生成文档时能够获得信息完整、节奏顺畅且视觉友好的报告，支持将图片直接用于交付物或转化为文字和图表，以降低阅读理解成本。

多模态深度浏览器智能体推动社交媒体分析

Skywork Browser Agent是另一项关键升级，旨在提升传统浏览器在低延迟、高任务完成度和决策灵活性方面的能力。其技术优化包括DOM+视觉推理方案、多平台适配、并行搜索、多动作规划、智能筛选以及隐私与安全保障。

该智能体能够模拟人类浏览行为，实现社交媒体内容的多模态分析，自动生成数据分析报告，并可将抓取的图片与内容一键部署为独立网页。用户可在工作流中与文档生成智能体协同使用，从而提升信息检索和办公效率。Skywork Browser Agent目前处于内测阶段，预计近期将全面开放给skywork.ai用户。

提升复杂任务执行能力，多项评测达SOTA水平

为了增强Agent在复杂任务中的信息检索、整理与总结能力，Skywork Deep Research Agent v2引入了高质量数据合成与训练、端到端强化学习、并行推理以及多智能体自我学习演进机制。在权威评测榜单BrowseComp上，其常规模式正确率为27.8%，启用“并行思考”模式后升至38.7%，刷新行业纪录。在GAIA Test基准上也取得SOTA成绩，显示其在复杂任务中的综合实力。

技术层面，Skywork v2的核心改进包括：高质量数据生成与迭代式问题增强、基于非对称验证的强化学习训练、异步并行推理框架以及多智能体演进Agent机制。并行思考机制支持多路径推理和内部排序筛选最优解，熵自适应剪枝则提升了计算效率。多智能体演进系统能够在任务执行中动态生成、复用工具，减少人工维护负担，并提升多任务协作效率。