大模型之家讯 2025年8月14日,昆仑万维正式发布Skywork Deep Research Agent v2,这是天工超级智能体(Skywork Super Agents)的核心引擎。自2025年5月22日Skywork Deep Research Agent上线以来,该产品已在AI办公(AI Office)领域中承担了大量信息处理和文档生成任务。新版v2在多模态处理、浏览器智能体能力以及复杂任务执行方面进行了显著升级。

多模态深度调研首次整合检索、理解与生成
行业内现有的深度调研Agent通常依赖网页文本检索,而忽略了图文混排信息——如财报图表、论文实验图、社交媒体对比图和流程图等。昆仑万维此次推出的多模态深度调研功能,将文字、图片等多模态信息的检索、理解与跨模态生成整合于同一流程中。

技术实现方面,Skywork团队开发了多模态爬取技术(MM-Crawler)、长距离多模态信息收集机制、异步并行Multi-Agent理解架构,以及多模态结果呈现能力。这些技术使得研究人员在生成文档时能够获得信息完整、节奏顺畅且视觉友好的报告,支持将图片直接用于交付物或转化为文字和图表,以降低阅读理解成本。

多模态深度浏览器智能体推动社交媒体分析
Skywork Browser Agent是另一项关键升级,旨在提升传统浏览器在低延迟、高任务完成度和决策灵活性方面的能力。其技术优化包括DOM+视觉推理方案、多平台适配、并行搜索、多动作规划、智能筛选以及隐私与安全保障。
该智能体能够模拟人类浏览行为,实现社交媒体内容的多模态分析,自动生成数据分析报告,并可将抓取的图片与内容一键部署为独立网页。用户可在工作流中与文档生成智能体协同使用,从而提升信息检索和办公效率。Skywork Browser Agent目前处于内测阶段,预计近期将全面开放给skywork.ai用户。
提升复杂任务执行能力,多项评测达SOTA水平

为了增强Agent在复杂任务中的信息检索、整理与总结能力,Skywork Deep Research Agent v2引入了高质量数据合成与训练、端到端强化学习、并行推理以及多智能体自我学习演进机制。在权威评测榜单BrowseComp上,其常规模式正确率为27.8%,启用“并行思考”模式后升至38.7%,刷新行业纪录。在GAIA Test基准上也取得SOTA成绩,显示其在复杂任务中的综合实力。

技术层面,Skywork v2的核心改进包括:高质量数据生成与迭代式问题增强、基于非对称验证的强化学习训练、异步并行推理框架以及多智能体演进Agent机制。并行思考机制支持多路径推理和内部排序筛选最优解,熵自适应剪枝则提升了计算效率。多智能体演进系统能够在任务执行中动态生成、复用工具,减少人工维护负担,并提升多任务协作效率。


Skywork Deep Research Agent v2已在skywork.ai的多种Deep Research场景中上线,全球用户可通过官网(https://skywork.ai)或中国官网(https://tiangong.cn)注册使用。同时,开发者可在官方GitHub(https://github.com/SkyworkAI/Skywork-DeepResearch)申请API预览。
原创文章,作者:志斌,如若转载,请注明出处:http://www.damoai.com.cn/archives/12331