姚顺雨谈AI下半场：从“寻找方法”到“寻找问题”，直言中国企业“爱刷榜”

在加入腾讯近一年后，腾讯首席AI科学家姚顺雨首次公开站上舞台。

这位曾提出ReAct框架、参与OpenAI Operator和Deep Research项目的研究者，很少接受采访，也极少公开表达对行业的判断。

6月5日，在腾讯云AI产业应用大会上，他与腾讯集团高级执行副总裁汤道生展开了一场长达近一小时的对话。相比产品发布，这场交流更像是一份关于AI下半场的思考备忘录。

从Agent为何成为必答题，到大模型竞争的真正壁垒，再到腾讯是否慢了的争议，姚顺雨给出了三个核心判断。

下半场的本质：从“寻找方法”到“寻找问题”

在过去几十年中，人工智能的发展主轴是“寻找方法”。研究人员会为了下围棋专门发明AlphaGo，为了翻译任务打造专有的模型。这些方法往往各成一体，无法跨越场景边界。然而，随着预训练（Pre-training）与后训练（Post-training）技术的成熟，整个行业迎来了一个极简且通用的方法论。

腾讯首席AI科学家姚顺雨

“我们现在就像是拥有了一个万能的锤子，它可以去砸任何钉子。方法论已经变得非常成熟，相反，寻找真正有价值的问题，变得越来越困难。”姚顺雨如是说。

这就是AI下半场的起点：当技术的通用化能力成为基础设施，竞争的壁垒便从“谁能制造锤子”变成了“谁拥有定义问题的权利”。

姚顺雨选择加入腾讯，正是基于对这一行业规律的洞察。他认为，在方法论见顶的阶段，决定AI最终产出价值的要素有三个：

第一是产品出口，即技术到底在哪里落地、如何为人和社会产生实际价值；

第二是环境，如果缺乏足够丰富的数字化工具与外部连接，智能体（Agent）就无法执行复杂的长链路任务；

第三是上下文（Context），无论是对企业还是个人而言，模型越来越擅长将复杂的输入转化为输出，此时最原始的输入——明白用户正在干什么、掌握企业的核心数据资产，就成了最核心的护城河。

他将腾讯AI的发展拆分为三个部分：Foundation（基础模型）、Product（产品）以及Frontier（前沿探索）。前者负责把预训练和后训练做好，中间层负责创造真实价值，而最顶层则负责探索新的研究范式和未来机会。一个健康的AI组织应该形成一个均衡的三角形，而不是只押注其中一个方向。

“中国模型爱刷榜”，真实世界才是更重要的评测

如果说关于“下半场”的讨论更多是方向判断，那么在模型研发问题上，姚顺雨则给出了更具体的观点。

在谈到模型与产品协同设计（Co-Design）时，他强调了一个问题：当前行业对于Benchmark榜单的重视程度正在被放大。

“我觉得中国（大模型公司）可能大家有个不好的倾向，就是比较喜欢刷榜。”

他同时表示，榜单本身并非毫无价值，问题在于很多Benchmark正在快速饱和，越来越难以反映真实用户需求。相比榜单分数，他更看重真实产品中的反馈。

一方面，真实世界能够暴露出很多榜单无法发现的问题。例如Hy3-Preview版本的重要目的之一，就是获取真实反馈，发现底线问题，并持续修复。

另一方面，真实用户的Prompt分布与Benchmark也完全不同。榜单里的问题通常描述清晰、边界明确，而且大多是单轮问答。但现实中用户的问题往往十分模糊，只有一两句话，并且会不断追问。这些差异最终都会影响模型训练和优化方向。

姚顺雨认为，产品和模型之间正在形成越来越紧密的反馈循环。例如元宝带来的聊天和搜索能力，不仅能够提升元宝自身体验，也能够迁移到其他产品之中。不同产品产生的数据会形成网络效应，并不断强化模型能力。

姚顺雨还在对谈中首次爆料混元3模型训练背后的“秘密”。他表示：大模型的开发在现阶段是一个极其讲求工程扎实度（Trivial Work）的过程——即重建预训练与强化学习的计算基础设施（Infra），持续丰富数据分类学（Data Taxonomy），不遗余力地提高数据质量和定义真实问题的标准。在这些决策背后，并没有现成的公式可以套用，极度考验团队在繁杂的折中（Trade-off）选择中所展现的技术品味（Taste）。

Agent成为核心方向，要把简单任务做对

作为ReAct框架提出者，以及Agent研究的重要推动者，姚顺雨认为Agent已经成为模型厂商必须投入的方向，尤其是Coding Agent。

因为当模型能够调用工具、控制文件系统并运行容器时，本质上已经具备了构建完整系统的能力。

不过，对于下一代Agent的发展，他强调的并非“更复杂”，未来竞争的关键之一，是把大量简单任务稳定地做对。

姚顺雨强调，在2026年的当下，把相对简单的任务一次性做对、做到足够鲁棒，才是企业解决Token焦虑、提升ROI最关键的破局点。模型不应该在明知走不通的错误路径上盲目尝试。

在成本这一维度上，由于国内在基础设施和工程优化上的长期积累，中国团队确实保持着全球领先的成本优势。但姚顺雨认为，下一步成本优化的战略核心，绝不是去盲目追求那些极其长尾、华而不实的复杂任务上那一两个百分点的微弱提升，而是如何用一个相对更小的模型，把那些真正高价值、高频的产业任务稳妥、高效地完成。这需要依赖模型架构的持续创新、更加长效的长文本管理能力，以及一整套坚固的基础设施Harness来提供运行保障。

产品范式的突变：从预制功能到小团队实验

作为在非AI时代打造过QQ空间、QQ秀、腾讯音乐、腾讯文档等国民级产品的“老兵”，汤道生也从产品经理的第一性原理出发，剖析了技术范式转移对产品形态和组织架构带来的颠覆。

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生

汤道生认为，无论时代如何变迁，做产品不变的底层逻辑永远是：聚焦用户需求，解决核心痛点，为客户创造可以买单的价值。而变的，是交互的逻辑与研发的流程。

在非AI时代，产品经理是通过“功能”来定义产品的。研发路径遵循着清晰的功能描述与规格说明书（Specification），通过预制好的界面、菜单和按钮，引导用户在一个相对封闭、确定性的系统里进行操作。这是一种瀑布式的、结果高度可预测的研发形态。

然而在AI时代，产品走向了开放式的服务形态。自然语言和语音成了主交互界面，这意味着产品方永远无法预知用户下一秒会输入什么。产品经理的核心工作，变成了如何充分调用模型的推理和工具调用能力，为模型提供足够的系统技能、必要的沙箱环境以及精准的上下文。

这种流程的改变，逼迫着企业内部组织架构发生根本性的重组。

做AI，腾讯慢了吗？

对话最后，一个外界最关心的问题被摆上台面：腾讯在AI上是不是慢了？

姚顺雨的回应展现了他作为科学家的冷静与宏观视角。他认为，得出“快”与“慢”的结论，取决于身处其中的人对两个底层问题的基本判断：

第一个判断：AI是一场短期的投机游戏，还是一场长期的工业革命？如今的硅谷蔓延着某种焦虑情绪，仿佛两年后所有人都要失业，世界将被单一的主宰吞噬。但腾讯的判断很明确——这是一场刚刚开始、长达数十年的长跑。今天大模型所处的阶段，像极了20世纪70年代个人电脑刚刚诞生的工业前夜，还有海量的基础设施与上层建筑等待重构，不可能会有某一个超级应用直接终结整个生态。

而第二个判断：AI的发展是一个线性的单一复制，还是一个多元的生态演进？过去几年，全行业似乎在抄同一套标准答案：从Pre-training、Post-training RL，一路卷到Coding Agent，所有人都在做高度同质化的事情。但长远来看，未来的智能化叙事一定是多元的。除了Coding Agent带来的软件生产力革命，具身智能、多模态交互等万亿级的产业空白还没有被填满。

“在一条刚刚开始的、多元化的长跑赛道上，只要你能够诚实地面对自己，能够看到真实的反馈并迅速改变，保持足够的耐心，那么过去的些许曲折都只是长跑中的步伐调整。从这个角度看，腾讯不慢。”姚顺雨说。