百度文心 5.1 正式上线,预训练成本降至业界 6%

百度文心 5.1 正式上线,预训练成本降至业界 6%

大模型之家讯 今日,百度正式发布文心 5.1 大模型。该模型充分继承文心 5.0 知识,总参数压缩至约 1/3,激活参数压缩至约 1/2,预训练成本仅为业界同规模模型的 6%。技术层面,文心 5.1 采用分离式全异步强化学习基础技术,构建以强化学习中控为核心的分离式架构,实现控制流与数据流分离。创新性提出 Once-for-All 弹性训练框架,在弹性深度、宽度及稀疏度三个维度实现压缩与扩展,解决训推偏差及资源利用率低问题。引入 FP8 训推一致性优化及资源异构弹性调度,降低 Rollout 端到端耗时。后训练管线引入以多教师在线策略蒸馏(MOPD)为核心的四阶段流程,确保模型能力融合。

百度文心 5.1 正式上线,预训练成本降至业界 6%

性能方面,文心 5.1 在智能体、知识、推理及深度搜索领域表现突出。在τ3-bench 与 SpreadsheetBench-Verified Agent 评测中超越 DeepSeek-V4-Pro;AIME26 数学竞赛得分 99.6,仅次于 Gemini-3.1 Pro;5 月 9 日以 1223 分斩获 Arena 搜索榜全球第四、国内第一。创意写作能力接近 Gemini 3.1 Pro。在 GPQA 和 MMLU-Pro 评测中效果接近领先闭源模型。

百度文心 5.1 正式上线,预训练成本降至业界 6%

目前,文心 5.1 已通过文心一言官网、千帆大模型平台及星河社区 Playground 开放体验与 API 调用。同时,该模型将上线 ISEKAI ZERO、Mulan AI、谛听幻流等数十个创作生产 Agent 平台。作为国产大模型效价比标杆,文心 5.1 实现了参数效率与训练成本的跨越式优化,在产业端收获创作类企业及专业作家群体广泛赞誉。

原创文章,作者:志斌,如若转载,请注明出处:http://www.damoai.com.cn/archives/15542

(0)
上一篇 1天前
下一篇 23小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注