昆仑万维发布「天工大模型4.0」o1版

志斌 • 2024年11月27日上午10:29 • 人工智能

大模型之家讯今日，昆仑万维正式宣布推出具有复杂思考推理能力的系列模型——「天工大模型4.0」o1版（Skywork o1）。作为国内首款具备中文逻辑推理能力的o1模型，Skywork o1在模型输出上内生了思考、计划、反思等能力，实现了推理能力的显著提升，标志着我国在AI领域取得了新的突破。

Skywork o1系列模型包括三款不同版本，以满足不同需求。其中，Skywork o1 Open是基于Llama 3.1 8B的开源模型，其评测指标在同生态位开源模型中大幅提升，达到了SOTA水平，并解锁了复杂数学任务。此外，Skywork o1 Lite具备完整的思考能力，尤其在数学、中文逻辑和推理类问题上表现突出，而Skywork o1 Preview则是本次发布的完整版推理模型，拥有更多样和“深度”的思考过程。

昆仑万维团队通过自研的三阶段训练方案，包括推理反思能力训练、推理能力强化学习和推理planning，成功提升了Skywork o1在逻辑推理任务上的性能。特别是，团队研发了适配分步推理强化的Skywork o1 Process Reward Model（PRM），有效捕捉复杂推理任务中间步骤和思考步骤对最终答案的影响，进一步加强了模型的推理和思考能力。

在实际测试中，Skywork o1展现出了强大的逻辑推理、自我反思和自我验证能力。无论是面对常识推理、逻辑推理、数学推理还是伦理决策问题，甚至是“弱智”逻辑陷阱问题，Skywork o1都能游刃有余地处理。其解题逻辑严谨，思考过程类似人类，充分展示了其在复杂问题分析和解答上的优势。

此次Skywork o1的发布，不仅是昆仑万维贯彻“All in AGI 与 AIGC”战略的重要举措，也是构建AI技术栈的重要一步。昆仑万维将继续秉持“实现通用人工智能，让每个人更好地塑造和表达自我”的使命，从模型层、应用层等全方位、多维度构建公司技术竞争力和生态矩阵，推动AI技术的不断进步和应用落地。

目前，Skywork o1模型及相关介绍已在Huggingface开源，欢迎广大开发者访问并了解详情。开源地址：https://tinyurl.com/skywork-o1。

原创文章，作者：志斌，如若转载，请注明出处：http://www.damoai.com.cn/archives/8041