大模型之家讯 今日,昆仑万维正式宣布推出具有复杂思考推理能力的系列模型——「天工大模型4.0」o1版(Skywork o1)。作为国内首款具备中文逻辑推理能力的o1模型,Skywork o1在模型输出上内生了思考、计划、反思等能力,实现了推理能力的显著提升,标志着我国在AI领域取得了新的突破。
Skywork o1系列模型包括三款不同版本,以满足不同需求。其中,Skywork o1 Open是基于Llama 3.1 8B的开源模型,其评测指标在同生态位开源模型中大幅提升,达到了SOTA水平,并解锁了复杂数学任务。此外,Skywork o1 Lite具备完整的思考能力,尤其在数学、中文逻辑和推理类问题上表现突出,而Skywork o1 Preview则是本次发布的完整版推理模型,拥有更多样和“深度”的思考过程。
昆仑万维团队通过自研的三阶段训练方案,包括推理反思能力训练、推理能力强化学习和推理planning,成功提升了Skywork o1在逻辑推理任务上的性能。特别是,团队研发了适配分步推理强化的Skywork o1 Process Reward Model(PRM),有效捕捉复杂推理任务中间步骤和思考步骤对最终答案的影响,进一步加强了模型的推理和思考能力。
在实际测试中,Skywork o1展现出了强大的逻辑推理、自我反思和自我验证能力。无论是面对常识推理、逻辑推理、数学推理还是伦理决策问题,甚至是“弱智”逻辑陷阱问题,Skywork o1都能游刃有余地处理。其解题逻辑严谨,思考过程类似人类,充分展示了其在复杂问题分析和解答上的优势。
此次Skywork o1的发布,不仅是昆仑万维贯彻“All in AGI 与 AIGC”战略的重要举措,也是构建AI技术栈的重要一步。昆仑万维将继续秉持“实现通用人工智能,让每个人更好地塑造和表达自我”的使命,从模型层、应用层等全方位、多维度构建公司技术竞争力和生态矩阵,推动AI技术的不断进步和应用落地。
目前,Skywork o1模型及相关介绍已在Huggingface开源,欢迎广大开发者访问并了解详情。开源地址:https://tinyurl.com/skywork-o1。
原创文章,作者:志斌,如若转载,请注明出处:http://www.damoai.com.cn/archives/8041