DeepSeek推迟新模型R2发布 因华为芯片训练技术问题

大模型之家讯 据路透社报道,中国 AI 研发公司 DeepSeek 原计划近期发布下一代大模型 DeepSeek‑R2,然而在使用华为 Ascend 系列芯片进行训练时遭遇技术难题,导致项目被迫延期。公司未公布新的发布时间,但表示将继续优化芯片兼容性和训练流程,以确保模型性能与质量。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注