Minimax开源推理模型M1

大模型之家讯 6月17日,Minimax开源其最新的推理模型M1,该模型采用Lightning Attention机制和混合注意力架构。M1具备业内领先的100万token上下文输入能力和8万token输出能力。在深度推理方面,M1所需的算力仅为DeepSeek R1的30%。值得一提的是,M1的强化学习阶段仅用了512块H800芯片三周时间,租赁成本为53.74万美金。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注