美团开源562B混合专家模型LongCat动态计算突破效率瓶颈

大模型之家讯 近日,美团发布562B参数混合专家模型LongCat-Flash-Chat并开启开源。该模型采用MoE架构,通过动态计算机制根据任务复杂度激活186亿至313亿参数(平均270亿),配合PID控制器稳定计算负载。其创新ScMoE设计扩大计算-通信重叠窗口,推理速度超每秒100token,破解MoE扩展瓶颈。基准测试显示,模型在MMLU、CEval等通用领域及智能体任务上超越GPT-4.1等竞品,目前已通过MIT协议在Hugging Face开源,并上线网页版聊天机器人。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注