大模型之家讯 近日,美团发布562B参数混合专家模型LongCat-Flash-Chat并开启开源。该模型采用MoE架构,通过动态计算机制根据任务复杂度激活186亿至313亿参数(平均270亿),配合PID控制器稳定计算负载。其创新ScMoE设计扩大计算-通信重叠窗口,推理速度超每秒100token,破解MoE扩展瓶颈。基准测试显示,模型在MMLU、CEval等通用领域及智能体任务上超越GPT-4.1等竞品,目前已通过MIT协议在Hugging Face开源,并上线网页版聊天机器人。
大模型之家讯 近日,美团发布562B参数混合专家模型LongCat-Flash-Chat并开启开源。该模型采用MoE架构,通过动态计算机制根据任务复杂度激活186亿至313亿参数(平均270亿),配合PID控制器稳定计算负载。其创新ScMoE设计扩大计算-通信重叠窗口,推理速度超每秒100token,破解MoE扩展瓶颈。基准测试显示,模型在MMLU、CEval等通用领域及智能体任务上超越GPT-4.1等竞品,目前已通过MIT协议在Hugging Face开源,并上线网页版聊天机器人。