昆仑万维2050研究院与北大联合发布MoE++，性能与推理速度全面提升

志斌 • 2024年10月22日上午10:11 • 人工智能

大模型之家讯近日，昆仑万维2050研究院颜水成团队与北京大学袁粒团队联合推出了新一代的混合专家模型框架MoE++，该框架相较于传统的MoE（混合专家模型）在推理速度和性能上都有显著提升。MoE++引入了“零计算量专家”的创新设计，能够有效降低计算成本，同时提升复杂任务处理的能力，使其更易于在大规模语言模型（LLMs）中部署。

昆仑万维2050研究院与北大联合发布MoE++，性能与推理速度全面提升

MoE++作为一个通用框架，能无缝集成至任何现有的MoE模型中，尤其在三个关键方面表现突出：(1) 通过允许每个Token选择可变数量的专家，甚至完全跳过当前MoE层，MoE++实现了显著的计算成本降低；(2) 减少简单Token使用的专家数量，使复杂Token得到更多专家资源，从而释放更大的性能潜力；(3) “零计算量专家”占用极小的参数量，使得在每个GPU上可以同时部署所有的零计算量专家，避免了专家负载不均的问题。

实验数据表明，MoE++在0.6B到7B参数规模的模型上实现了1.1到2.1倍的专家吞吐速度，同时在性能上全面超越传统的MoE模型。这一模型现已开源，论文和相关代码可在Arxiv和GitHub上获取。

MoE++框架的发布为大规模语言模型的发展提供了新的技术路径，将进一步推动自然语言处理和AI模型的创新发展。

原创文章，作者：志斌，如若转载，请注明出处：http://www.damoai.com.cn/archives/7661

赞 (0)

0 0

智源研究院发布原生多模态世界模型Emu3

上一篇 2024年10月21日下午1:51

商汤科技发布全员信，确定“大装置-大模型-应用”的三位一体新战略

下一篇 2024年10月22日下午1:32

人工智能

去广告化+AI加持，金山办公有了新故事

金山办公最新发布的财报里，业绩平稳增长，顺ChatGPT火热之势进入大模型赛道，推出新品WPS AI，并未受到全球PC和手机市场持续低迷任何的“波及”…… 8月22日晚间，办公软件…

欧玉娇
2023年8月31日
人工智能

大模型天花板！文心一言科普日花式秀“超能力”，场面火爆

如果李白叫老李，孙悟空叫老孙，张无忌叫老张，那公孙离叫什么？”在2023全国科普日主场活动人工智能展区百度展台，展示人员对着文心一言输入Prompt指令。片刻，显示屏便给出了由百度…

志斌
2023年9月15日
人工智能

百度何俊杰：AI原生应用将成创新增长的“弹簧板”

大模型之家讯 11月28日，在“WISE2023 商业之王大会”上，百度集团资深副总裁、百度移动⽣态事业群组总经理何俊杰发表了《AI流经之地》为题的演讲，阐释在大模型带来全行业大变…

志斌
2023年11月28日
人工智能

言犀AI开发计算平台上线，低代码开发让大模型“触手可及”

人工智能浪潮迭起，大模型持续“涌现”。大模型的训练与应用对数字基础设施提出了更高的要求——更强算力、更大存力、更加易用、更低门槛的数字基础设施，是建好大模型、用好大模型的前提。

志斌
2023年9月26日
人工智能

商汤科技元萝卜家族首次集体亮相AWE 2024，为智慧家庭增添新纽带

大模型之家讯 “这样的坐姿会伤害你的眼睛和脊椎哦”，“白棋棋形已被破坏，通过打吃收气”。在熙熙攘攘、热闹非凡的会场上，一台台简约酷萌又科技感十足的机器人吸引了不少人的围观，有的和它…

志斌
2024年3月15日
人工智能

百度智能云升级两大AI基础设施，文心大模型日调用量超7亿次

大模型之家讯 9月25日，2024百度云智大会在北京召开。为帮助企业更快、更好、更省地使用大模型，百度智能云分别针对算力、模型、AI应用，全面升级百舸AI异构计算平台4.0、千帆大…

志斌
2024年9月25日
人工智能

大模型需要什么样的智算中心？7位大咖谈AIGC时代算力挑战与风口丨GACS 2023

摘要：破解AI企业难盈利困局，智算中心建设将是关键。 9月14日-15日，2023全球AI芯片峰会（GACS 2023）在深圳市南山区圆满举行。在第二天举行的智算中心算力与网络高峰…

赵小满
2023年10月10日
人工智能

SUSE Summit 2025创新峰会召开：告别炫技，走向可观测

大模型之家讯当生成式AI巨浪正席卷全球，从科研到市场，催生出前所未有的技术想象力，中国企业站在转型的十字路口，却被现实问题层层包围：如何选型、如何治理、如何确保安全与合规，更如何…

志斌
2025年6月13日
人工智能

对话虚拟动点刘耀东：从算法、硬件到数据，解构空间智能如何“落地”

当空间智能与具身智能的双螺旋开始转动，AI行业正迎来虚拟世界与物理世界交互的临界点：OpenAI押注人形机器人、英伟达发布Project GR00T、特斯拉擎天柱工厂落地，全球科技…

志斌
2025年4月23日
人工智能

GPT-5真容初现：奥特曼官方实测引爆行业热议

在经历多周的官方暗示后，GPT-5终于以奥特曼本人带来的实测案例揭开了神秘面纱。尽管对话仅聚焦于电视剧推荐，这一官方实例迅速引发全球技术社区的广泛关注，标志着GPT-5研发进入关键…

志斌
2025年8月4日

发表回复

志斌

数码科技领域深耕多年的专业管理者与技术服务专家，现任大模型之家主编、速途网资深编辑、元宇宙研究院分析师。专注于人工智能、消费电子与IDC行业的深度报道，凭借广泛科技圈人脉，包括媒体、公关、分析师及企业高层，持续引领行业洞察与分析。商务合作咨询： Qiaodao007

1.2K posts

0 comments