大模型之家2026年2月热力榜：红包大战后，OpenClaw掀起“主动执行”热潮

2026年的春节，空气中弥漫的不只是年味，更是浓烈的“算力焦味”。百度文心、阿里千问、腾讯元宝、字节豆包四大巨头在这个春节期间展开了一场史诗级的“红包肉搏战”，豪掷百亿现金，试图用最简单粗暴的方式抢占用户心智。这场流量狂欢虽然短暂推高了DAU，却也暴露了C端AI应用“高获客成本、低留存率”的致命软肋——当补贴退潮，裸泳者现形。

然而，就在大厂们还在用红包“撒钱”时，开源社区却用代码点燃了另一把火。OpenClaw以惊人的速度席卷GitHub，其“本地优先、主动执行”的理念直击大厂模型的软肋——只会聊天不会干活。这种从“被动问答”到“主动代理”的范式转移，正在重构AI的价值锚点。

当流量战争的硝烟散去，技术革命的火种才刚刚燃起。在大模型之家《2026年2月大模型热力榜》中，我们共收录了486个大模型及其所属企业，在这场冰与火的洗礼中，谁在裸泳，谁在进化，榜单见分晓。

百度：昆仑芯出货破6万，全栈自研成果显现

2026年2月，百度持续深化“芯-云-模-体”全栈布局。文心5.0正式版凭借2.4万亿参数原生全模态统一建模，在40余项权威基准评测中跻身国际第一梯队。昆仑芯P800芯片2025年出货约6万张，存量订单超20万张，为百度AI算力提供自主可控保障。百度放弃独立App硬推，将文心助手无缝嵌入月活超7亿的百度App，截至2026年1月，文心助手月活突破2亿。技术上，百度重点解决商业转化难题，试图将深厚技术积累转化为实际商业价值，在保持技术领先的同时，探索与现有业务逻辑的深度融合。

阿里巴巴：30亿春节请客，千问日活飙升至7352万

阿里在2月启动30亿元“春节请客计划”，联合淘宝、飞猪、盒马等生态业务，通过免单形式推动用户在熟悉场景中使用千问AI能力，1.3亿人首次体验AI购物，“千问帮我”语音指令调用50亿次，日活从不足千万飙升至7352万。除夕夜开源的千问Qwen3.5-Plus采用混合注意力机制和稀疏MoE架构，总参数3970亿仅激活170亿，部署显存占用降低60%，256k上下文场景推理吞吐量提升19倍，API价格降至0.8元/百万token，仅为Gemini3Pro的1/18。技术上，阿里走极致高效路线，通过“通云哥”黄金三角布局，目标成为AI时代的“全能军火商”。

腾讯：10亿红包推广，元宝日活突破5000万

腾讯依托微信生态投入10亿红包推广“元宝”AI助手，日活突破5000万，1.14亿用户参与，主打社交+轻量化办公场景。“元宝”采用混元+DeepSeek双引擎架构，支持8大主流方言识别（准确率85%以上）、智能文件处理、真人级聊天等功能，深度适配微信生态。春节期间，“元宝”16天AI创作达10亿次，推出“元宝派”社交功能，用户可创建AI参与的群组，AI能总结聊天、监督打卡、创作梗图等，试图用社交关系链为AI注入高频使用场景。技术上，腾讯计划年中完成混元3.0迭代，上下文窗口从256K扩展至512K，可处理约100万字文本，直击工业级长文档处理痛点。

字节跳动：春晚独家AI合作，豆包互动破19亿

字节跳动豆包拿下央视春晚独家AI云合作，除夕互动19亿次，峰值每分钟处理633亿token，生成5000万张AI头像，日活稳定在亿级规模。技术上，推出豆包大模型2.0，拥有Pro/Lite/Mini/Code四版本矩阵，成本降一个数量级，数学/编程基准夺金。同步上线的Seedance2.0技术应用于春晚《驭风歌》等节目，5秒视频生成成本仅4.5-9元，达到“导演级”控制精度，支持文字、图片、音频、视频四种模态输入，能生成长达15秒的多镜头高质量视频，精准切入影视、广告、电商等工业级内容创作场景。海外市场，豆包海外版Dola日活突破千万，延续TikTok全球化路径。

DeepSeek：V4模型灰度测试，100万token上下文引关注

DeepSeek在2月推出V4 lite版本并官宣完整版V4即将发布，以100万token超长上下文为核心杀手锏，整合自研engram条件记忆模块与MHC流形约束超连接技术，分离静态知识与动态计算，解决超长上下文推理中的信息衰减问题，100万token上下文无性能损耗，是上一代V3系列（128k）的7倍，可一次性处理《三体》三部曲、大型代码库、法律卷宗等超大规模文本。编程能力实现跨越式升级，HumanEval代码一次性通过率81.5%，支持从Python、Java到Rust、物联网专用语言的全场景开发，在复杂代码提示词处理、系统架构设计上超越GPT-4o与Claude Opus。商业化层面，延续高性价比策略，推理成本较美国顶级模型降低67%，上线即成为东南亚、欧洲开发者社区的热门选择。

智谱：GLM-5发布，编程能力逼近Claude Opus

2月12日，智谱AI发布GLM-5，定位为面向复杂系统工程与长程Agent任务的基座模型，实现从“代码工具”到“系统架构师”的范式升级。技术上，采用深度稀疏混合专家（MoE）架构，总参数量达7440亿，单次激活仅40-44亿，稀疏度仅5.9%，搭载256个专家模块，每次推理仅激活8个专家，配合自研的SLIME异步智能体强化学习框架，实现长程交互中的持续学习与策略一致性。编程能力逼近Claude Opus4.6，SWE-bench Verified得分77.8%，Terminal Bench2.0得分56.2分，均位列开源模型第一，全新推出的“Thinking Mode”思考模式，将幻觉率降低至行业极低水平。更具战略意义的是，GLM-5已完成华为昇腾、摩尔线程、寒武纪等七大国产算力平台的深度适配，实现“国产模型+国产算力”的全栈自主。

MiniMax：M2.5登顶OpenRouter，成本仅为GPT的1/10

2月12日，MiniMax发布M2.5，定位全球首个为Agent场景原生设计的生产级模型，以“极致效率、极致成本、极致生产力”为核心突破。技术上，以10B激活参数实现Claude Opus级性能，打破“参数即实力”误区，搭载自研Forge原生Agent RL框架，通过过程奖励机制实现复杂任务的高效拆解，推理速度达100TPS，是主流美国模型的2倍，完成SWE-bench任务的速度较上代提升37%。性能上，在SWE-bench Verified（80.2%）、Multi-SWE-bench（51.3%）、BrowseComp（76.3%）等权威基准测试中刷新行业SOTA，支持338种编程语言，覆盖全栈开发、跨端应用构建、代码审查与测试全流程。成本控制实现革命性突破，输入价格0.3美元/百万token，输出2.4美元/百万token，仅为GPT-5.2、Gemini3Pro的1/10-1/20，1美元可支持模型连续工作1小时，上线不足一周便登顶OpenRouter周调用量榜首。

商汤科技：具身智能适配30+工业场景，实体经济应用加速

商汤科技在2月推进具身智能平台落地，适配30+工业场景，展现AI在实体经济中的应用潜力。作为全球领先的人工智能软件公司，商汤依托SenseCore商汤AI大装置，持续研发通用人工智能技术，在计算机视觉、自然语言处理、大模型等领域保持技术领先。2026年春节期间，商汤具身智能技术在工业生产、物流配送等场景得到应用，通过智能机器人实现复杂任务的自动化处理，提升生产效率和安全性。商汤还积极探索AI与各行业的深度融合，推动AI技术从实验室走向实际应用场景，助力传统产业升级转型。

360集团：HyperGLLM框架获AAAI收录

360集团在2月由周鸿祎、潘剑锋领衔的研究团队提出的《HyperGLLM：基于超图增强大语言模型的高效终端威胁检测框架》，被AAAI 2026收录并在大会现场报告。该框架创新地将超图推理与大语言模型相结合，构建属性-值的关系图捕捉低阶结构语义，引入集成多粒度聚类的微分超图模块捕捉交错事件中的高阶行为依赖关系，最后将超图增强的语义表示与大语言模型对齐，实现对潜在恶意行为的高效上下文推理。实验评估显示，HyperGLLM框架在恶意行为种类判别上准确性高达94.65%，误报率仅为1.67%，显著提升了大语言模型对超长EDR日志的建模效率，为终端威胁检测技术发展奠定基础。

月之暗面：7亿美元融资落地，K2.5收入超2025全年

月之暗面在2月完成7亿美元融资，估值破100亿美元，1-2月累计融资超12亿美元。其1月27日发布的Kimi K2.5模型在多模态理解、智能体协作与长文本处理上实现关键跨越，全面升级图像、文档解析能力，正式支持视频输入与理解，具备跨模态综合推理能力。该模型能调度多达100个“Agent分身”并行工作，将复杂任务处理效率提升3到10倍，发布不到20天收入超2025年全年，海外收入反超国内。技术上，K2.5落地自研的AgentSwarm智能体集群架构，可支持多个智能体并行协作，如写深度调查报告时，不同智能体专家分步执行搜索、分析、写作等任务。月之暗面还推出不同会员套餐，199元/月或699元/月套餐可使用Agent集群功能。

原创文章，作者：志斌，如若转载，请注明出处：http://www.damoai.com.cn/archives/14726