大模型之家讯 9月29日,DeepSeek 发布 V3.2‑Exp 版本,并在 Hugging Face 与魔搭平台开源。该版本基于 V3.1‑Terminus,首次引入稀疏 Attention 架构,显著降低计算资源消耗并提升推理效率。官方 DeepSeek App、网页端与小程序同步升级至 V3.2‑Exp,开发者 API 费用大幅降价,使用成本将下降 50% 以上。华为云已完成模型适配,最高可处理 160 000 个长序列上下文,进一步扩大模型的使用场景。

大模型之家讯 9月29日,DeepSeek 发布 V3.2‑Exp 版本,并在 Hugging Face 与魔搭平台开源。该版本基于 V3.1‑Terminus,首次引入稀疏 Attention 架构,显著降低计算资源消耗并提升推理效率。官方 DeepSeek App、网页端与小程序同步升级至 V3.2‑Exp,开发者 API 费用大幅降价,使用成本将下降 50% 以上。华为云已完成模型适配,最高可处理 160 000 个长序列上下文,进一步扩大模型的使用场景。