DeepSeek摘得ACL2025最佳论文！NSA技术提速11倍，将装进下一代大模型

大模型之家讯 7月31日消息，DeepSeek梁文锋作为通讯作者、与北大等联合发表的论文获ACL2025最佳论文奖。此次ACL投稿量达8360篇（同比翻倍），竞争激烈。该论文提出的原生稀疏注意力（NSA）机制，通过软硬件协同优化，将长文本处理速度提升11倍，性能反超传统全注意力模型，上下文可扩展至100万tokens。据悉，这项技术将应用于DeepSeek下一代模型（或为V4/R2），为长文本处理与模型效率提升带来新突破。

DeepSeek摘得ACL2025最佳论文！NSA技术提速11倍，将装进下一代大模型

发表回复