大模型之家讯 7月31日消息,DeepSeek梁文锋作为通讯作者、与北大等联合发表的论文获ACL2025最佳论文奖。此次ACL投稿量达8360篇(同比翻倍),竞争激烈。该论文提出的原生稀疏注意力(NSA)机制,通过软硬件协同优化,将长文本处理速度提升11倍,性能反超传统全注意力模型,上下文可扩展至100万tokens。据悉,这项技术将应用于DeepSeek下一代模型(或为V4/R2),为长文本处理与模型效率提升带来新突破。
大模型之家讯 7月31日消息,DeepSeek梁文锋作为通讯作者、与北大等联合发表的论文获ACL2025最佳论文奖。此次ACL投稿量达8360篇(同比翻倍),竞争激烈。该论文提出的原生稀疏注意力(NSA)机制,通过软硬件协同优化,将长文本处理速度提升11倍,性能反超传统全注意力模型,上下文可扩展至100万tokens。据悉,这项技术将应用于DeepSeek下一代模型(或为V4/R2),为长文本处理与模型效率提升带来新突破。