大模型之家讯 8月20日,字节跳动的 Seed 团队宣布推出一系列开源大型语言模型 ——Seed-OSS。该系列模型旨在满足国际化(i18n)应用场景的需求,专注于强大的长文本理解、推理能力和灵活的开发者友好特性。Seed-OSS 系列模型基于流行的因果语言模型架构,采用了 RoPE、GQA 注意力机制、RMSNorm 和 SwiGLU 激活函数。最新发布的 Seed-OSS-36B 模型拥有360亿个参数,具备512K 的长上下文处理能力。尽管该模型仅使用了12万亿个训练数据,其在多个流行的基准测试中表现出色。