昆仑万维开源多模态统一预训练模型 Skywork UniPic

大模型之家讯 7月30日,昆仑万维正式推出并开源了采用自回归路线的多模态统一预训练模型Skywork UniPic。该模型基于大规模高质量数据端到端预训练,在单一架构中深度融合了图像理解、文本到图像生成及图像编辑三大核心能力。模型采用MAR编码器与SigLIP2主干网络,突破了传统多模态模型依赖VQ或VAE编码器导致的语义信息保留不足的局限,实现了跨任务的深度协同。在性能方面,Skywork UniPic以1.5B参数规模实现了接近大型统一模型的效能。在指令遵循、复杂指令生图及图像编辑等基准测试中,该模型均达到行业领先水平,尤其在消费级显卡上即可流畅运行,显著降低了技术应用门槛。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注