商汤SenseNova U1图文交错增强版：支持多页连续创作，角色风格不“跑偏”

志斌 • 2026年6月12日下午5:06 • 资讯

商汤日日新 SenseNova U1 系列新成员——U1-8B-MoT-Interleaved 图文交错增强版模型，面向图文交错创作与生成（Interleaved Generation）场景进行了专项强化，更好地支持绘本、故事书、多页 PPT、图文教程等连续内容创作，解决传统多模态模型“多轮生成后角色形象飘移、画风断裂、图文脱节”等痛点。

模型开源地址：https://huggingface.co/sensenova/SenseNova-U1-8B-MoT-Interleaved

核心突破：从“单张高质量”到“连贯图文长序列”

SenseNova U1 图文交错增强版的核心能力表现在：能够在长内容场景中，持续输出风格统一、叙事连贯、图文高度对应的多页结果 ——它不再仅仅生成孤立的单张图像，而是一套完整的、可直接使用的图文内容序列 。

其核心升级主要体现在四个方面：

1、叙事一致性与角色连贯性大幅提升

模型显著提升了长周期创作中的叙事连贯性、角色一致性与画风统一性。故事线在整个生成过程中被严格遵循，人物形象从第一页到最后一页均保持高度一致，彻底解决了此前多轮生成中角色形象“走调”的核心痛点。

2、图文对应关系增强，告别“图文脱节”

经过专项训练，模型大幅改善了图像内容与文字描述之间的语义对齐能力。生成的画面能更准确地呈现文本所描述的复杂场景、动态动作与物体间的空间关系，有效减少了“图文脱节”的现象。

3、视觉质量与Artifact明显改善

针对人物结构、文字渲染、页面排版等高频高难区域进行了定向优化，显著降低了生成物中的视觉瑕疵（Artifact），使复杂图文混排内容更加自然、稳定和可用。

4、全新能力：多页 PPT 自动生成

新版本首次支持了多页 PPT 自动生成能力。模型能够智能从输入内容中提取要点，自行完成排版设计与文字渲染。

能力对比：四大场景实测表现

以下通过实际案例，直观呈现SenseNova-U1-8B-MoT-Interleaved图文交错增强版模型在各类图文创作任务中的真实表现：

场景一：教程类内容生成

任务场景：生成带有步骤说明与配图的图文指南。这类场景的关键痛点在于：步骤必须清晰，图文需严格语义对齐，且画面逻辑要干净实用。
原版模型表现：生成的果蔬图像虽较真实，但搅拌步骤的配图出现了违背物理逻辑的“星云漩涡”；且生成步骤较为繁琐，家庭实操实用性偏低。
增强版模型优势：西瓜图像更加真实自然，无锯齿状视觉瑕疵（Artifact）；搅拌动作完全符合真实物理逻辑；同时步骤精简实用，贴近真实操作场景。

商汤SenseNova U1图文交错增强版：支持多页连续创作，角色风格不“跑偏”

商汤SenseNova U1图文交错增强版：支持多页连续创作，角色风格不“跑偏”

场景二：故事书类内容生成

任务场景：根据故事文本生成多页连续的儿童绘本，核心难点在于确保角色不“变脸”、情节连贯完整。
原版模型表现：未能遵循“角色突然失踪”的关键情节指令；表达形式单一且无文字配解；情节逻辑不够流畅，画面中鸟类尾部及人物面部出现明显形变（Artifact），形象不够卡通，缺乏童话感。
增强版模型优势：精准呈现“突然失踪”的核心反转情节；故事原生配有文字讲解，表达形式丰富，可读性大幅提升；角色形象卡通化且稳定，无形变问题。

商汤SenseNova U1图文交错增强版：支持多页连续创作，角色风格不“跑偏”

商汤SenseNova U1图文交错增强版：支持多页连续创作，角色风格不“跑偏”

场景三：绘画过程类内容生成

任务场景：生成模拟手绘过程的逐步图文内容，要求能循序渐进地呈现绘画步骤与创意作品的诞生全过程，风格需高度统一。
原版模型表现：基本遵循指令，但“过程感”呈现有限；画面质感一般，缺乏纸张的纸质肌理，视觉上更接近生硬的数字渲染风格。
增强版模型优势：指令遵循更精准；绘画步骤的过程性体现极强，层次感清晰可见；画幅表现异常逼真，纸张上的画面感极强，完美还原了真实手绘的艺术质感。

商汤SenseNova U1图文交错增强版：支持多页连续创作，角色风格不“跑偏”

商汤SenseNova U1图文交错增强版：支持多页连续创作，角色风格不“跑偏”

场景四：PPT 内容生成

图文交错增强版模型首次解锁了多页PPT自动生成能力。拿以下“赛博朋克”主题PPT为例：风格高度统一（全程赛博朋克霓虹暗色调）、图文语义严格对应、多页叙事逻辑完整，很好地体现了增强版模型能力。

商汤SenseNova U1图文交错增强版：支持多页连续创作，角色风格不“跑偏”

在单页PPT自动生成上，增强版相比原版也取得了显著提升。

任务场景：单页PPT 自动生成，要求内容自动提取、排版设计自动完成，且文字渲染精准准确。
原版模型表现：排版布局不够稳定，整体布局欠清晰，文字排布拥挤，美观度仍有较大提升空间。
增强版模型优势：不仅在布局稳定性与视觉美观度上实现了质的飞跃，文字排版也更具呼吸感与视觉层次。

商汤SenseNova U1图文交错增强版：支持多页连续创作，角色风格不“跑偏”

商汤SenseNova U1图文交错增强版：支持多页连续创作，角色风格不“跑偏”

而且借助”图文交错思维链”，模型将 PPT 布局设计的全过程以连续图文的形式逐步呈现，让创作逻辑一目了然。

商汤SenseNova U1图文交错增强版：支持多页连续创作，角色风格不“跑偏”

让长内容创作从此一气呵成

从单张图像的惊艳“盲盒”，到跨越连续多页、逻辑严密、画风如一的“完整图文内容创作”，SenseNova U1 图文交错增强版模型的推出，标志着多模态 AI 连续内容创作正式跨入高实用性、高稳定性的全新阶段。

无论是让步骤严丝合缝的图文指南，还是需要角色和情节完美连贯的儿童奇幻绘本，亦或是追求视觉排版层次的商业演示PPT——它都用强大的指令遵循与极致的视觉质量，给出了令人惊艳的答卷。它让 AI 真正告别了碎片化的单图拼凑，走向了完整、长篇、端到端的连续叙事。

目前模型已面向全球开源，欢迎访问 GitHub 或魔搭社区下载体验。

原创文章，作者：志斌，如若转载，请注明出处：http://www.damoai.com.cn/archives/16140

赞 (0)

0 0

IDC ：百度智能云位居中国零售信贷决策工具市场份额第一

上一篇 2026年6月11日下午5:28

世界杯特别企划：6大AI助手“押注”，半数AI看好西班牙

下一篇 2026年6月12日下午5:44

资讯

硅星人发布AI hacker house竞速36小时：快速搭建AI人格体活动

语言，是思维方式得以形成的主要因素之一，是构造特定人格的关键因素。而语言与思维之间紧密勾连、含混不清的关系，让AI“是否拥有独立意识”这一点变得难以界定。那么，如果 …

王昊达
2024年3月6日
中国移动139邮箱上线AI功能

大模型之家讯 10月1日，中国移动139邮箱宣布开始招募AI内测体验官，主打“既是邮箱也是云盘”。可根据关键词写作、对原有文章润色或总结概括，与机器人互动问答工作生活中的常见问题…

王昊达
资讯 2023年10月2日
SAP与阿里巴巴达成战略合作，加速AI驱动的数字化转型

大模型之家讯今日，阿里巴巴集团与SAP宣布达成战略合作，将SAP行业领先的企业级软件与阿里云基础设施及AI能力结合，加速企业客户的创新和数字化转型。SAP将探索接入通义千问大模型…

志斌
资讯 2025年5月27日
资讯

逐光而行——2023证券之星“资本力量”年度活动圆满结束

2023年11月8日，由证券之星主办的第十一届“资本力量”年度活动圆满结束！ “资本力量”年度活动自创办以来已经走过了十一个春秋。十一年来，证券之星希望为广大投资者提供展示优秀企业…

欧玉娇
2023年11月11日
资讯

傅盛评论“开源大模型是智商税”：核心不在开源闭源，而在应用落地

大模型之家讯在近日举行的2024世界人工智能大会（WAIC 2024）上，猎豹移动董事长兼CEO、猎户星空董事长傅盛就“开源大模型是智商税”的观点发表了自己的看法。他提出，大模型…

志斌
2024年7月8日
资讯

小米15周年、徕卡100周年献礼之作，首款徕卡红标手机“小米17 Ultra 徕卡版”重磅发布

大模型之家讯今日晚间，小米×徕卡影像战略合作升级暨小米17 Ultra新品发布会在北京召开，小米集团合伙人、总裁卢伟冰正式发布小米和徕卡影像战略合作升级后的开篇之作小米17 Ul…

志斌
2025年12月25日
华为云前具身机器人负责人朱森华离职创业，获数千万元种子轮融资

2025年10月，华为云原AI算法创新Lab主任、具身机器人业务开创者朱森华正式离职，并创立具身智能公司“具脑磐石”。据悉，该公司成立两个月内已完成核心团队组建，并于近期获得数千…

志斌
资讯 2026年1月4日
资讯

RGB-Mini LED电视普及风暴，海信正式发布小墨E5S Pro

大模型之家讯 4月22日，海信举行了主题为“好电视的新答案”2026海信电视小墨E5系列新品发布会，正式推出全新一代产品——RGB-Mini LED电视爆款王小墨E5S Pro，以…

志斌
2026年4月22日
资讯

7大全球首创，多看1.2亿色彩！海信发布UX2026款RGB-Mini LED电视

大模型之家讯 3 月 5 日，海信正式推出 RGB-Mini LED超旗舰电视UX2026 款，以玲珑4芯真彩背光、四芯同控信芯 AI 画质芯片 H7 Pro、行业顶配4倍黑位超低…

志斌
2026年3月5日
资讯

超全逛展攻略来了，一文带你“玩转”电博会

大模型之家讯目前距离电博会开幕仅剩 1 天！如何报名观展？如何到达展馆？现场将有哪些展区？同期将有哪些精彩活动？以下这份详尽指南将逐一为你揭晓答案。手握…

志斌
2024年10月17日

发表回复

登录后才能评论