智谱AI生成视频模型清影（Ying）上线，AI创作时代现已到来

志斌 • 2024年7月26日下午12:24 • 资讯

大模型之家讯 7月26日，智谱AI Open Day上重磅推出——全新视频生成模型“清影”（Ying）。这一创新技术不仅将文字转化为视频的时间缩短至前所未有的30秒，还为用户提供了多样化的视频风格选择，标志着AI在视频创作领域迈出了重要一步。

‘清影’模型震撼发布，重塑内容生成边界

智谱AI CEO张鹏在智谱Open Day上正式宣布，AI生成视频模型“清影”正式上线智谱清言App，面向所有用户开放。用户只需输入一段文字（Prompt），并选择心仪的视频风格，如卡通3D、黑白老照片、油画、电影感等，即可在短短30秒内生成一段1440×960清晰度的高精度视频。这一技术的问世，无疑为内容创作者、广告商、短视频制作者等群体带来了极大的便利和效率提升。

“清影”不仅在生成速度上令人瞩目，其多样化的视频风格选择也让人眼前一亮。用户可以根据自己的创作需求，选择最适合的风格来呈现内容。无论是想要营造复古氛围的黑白老照片风格，还是追求艺术感的油画风格，亦或是充满未来感的卡通3D风格，“清影”都能轻松实现。此外，用户还可以为视频配上清影自带的音乐，进一步增强视频的观赏性和感染力。

开放平台，赋能企业和开发者

除了面向C端用户的智谱清言App外，“清影”的API也同步上线大模型开放平台bigmodel.cn。这意味着企业和开发者可以通过调用API的方式，体验和使用文生视频以及图生视频的模型能力。这一举措不仅为技术开发者提供了更多的可能性，也为整个AI视频生成行业的生态发展注入了新的活力。

创作技术革新，共绘新纪元蓝图

“清影”之所以能够实现如此高效、高质量的视频生成，离不开其背后的强大技术支撑。据悉，“清影”底座的视频生成模型是CogVideoX，该模型采用了DiT（Diffusion Transformer）架构，将文本、时间、空间三个维度有机融合。通过优化算法设计，CogVideoX相比前代模型CogVideo在推理速度上提升了6倍。此外，智谱AI还自研了高效三维变分自编码器结构（3D VAE）和3D RoPE位置编码模块，这些技术的应用使得“清影”在复杂指令遵从能力、内容连贯性和画面调度上具有独特优势。

得益于北京市和海淀区的大力支持。作为智谱AI的总部所在地，海淀区为智谱AI提供了产业投资、算力补贴、应用场景示范、人才等全方位支持。同时，“清影”的训练依托亦庄高性能算力集群，受益于亦庄良好的人工智能产业生态。未来，“清影”将应用于北京亦庄的高精尖产业集群，推动大模型赋能实体经济的新业态发展。

此外，在“清影”的研发过程中，bilibili和华策影视作为重要合作伙伴参与了技术研发和应用场景探索。这种合作模式不仅促进了技术的快速发展，也为未来的市场应用奠定了良好基础。随着更多合作伙伴的加入，“清影”的生态系统将更加完善，为用户提供更加丰富多样的创作体验和应用场景。