智谱AI生成视频模型清影(Ying)上线,AI创作时代现已到来

智谱AI生成视频模型清影(Ying)上线,AI创作时代现已到来

大模型之家讯 7月26日,智谱AI Open Day上重磅推出——全新视频生成模型“清影”(Ying)。这一创新技术不仅将文字转化为视频的时间缩短至前所未有的30秒,还为用户提供了多样化的视频风格选择,标志着AI在视频创作领域迈出了重要一步。

清影’模型震撼发布,重塑内容生成边界

智谱AI CEO张鹏在智谱Open Day上正式宣布,AI生成视频模型“清影”正式上线智谱清言App,面向所有用户开放。用户只需输入一段文字(Prompt),并选择心仪的视频风格,如卡通3D、黑白老照片、油画、电影感等,即可在短短30秒内生成一段1440×960清晰度的高精度视频。这一技术的问世,无疑为内容创作者、广告商、短视频制作者等群体带来了极大的便利和效率提升。

智谱AI生成视频模型清影(Ying)上线,AI创作时代现已到来

“清影”不仅在生成速度上令人瞩目,其多样化的视频风格选择也让人眼前一亮。用户可以根据自己的创作需求,选择最适合的风格来呈现内容。无论是想要营造复古氛围的黑白老照片风格,还是追求艺术感的油画风格,亦或是充满未来感的卡通3D风格,“清影”都能轻松实现。此外,用户还可以为视频配上清影自带的音乐,进一步增强视频的观赏性和感染力。

开放平台,赋能企业和开发者

除了面向C端用户的智谱清言App外,“清影”的API也同步上线大模型开放平台bigmodel.cn。这意味着企业和开发者可以通过调用API的方式,体验和使用文生视频以及图生视频的模型能力。这一举措不仅为技术开发者提供了更多的可能性,也为整个AI视频生成行业的生态发展注入了新的活力。

创作技术革新,共绘新纪元蓝图

“清影”之所以能够实现如此高效、高质量的视频生成,离不开其背后的强大技术支撑。据悉,“清影”底座的视频生成模型是CogVideoX,该模型采用了DiT(Diffusion Transformer)架构,将文本、时间、空间三个维度有机融合。通过优化算法设计,CogVideoX相比前代模型CogVideo在推理速度上提升了6倍。此外,智谱AI还自研了高效三维变分自编码器结构(3D VAE)和3D RoPE位置编码模块,这些技术的应用使得“清影”在复杂指令遵从能力、内容连贯性和画面调度上具有独特优势。

得益于北京市和海淀区的大力支持。作为智谱AI的总部所在地,海淀区为智谱AI提供了产业投资、算力补贴、应用场景示范、人才等全方位支持。同时,“清影”的训练依托亦庄高性能算力集群,受益于亦庄良好的人工智能产业生态。未来,“清影”将应用于北京亦庄的高精尖产业集群,推动大模型赋能实体经济的新业态发展。

此外,在“清影”的研发过程中,bilibili和华策影视作为重要合作伙伴参与了技术研发和应用场景探索。这种合作模式不仅促进了技术的快速发展,也为未来的市场应用奠定了良好基础。随着更多合作伙伴的加入,“清影”的生态系统将更加完善,为用户提供更加丰富多样的创作体验和应用场景。

智谱AI生成视频模型清影(Ying)上线,AI创作时代现已到来

张鹏在智谱Open Day上表示:“随着算法、数据不断迭代,相信Scaling Law将继续发挥强有力作用。”智谱AI将继续努力迭代“清影”模型,在后续版本中推出更高分辨率、更长时长的生成视频功能。同时,智谱AI也将积极探索AI视频生成技术在更多领域的应用可能性,为千行百业带来持续创新与变革。

原创文章,作者:志斌,如若转载,请注明出处:http://www.damoai.com.cn/archives/6478

(0)
上一篇 2024年7月26日 上午10:30
下一篇 2024年7月26日 下午3:32

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注