小米AI实验室发布ZipVoice系列语音合成模型 解决零样本TTS瓶颈

大模型之家讯 9月12日,小米集团AI实验室的Kaldi新一代团队近日推出基于Flow Matching架构的ZipVoice系列语音合成(TTS)模型,其中包括ZipVoice(零样本单说话人语音合成模型)和ZipVoice‑Dialog(零样本对话语音合成模型)。新模型针对现有零样本语音合成系统参数量大、合成速度慢的问题提供了有效解决方案;同时,ZipVoice‑Dialog则突破了对话语音合成模型在稳定性与推理速度上的瓶颈,提升了整体性能与用户体验。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注