小米AI实验室发布ZipVoice系列语音合成模型解决零样本TTS瓶颈

大模型之家讯 9月12日，小米集团AI实验室的Kaldi新一代团队近日推出基于Flow Matching架构的ZipVoice系列语音合成（TTS）模型，其中包括ZipVoice（零样本单说话人语音合成模型）和ZipVoice‑Dialog（零样本对话语音合成模型）。新模型针对现有零样本语音合成系统参数量大、合成速度慢的问题提供了有效解决方案；同时，ZipVoice‑Dialog则突破了对话语音合成模型在稳定性与推理速度上的瓶颈，提升了整体性能与用户体验。

小米AI实验室发布ZipVoice系列语音合成模型 解决零样本TTS瓶颈

发表回复

小米AI实验室发布ZipVoice系列语音合成模型解决零样本TTS瓶颈