大模型之家讯 1月22日,阿里云通义实验室宣布Qwen3-TTS语音生成模型正式开源。该模型由Qwen系列研发,具备音色克隆、音色创造、拟人化语音生成等核心功能,支持基于自然语言描述的语音控制。目前多码本全系列模型已开源,包含1.7B和0.6B两种参数规模,覆盖中文、英文、日语、韩语等10种主流语言及多种方言音色。此次开源为开发者提供低门槛的语音合成工具,助力多语言应用场景创新。
大模型之家讯 1月22日,阿里云通义实验室宣布Qwen3-TTS语音生成模型正式开源。该模型由Qwen系列研发,具备音色克隆、音色创造、拟人化语音生成等核心功能,支持基于自然语言描述的语音控制。目前多码本全系列模型已开源,包含1.7B和0.6B两种参数规模,覆盖中文、英文、日语、韩语等10种主流语言及多种方言音色。此次开源为开发者提供低门槛的语音合成工具,助力多语言应用场景创新。