Qwen3-TTS语音生成模型全面开源，支持多语言及方言音色

大模型之家讯 1月22日，阿里云通义实验室宣布Qwen3-TTS语音生成模型正式开源。该模型由Qwen系列研发，具备音色克隆、音色创造、拟人化语音生成等核心功能，支持基于自然语言描述的语音控制。目前多码本全系列模型已开源，包含1.7B和0.6B两种参数规模，覆盖中文、英文、日语、韩语等10种主流语言及多种方言音色。此次开源为开发者提供低门槛的语音合成工具，助力多语言应用场景创新。

Qwen3-TTS语音生成模型全面开源，支持多语言及方言音色

发表回复