Qwen3 TTS 音色複製

無需訓練，10–20 秒音訊即可建立專屬音色；先建立音色，再用 qwen3-tts-vc-realtime 合成語音。

我的音色

合成文字0/600

歷史紀錄

生成範例

芊悦

阳光积极、亲切自然小姐姐

苏瑶

温柔小姐姐

晨煦

标准普通话，带部分北方口音。阳光、温暖、活力、朝气

千雪

二次元虚拟女友

茉兔

撒娇搞怪，逗你开心

十三

拽拽的、可爱的小暴躁

更多圖片工具

查看全部

受歡迎的模型

Qwen-Image-Edit-Plus z-image-turbo WAN 2.5 Nano Banana Nano Banana Pro Nano Banana Pro Ultra Seedream V4.5 GPT Image 1.5 Lite

受歡迎的工具

Qwen Image Layered 背景移除圖片高畫質放大

更多影片工具

查看全部

受歡迎的模型

Hailuo 2.3 Fast Hailuo 2.3 Seedance 1.5 Pro Seedance 2 Sora 2 Preview Sora 2 Lite Sora 2 Pro Veo 3.1 Pro Veo 3.1 Fast

受歡迎的工具

OmniHuman 1.5 數位人口播影片

更多音訊工具

查看全部

受歡迎的模型

Suno 音樂 Qwen3 TTS 語音生成器

受歡迎的工具

Qwen3 TTS 音色複製 CosyVoice v3 音色複製

模型概覽

音色複製工作流程

提供短音訊即可復刻；建立音色後用於語音合成。

10–20 秒即可復刻

建議 10–20 秒，最長不超過 60 秒。

格式/取樣率要求

WAV/MP3/M4A，≥24kHz，單聲道，<10MB。

清晰朗讀、無噪音

至少 3 秒連續清晰朗讀，無背景噪音，避免音樂/唱歌。

先建立再合成

先建立音色，再用同一 target_model 合成語音。

合成示例（預置音色）

以下為合成效果示意（預置音色，非復刻），實際復刻效果以輸入樣本為準。

合成示例 · Cherry

試聽

0:000:00

合成示例 · Dylan

試聽

0:000:00

聲音復刻常見問題

關於輸入音訊與流程的關鍵問題。

繼續探索

想試試圖片/影片生成？

同樣的互動風格與參數設計，支援更多模型持續接入。

圖片生成影片生成

Qwen3 TTS 音色複製

音色複製器

音色複製工作流程

10–20 秒即可復刻

格式/取樣率要求

清晰朗讀、無噪音

先建立再合成

合成示例（預置音色）

合成示例 · Cherry

合成示例 · Dylan

聲音復刻常見問題

輸入音訊有什麼要求？

流程怎麼走？

能否使用公共預置音色？

想試試圖片/影片生成？