購買積分

Qwen3 TTS 音色複製

無需訓練,10–20 秒音訊即可建立專屬音色;先建立音色,再用 qwen3-tts-vc-realtime 合成語音。

音色複製器

0/600
歷史紀錄
生成範例
芊悦
阳光积极、亲切自然小姐姐
苏瑶
温柔小姐姐
晨煦
标准普通话,带部分北方口音。阳光、温暖、活力、朝气
千雪
二次元虚拟女友
茉兔
撒娇搞怪,逗你开心
十三
拽拽的、可爱的小暴躁

模型概覽

音色複製工作流程

提供短音訊即可復刻;建立音色後用於語音合成。

10–20 秒即可復刻

建議 10–20 秒,最長不超過 60 秒。

格式/取樣率要求

WAV/MP3/M4A,≥24kHz,單聲道,<10MB。

清晰朗讀、無噪音

至少 3 秒連續清晰朗讀,無背景噪音,避免音樂/唱歌。

先建立再合成

先建立音色,再用同一 target_model 合成語音。

合成示例(預置音色)

以下為合成效果示意(預置音色,非復刻),實際復刻效果以輸入樣本為準。

合成示例 · Cherry

試聽
0:000:00

合成示例 · Dylan

試聽
0:000:00

聲音復刻常見問題

關於輸入音訊與流程的關鍵問題。




繼續探索

想試試圖片/影片生成?

同樣的互動風格與參數設計,支援更多模型持續接入。