Qwen3 TTS ボイスクローン

学習不要。10〜20秒の音声で音色を作成し、qwen3-tts-vc-realtimeで合成。

ボイスクローン

0/600
履歴
生成サンプル
芊悦
陽気で前向き、親しみやすいお姉さん
苏瑶
優しくて穏やかなお姉さん
晨煦
標準中国語で少し北方なまり。明るく温かくエネルギッシュ
千雪
二次元のバーチャル彼女
茉兔
甘えん坊でお茶目、あなたを笑わせる
十三
ちょっと生意気で可愛いツンデレ

モデル概要

ボイスクローンの流れ

短い音声で音色を作成し、その音色で合成。

10〜20秒でクローン

推奨10〜20秒、最長60秒。

形式/サンプリング条件

WAV/MP3/M4A、24kHz以上、モノラル、10MB未満。

明瞭でノイズなし

最低3秒の連続音声、背景ノイズや歌唱は避ける。

作成→合成の手順

音色作成後、同じ target_model で合成。

合成サンプル(プリセット音色)

以下は合成例(プリセット音色、クローンではありません)。実際の複製効果は入力音声に依存。

合成サンプル ・ Cherry

試聴
0:000:00

合成サンプル ・ Dylan

試聴
0:000:00

ボイスクローン よくある質問

入力音声と手順の重要点。




次も試す

画像/動画生成も試しますか?

同じ操作感で、より多くのモデルに順次対応します。