Qwen3 TTS ボイスクローン
学習不要。10〜20秒の音声で音色を作成し、qwen3-tts-vc-realtimeで合成。
ボイスクローン
0/600
履歴
生成サンプル
芊悦
陽気で前向き、親しみやすいお姉さん
苏瑶
優しくて穏やかなお姉さん
晨煦
標準中国語で少し北方なまり。明るく温かくエネルギッシュ
千雪
二次元のバーチャル彼女
茉兔
甘えん坊でお茶目、あなたを笑わせる
十三
ちょっと生意気で可愛いツンデレ
モデル概要
ボイスクローンの流れ
短い音声で音色を作成し、その音色で合成。
10〜20秒でクローン
推奨10〜20秒、最長60秒。
形式/サンプリング条件
WAV/MP3/M4A、24kHz以上、モノラル、10MB未満。
明瞭でノイズなし
最低3秒の連続音声、背景ノイズや歌唱は避ける。
作成→合成の手順
音色作成後、同じ target_model で合成。
合成サンプル(プリセット音色)
以下は合成例(プリセット音色、クローンではありません)。実際の複製効果は入力音声に依存。
合成サンプル ・ Cherry
試聴
0:000:00
合成サンプル ・ Dylan
試聴
0:000:00
ボイスクローン よくある質問
入力音声と手順の重要点。
