Qwen3 TTS ボイスクローン

学習不要。10〜20秒の音声で音色を作成し、qwen3-tts-vc-realtimeで合成。

自分のボイス

合成テキスト0/600

履歴

生成サンプル

芊悦

陽気で前向き、親しみやすいお姉さん

苏瑶

優しくて穏やかなお姉さん

晨煦

標準中国語で少し北方なまり。明るく温かくエネルギッシュ

千雪

二次元のバーチャル彼女

茉兔

甘えん坊でお茶目、あなたを笑わせる

十三

ちょっと生意気で可愛いツンデレ

さらに多くの画像ツール

すべて見る

人気ツール

Qwen Image Layered 背景除去画像アップスケーラー

さらに多くの動画ツール

すべて見る

人気ツール

OmniHuman 1.5 デジタルヒューマン動画

さらに多くの音声ツール

すべて見る

人気モデル

Suno 音楽生成 Qwen3 TTS 音声合成

人気ツール

Qwen3 TTS ボイスクローン CosyVoice v3 ボイスクローン

モデル概要

ボイスクローンの流れ

短い音声で音色を作成し、その音色で合成。

10〜20秒でクローン

推奨10〜20秒、最長60秒。

形式/サンプリング条件

WAV/MP3/M4A、24kHz以上、モノラル、10MB未満。

明瞭でノイズなし

最低3秒の連続音声、背景ノイズや歌唱は避ける。

作成→合成の手順

音色作成後、同じ target_model で合成。

合成サンプル（プリセット音色）

以下は合成例（プリセット音色、クローンではありません）。実際の複製効果は入力音声に依存。

合成サンプル・ Cherry

試聴

0:000:00

合成サンプル・ Dylan

試聴

0:000:00

ボイスクローンよくある質問

入力音声と手順の重要点。

次も試す

画像/動画生成も試しますか？

同じ操作感で、より多くのモデルに順次対応します。

画像生成動画生成

Qwen3 TTS ボイスクローン

ボイスクローン

ボイスクローンの流れ

10〜20秒でクローン

形式/サンプリング条件

明瞭でノイズなし

作成→合成の手順

合成サンプル（プリセット音色）

合成サンプル ・ Cherry

合成サンプル ・ Dylan

ボイスクローン よくある質問

入力音声の条件は？

手順は？

公開プリセット音色は使える？

画像/動画生成も試しますか？

合成サンプル・ Cherry

合成サンプル・ Dylan

ボイスクローンよくある質問