AI モデルで音声を生成します。
音楽・音声・ボイスクローンからモデルを選んで生成開始。
プロンプトから楽曲や伴奏を作成。
一文の説明から完成曲を生成。Simpleはプロンプトのみ、CustomはStyle/Lyrics/Titleを設定でき、インストや高度なスタイルにも対応。
自然な音声のテキスト読み上げ。
多音色・多言語/方言対応のTTS。Qwen3 TTS Flashは49音色を提供し、同一音色で複数言語を自然に話せます。
短いサンプルから声を複製して合成。
学習不要。10〜20秒の音声で音色を作成し、qwen3-tts-vc-realtimeで合成。
CosyVoiceはzero-shot/few-shotのクローン、跨言語、指示スタイル制御に対応し、素早くカスタムできます。