Qwen3 TTS Voice Clone

Kein Training erforderlich; ein 10–20s-Clip erstellt eine benutzerdefinierte Stimme. Erstelle zuerst die Stimme und synthetisiere dann mit qwen3-tts-vc-realtime.

Stimmenklon

0/600
Verlauf
Beispielausgaben
Cherry
Sunny, upbeat, friendly young woman
Serena
Gentle, warm young woman
Ethan
Standard Mandarin with a slight northern accent; sunny, warm, energetic
Chelsie
Anime-style virtual girlfriend
Momo
Playful, cute, teasing tone
Vivian
Spunky, cute, a little feisty

Modellübersicht

Workflow fürs Stimmenklonen

Gib einen kurzen Clip an, erstelle eine benutzerdefinierte Stimme und synthetisiere anschließend Sprache.

10–20s-Clip

Empfohlen 10–20s, max. 60s.

Format & Abtastrate

WAV/MP3/M4A, ≥24kHz, mono, <10MB.

Klare Sprache

Mindestens 3s klarer, zusammenhängender Text; kein Rauschen oder Gesang.

Erst erstellen, dann synthetisieren

Erstelle die Stimme und synthetisiere anschließend mit demselben target_model.

Synthese-Beispiele (vordefinierte Stimmen)

Synthese-Beispiele mit vordefinierten Stimmen (nicht geklont); echte Ergebnisse hängen von deiner Eingabe ab.

Synthese-Beispiel · Cherry

Anhören
0:000:00

Synthese-Beispiel · Dylan

Anhören
0:000:00

Stimmenklon-FAQ

Wichtige Anforderungen und Fragen zum Workflow.




Weiter erkunden

Möchtest du Bild-/Video-Generierung ausprobieren?

Gleicher Interaktionsstil und Parameter-Design, mit weiteren Modellen in Kürze.