Qwen3 TTS Voice Clone

Sin entrenamiento; un clip de 10–20 s crea una voz personalizada. Crea la voz primero y luego sintetiza con qwen3-tts-vc-realtime.

Clon de voz

0/600
Historial
Salidas de ejemplo
Cherry
Sunny, upbeat, friendly young woman
Serena
Gentle, warm young woman
Ethan
Standard Mandarin with a slight northern accent; sunny, warm, energetic
Chelsie
Anime-style virtual girlfriend
Momo
Playful, cute, teasing tone
Vivian
Spunky, cute, a little feisty

Resumen del modelo

Flujo de clonación de voz

Proporciona un clip corto, crea una voz personalizada y luego sintetiza voz.

Clip de 10–20 s

Recomendado 10–20 s, máximo 60 s.

Formato y muestreo

WAV/MP3/M4A, ≥24kHz, mono, <10MB.

Voz limpia

Al menos 3 s de lectura continua clara; sin ruido ni canto.

Crear y luego sintetizar

Crea la voz y luego sintetiza con el mismo target_model.

Ejemplos de síntesis (voces predefinidas)

Ejemplos de síntesis con voces predefinidas (no clonadas); los resultados reales dependen de tu entrada.

Ejemplo de síntesis · Cherry

Escuchar
0:000:00

Ejemplo de síntesis · Dylan

Escuchar
0:000:00

FAQ de clonación de voz

Requisitos clave y preguntas sobre el flujo de trabajo.




Seguir explorando

¿Quieres probar generación de imagen/video?

Mismo estilo de interacción y diseño de parámetros, con más modelos próximamente.