Qwen3 TTS Voice Clone
Sin entrenamiento; un clip de 10–20 s crea una voz personalizada. Crea la voz primero y luego sintetiza con qwen3-tts-vc-realtime.
Clon de voz
0/600
Historial
Salidas de ejemplo
Cherry
Sunny, upbeat, friendly young woman
Serena
Gentle, warm young woman
Ethan
Standard Mandarin with a slight northern accent; sunny, warm, energetic
Chelsie
Anime-style virtual girlfriend
Momo
Playful, cute, teasing tone
Vivian
Spunky, cute, a little feisty
Resumen del modelo
Flujo de clonación de voz
Proporciona un clip corto, crea una voz personalizada y luego sintetiza voz.
Clip de 10–20 s
Recomendado 10–20 s, máximo 60 s.
Formato y muestreo
WAV/MP3/M4A, ≥24kHz, mono, <10MB.
Voz limpia
Al menos 3 s de lectura continua clara; sin ruido ni canto.
Crear y luego sintetizar
Crea la voz y luego sintetiza con el mismo target_model.
Ejemplos de síntesis (voces predefinidas)
Ejemplos de síntesis con voces predefinidas (no clonadas); los resultados reales dependen de tu entrada.
Ejemplo de síntesis · Cherry
Escuchar
0:000:00
Ejemplo de síntesis · Dylan
Escuchar
0:000:00
FAQ de clonación de voz
Requisitos clave y preguntas sobre el flujo de trabajo.
Seguir explorando
¿Quieres probar generación de imagen/video?
Mismo estilo de interacción y diseño de parámetros, con más modelos próximamente.
