Qwen3 TTS Voice Clone
Sem treinamento; um clipe de 10–20 s cria uma voz personalizada. Crie a voz primeiro e depois sintetize com qwen3-tts-vc-realtime.
Clonagem de voz
0/600
Histórico
Saídas de exemplo
Cherry
Sunny, upbeat, friendly young woman
Serena
Gentle, warm young woman
Ethan
Standard Mandarin with a slight northern accent; sunny, warm, energetic
Chelsie
Anime-style virtual girlfriend
Momo
Playful, cute, teasing tone
Vivian
Spunky, cute, a little feisty
Visão geral do modelo
Fluxo de clonagem de voz
Forneça um clipe curto, crie uma voz personalizada e depois sintetize fala.
Clipe de 10–20 s
Recomendado 10–20 s, máximo 60 s.
Formato e taxa de amostragem
WAV/MP3/M4A, ≥24kHz, mono, <10MB.
Fala limpa
Pelo menos 3 s de leitura contínua e clara; sem ruído ou canto.
Crie e depois sintetize
Crie a voz e depois sintetize com o mesmo target_model.
Exemplos de síntese (vozes predefinidas)
Exemplos de síntese com voz predefinida (não clonada); os resultados reais dependem da sua entrada.
Exemplo de síntese · Cherry
Ouvir
0:000:00
Exemplo de síntese · Dylan
Ouvir
0:000:00
FAQ de clonagem de voz
Requisitos principais e dúvidas sobre o fluxo.
Continue explorando
Quer testar geração de imagem/vídeo?
Mesmo estilo de interação e design de parâmetros, com mais modelos chegando.
