Comprar créditos

Qwen3 TTS Voice Clone

Sem treinamento; um clipe de 10–20 s cria uma voz personalizada. Crie a voz primeiro e depois sintetize com qwen3-tts-vc-realtime.

Clonagem de voz

0/600
Histórico
Saídas de exemplo
Cherry
Sunny, upbeat, friendly young woman
Serena
Gentle, warm young woman
Ethan
Standard Mandarin with a slight northern accent; sunny, warm, energetic
Chelsie
Anime-style virtual girlfriend
Momo
Playful, cute, teasing tone
Vivian
Spunky, cute, a little feisty

Visão geral do modelo

Fluxo de clonagem de voz

Forneça um clipe curto, crie uma voz personalizada e depois sintetize fala.

Clipe de 10–20 s

Recomendado 10–20 s, máximo 60 s.

Formato e taxa de amostragem

WAV/MP3/M4A, ≥24kHz, mono, <10MB.

Fala limpa

Pelo menos 3 s de leitura contínua e clara; sem ruído ou canto.

Crie e depois sintetize

Crie a voz e depois sintetize com o mesmo target_model.

Exemplos de síntese (vozes predefinidas)

Exemplos de síntese com voz predefinida (não clonada); os resultados reais dependem da sua entrada.

Exemplo de síntese · Cherry

Ouvir
0:000:00

Exemplo de síntese · Dylan

Ouvir
0:000:00

FAQ de clonagem de voz

Requisitos principais e dúvidas sobre o fluxo.




Continue explorando

Quer testar geração de imagem/vídeo?

Mesmo estilo de interação e design de parâmetros, com mais modelos chegando.