Qwen3 TTS Voice Clone

Sem treinamento; um clipe de 10–20 s cria uma voz personalizada. Crie a voz primeiro e depois sintetize com qwen3-tts-vc-realtime.

Minhas vozes

Texto para sintetizar0/600

Histórico

Saídas de exemplo

Cherry

Sunny, upbeat, friendly young woman

Serena

Gentle, warm young woman

Ethan

Standard Mandarin with a slight northern accent; sunny, warm, energetic

Chelsie

Anime-style virtual girlfriend

Momo

Playful, cute, teasing tone

Vivian

Spunky, cute, a little feisty

Mais ferramentas de imagem

Ver tudo

Modelos populares

Qwen-Image-Edit-Plus z-image-turbo WAN 2.5 Nano Banana Nano Banana Pro Nano Banana Pro Ultra Seedream V4.5 GPT Image 1.5 Lite

Ferramentas populares

Qwen Image Layered Removedor de fundo Aumentador de imagens

Mais ferramentas de vídeo

Ver tudo

Modelos populares

Hailuo 2.3 Fast Hailuo 2.3 Seedance 1.5 Pro Seedance 2 Sora 2 Preview Sora 2 Lite Sora 2 Pro Veo 3.1 Pro Veo 3.1 Fast

Ferramentas populares

OmniHuman 1.5 — vídeo de humano digital

Mais ferramentas de áudio

Ver tudo

Modelos populares

Suno Music Qwen3 TTS Voice Generator

Ferramentas populares

Qwen3 TTS Voice Clone CosyVoice v3 Voice Clone

Visão geral do modelo

Fluxo de clonagem de voz

Forneça um clipe curto, crie uma voz personalizada e depois sintetize fala.

Clipe de 10–20 s

Recomendado 10–20 s, máximo 60 s.

Formato e taxa de amostragem

WAV/MP3/M4A, ≥24kHz, mono, <10MB.

Fala limpa

Pelo menos 3 s de leitura contínua e clara; sem ruído ou canto.

Crie e depois sintetize

Crie a voz e depois sintetize com o mesmo target_model.

Exemplos de síntese (vozes predefinidas)

Exemplos de síntese com voz predefinida (não clonada); os resultados reais dependem da sua entrada.

Exemplo de síntese · Cherry

Ouvir

0:000:00

Exemplo de síntese · Dylan

Ouvir

0:000:00

FAQ de clonagem de voz

Requisitos principais e dúvidas sobre o fluxo.

Continue explorando

Quer testar geração de imagem/vídeo?

Mesmo estilo de interação e design de parâmetros, com mais modelos chegando.

Gerador de imagens Gerador de vídeos

Qwen3 TTS Voice Clone

Clonagem de voz

Fluxo de clonagem de voz

Clipe de 10–20 s

Formato e taxa de amostragem

Fala limpa

Crie e depois sintetize

Exemplos de síntese (vozes predefinidas)

Exemplo de síntese · Cherry

Exemplo de síntese · Dylan

FAQ de clonagem de voz

Quais são os requisitos do áudio de entrada?

Qual é o fluxo?

Posso usar vozes predefinidas?

Quer testar geração de imagem/vídeo?