Como Funciona a Mudança de Velocidade com Preservação de Tom
Alterar a velocidade do áudio sem afetar o tom requer um algoritmo de time-stretching. O CleverUtils usa o WSOLA (Waveform Similarity Overlap-Add), que divide o áudio em pequenos segmentos sobrepostos, reposiciona-os no tempo e aplica crossfade nas novas posições. O resultado é uma mudança de tempo com o tom original preservado.
O algoritmo funciona melhor na faixa de 0,5x–2,0x. Dentro dessa janela, as regiões de crossfade se alinham naturalmente, produzindo uma saída suave com artefatos mínimos. Acima de 2,0x, as lacunas entre segmentos ficam audíveis; abaixo de 0,5x, a sobreposição excessiva pode introduzir um efeito semelhante a chorus.
Guia de Configurações de Velocidade
Escolha um multiplicador de velocidade com base no uso pretendido:
| Velocidade | Mudança de Duração | Caso de Uso |
|---|---|---|
| 0,5x | 2× mais longo | Transcrever solos rápidos, análise detalhada de áudio |
| 0,75x | 1,33× mais longo | Aprender trechos de tempo moderado, estudo de idiomas |
| 1,0x | Sem mudança | Velocidade original (somente conversão de formato) |
| 1,25x | 20% mais curto | Ouvir podcasts mais rápido, revisão de aulas |
| 1,5x | 33% mais curto | Ouvir audiobooks em alta velocidade, conteúdo falado |
| 2,0x | 50% mais curto | Revisão rápida, varredura de gravações longas |
Mudança de Velocidade em FLAC: Vantagem sem Perdas
Os arquivos FLAC preservam toda a gravação original sem nenhuma perda por compressão. Isso importa para o processamento de velocidade porque o algoritmo WSOLA trabalha com entrada bit a bit perfeita — sem artefatos de compressão para amplificar, sem lacunas de frequência para expor. Arquivos FLAC de 24 bits têm 48 dB a mais de faixa dinâmica do que os de 16 bits, fornecendo ao algoritmo ainda mais dados limpos para trabalhar.
DJs com coleções sem perdas usam a mudança de velocidade para corresponder BPM entre faixas. Uma faixa de 128 BPM ajustada para 130 BPM é apenas uma mudança de 1,6% — completamente transparente. Para músicos, desacelerar uma gravação FLAC para 0,5x revela cada detalhe de trechos rápidos, tornando-o o formato ideal para transcrição.
Nota de qualidade: A vantagem de qualidade do FLAC é mais perceptível em mudanças extremas de velocidade. A 0,5x, fontes comprimidas podem revelar artefatos de tremulação que estão ausentes com entrada sem perdas.