Cómo funciona el cambio de velocidad con conservación de tono
El cambio de velocidad tradicional sube el tono al acelerar (efecto chipmunk) y lo baja al ralentizar. Los algoritmos modernos de estiramiento temporal resuelven esto separando el tempo del tono.
CleverUtils usa WSOLA (Waveform Similarity Overlap-Add), un algoritmo en el dominio temporal que divide el audio en segmentos cortos superpuestos, los reposiciona y los combina con fundido cruzado. Para acelerar, los segmentos se superponen más; para ralentizar, los huecos se rellenan con audio interpolado.
El resultado es un cambio de tempo sin alteración del tono — las voces suenan naturales a cualquier velocidad. WSOLA funciona mejor en el rango de 0,5x a 2,0x. Fuera de estos extremos, los artefactos se vuelven perceptibles.
Cómo funciona: WSOLA analiza la similitud de formas de onda para encontrar los puntos de superposición óptimos y luego aplica fundido cruzado entre segmentos. Esto preserva el timbre natural y el tono del audio original mientras cambia solo la duración de reproducción.
Guía de configuración de velocidad
Elige el multiplicador de velocidad adecuado para tu caso de uso:
| Velocidad | Cambio de duración | Ideal para | Calidad |
|---|---|---|---|
| 0,5x | 2× más largo | Práctica musical, transcripción detallada | Buena — posibles artefactos menores |
| 0,75x | 1,33× más largo | Clases densas, aprendizaje de idiomas | Excelente |
| 1,0x | Sin cambio | Velocidad original (solo conversión de formato) | Perfecta |
| 1,25x | 20% más corto | Podcasts (oyentes principiantes en velocidad) | Excelente |
| 1,5x | 33% más corto | Podcasts, audiolibros (la más popular) | Excelente |
| 1,75x | 43% más corto | Oyentes experimentados en velocidad | Muy buena |
| 2,0x | 50% más corto | Revisión rápida, contenido familiar | Buena — el habla sigue siendo inteligible |
Cambio de velocidad AAC: podcasts y audio en streaming
AAC es el códec de audio predeterminado de Apple Podcasts, YouTube y muchos servicios de streaming. Los episodios de podcast descargados como archivos AAC son los más habituales a la hora de ajustar la velocidad — más del 25% de los oyentes de podcasts usan velocidades de reproducción más rápidas.
El flujo de trabajo más popular: descarga un episodio de podcast (a menudo en AAC), aceléralo a 1,5x y conviértelo a MP3 para escucharlo sin conexión en cualquier dispositivo. Esto ahorra un tercio del tiempo de escucha mientras la voz del presentador suena natural e inteligible.
Para contenido educativo, ralentizar clases en AAC a 0,75x da a los estudiantes más tiempo para procesar el material denso y tomar apuntes. El algoritmo de conservación de tono garantiza que la voz del profesor se mantenga en su registro natural en lugar de sonar artificialmente grave.
Favorito de los oyentes de podcasts: la velocidad 1,5x reduce un episodio de 60 minutos a 40 minutos mientras el habla se escucha perfectamente clara. Empieza en 1,25x si eres nuevo en la escucha a velocidad aumentada.