Come Funziona il Cambio di Velocità con Conservazione del Pitch
Il tradizionale cambio di velocità alza il tono quando si accelera (effetto scoiattolo) e lo abbassa quando si rallenta. I moderni algoritmi di time-stretching risolvono questo problema separando il tempo dal pitch.
CleverUtils usa WSOLA (Waveform Similarity Overlap-Add), un algoritmo nel dominio del tempo che divide l'audio in brevi segmenti sovrapposti, li riposiziona e li fonde con un crossfade. Per accelerare l'audio i segmenti si sovrappongono di più; per rallentare, i vuoti vengono riempiti con audio interpolato.
Il risultato è un cambio di tempo senza spostamento del pitch — le voci suonano naturali a qualsiasi velocità. WSOLA funziona meglio nell'intervallo da 0,5x a 2,0x. Oltre questi estremi gli artefatti diventano percettibili.
Come funziona: WSOLA analizza la somiglianza della forma d'onda per trovare i punti di sovrapposizione ottimali, poi applica un crossfade tra i segmenti. Questo preserva il timbro naturale e il pitch dell'audio originale, modificando solo la durata di riproduzione.
Guida alle Impostazioni di Velocità
Scegli il moltiplicatore di velocità adatto al tuo caso d'uso:
| Velocità | Variazione durata | Ideale per | Qualità |
|---|---|---|---|
| 0,5x | 2× più lungo | Pratica musicale, trascrizione dettagliata | Buona — possibili artefatti minori |
| 0,75x | 1,33× più lungo | Lezioni dense, apprendimento delle lingue | Eccellente |
| 1,0x | Nessuna variazione | Velocità originale (solo conversione formato) | Perfetta |
| 1,25x | 20% più corto | Podcast (ascoltatori principianti) | Eccellente |
| 1,5x | 33% più corto | Podcast, audiolibri (i più popolari) | Eccellente |
| 1,75x | 43% più corto | Ascoltatori esperti di ascolto veloce | Molto buona |
| 2,0x | 50% più corto | Revisione rapida, contenuto già noto | Buona — parlato ancora comprensibile |
Cambio Velocità AAC: Podcast e Audio in Streaming
AAC è il codec audio predefinito di Apple Podcasts, YouTube e molti servizi di streaming. Gli episodi podcast scaricati come file AAC sono tra i più comunemente riprodotti a velocità variabile — oltre il 25% degli ascoltatori di podcast usa velocità di riproduzione più elevate.
Il flusso di lavoro più diffuso: scarica un episodio podcast (spesso in AAC), acceleralo a 1,5x e convertilo in MP3 per l'ascolto offline su qualsiasi dispositivo. Questo consente di risparmiare un terzo del tempo di ascolto mantenendo la voce del conduttore naturale e comprensibile.
Per i contenuti didattici, rallentare le lezioni AAC a 0,75x dà agli studenti più tempo per elaborare il materiale denso e prendere appunti. L'algoritmo di conservazione del pitch garantisce che la voce del professore rimanga al suo registro naturale anziché suonare artificialmente grave.
Il preferito degli ascoltatori di podcast: la velocità 1,5x riduce un episodio da 60 minuti a 40 mantenendo il parlato perfettamente chiaro. Inizia a 1,25x se sei nuovo all'ascolto veloce.