Comment fonctionne le changement de vitesse avec préservation de la hauteur
CleverUtils utilise l'algorithme WSOLA (Waveform Similarity Overlap-Add) — la même méthode d'étirement temporel employée par les DAW professionnels et les lecteurs multimédias. Contrairement à une simple accélération qui donne aux voix un effet « chipmunk », WSOLA dissocie le tempo de la hauteur.
L'algorithme divise l'audio en segments qui se chevauchent, puis les repositionne et les fonds en fondu enchaîné pour produire des changements de vitesse naturels. Résultat : votre audio est lu plus vite ou plus lentement, tandis que les voix et les instruments conservent leur hauteur et leur timbre d'origine.
La qualité est optimale dans la plage 0,5x–2,0x. Au-delà, des échantillons risquent d'être sautés plutôt que fondus. Pour la plupart des usages — transcription, montage, relecture — cette plage standard offre des résultats transparents.
Guide des réglages de vitesse
| Vitesse | Variation de durée | Idéal pour |
|---|---|---|
| 0,5x | 2× plus long | Transcription détaillée, effets audio au ralenti |
| 0,75x | 33 % plus long | Vitesse de transcription standard, apprentissage musical |
| 1,0x | Original | Conversion de format uniquement — sans changement de vitesse |
| 1,25x | 20 % plus court | Relecture rapide d'enregistrements |
| 1,5x | 33 % plus court | Lecture accélérée, écoute condensée |
| 2,0x | 50 % plus court | Relecture express, audio en accéléré |
Changement de vitesse MP3 vers WAV : transcription et montage
Les transcripteurs et les monteurs ont souvent besoin d'un audio à vitesse ajustée au format WAV. Ralentir une interview MP3 à 0,75x et la convertir en WAV produit un fichier utilisable dans n'importe quel logiciel de transcription — Express Scribe, imports Otter.ai, Audacity ou tout DAW professionnel.
Le fichier WAV en sortie évite tout ré-encodage avec pertes supplémentaire lors du changement de vitesse. Le MP3 est décodé, le tempo est ajusté via WSOLA, puis le résultat est enregistré en WAV non compressé. C'est le pipeline le plus propre pour intégrer un audio à vitesse modifiée dans un flux de travail de montage.
Pour les producteurs de podcasts, accélérer la piste WAV d'un invité pour harmoniser le rythme, ou ralentir un passage pour l'accentuer, cet outil crée des fichiers prêts au montage sans ouvrir un DAW.
Conseil transcription : 0,75x est la vitesse la plus utilisée pour la transcription manuelle — assez rapide pour éviter la monotonie, assez lente pour taper sans rembobiner constamment.