Wie die tonhöhenerhaltende Geschwindigkeitsänderung funktioniert
CleverUtils verwendet den WSOLA-Algorithmus (Waveform Similarity Overlap-Add) — dieselbe Time-Stretching-Methode, die von professionellen DAWs und Mediaplayern eingesetzt wird. Anders als beim einfachen Vorspulen, bei dem Stimmen wie Chipmunks klingen, trennt WSOLA Tempo und Tonhöhe voneinander.
Der Algorithmus unterteilt Audio in überlappende Segmente, positioniert sie neu und führt Crossfades durch, um natürlich klingende Geschwindigkeitsänderungen zu erzeugen. Das Ergebnis: Ihr Audio wird schneller oder langsamer wiedergegeben, während Stimmen und Instrumente ihre ursprüngliche Tonhöhe und Klangcharakteristik beibehalten.
Die Qualität ist im Bereich 0,5x–2,0x am besten. Außerhalb dieses Bereichs werden Samples eher übersprungen als gemischt. Für die meisten Anwendungsfälle — Transkription, Bearbeitung, Überprüfung — liefert der Standardbereich transparente Ergebnisse.
Leitfaden zu den Geschwindigkeitseinstellungen
| Geschwindigkeit | Daueränderung | Geeignet für |
|---|---|---|
| 0,5x | 2× länger | Detaillierte Transkription, Zeitlupen-Audioeffekte |
| 0,75x | 33 % länger | Standard-Transkriptionsgeschwindigkeit, Musiklernen |
| 1,0x | Original | Nur Formatkonvertierung — keine Geschwindigkeitsänderung |
| 1,25x | 20 % kürzer | Schnelles Überprüfen von Aufnahmen |
| 1,5x | 33 % kürzer | Schnellere Wiedergabe, komprimiertes Zuhören |
| 2,0x | 50 % kürzer | Schnelldurchsicht, Zeitraffer-Audio |
MP3-zu-WAV-Geschwindigkeitsänderung: Transkription und Bearbeitung
Transkriptionisten und Editoren benötigen häufig geschwindigkeitsangepasstes Audio im WAV-Format. Ein MP3-Interview auf 0,75x verlangsamen und in WAV konvertieren erzeugt eine Datei, die in jeder Transkriptionssoftware funktioniert — Express Scribe, Otter.ai-Importe, Audacity oder professionelle DAWs.
Die WAV-Ausgabe bedeutet, dass bei der Geschwindigkeitsänderung keine zusätzliche verlustbehaftete Re-Kodierung stattfindet. Die MP3 wird dekodiert, das Tempo per WSOLA angepasst und als unkomprimiertes WAV gespeichert. Dies ist die sauberste mögliche Pipeline, um geschwindigkeitsangepasstes Audio in einen Bearbeitungs-Workflow zu integrieren.
Für Podcast-Produzenten, die den WAV-Stem eines Gastes beschleunigen möchten, um das Tempo anzupassen, oder einen Abschnitt zur Betonung verlangsamen möchten, erstellt dieses Tool bearbeitungsfertige Dateien, ohne eine DAW öffnen zu müssen.
Transkriptionstipp: 0,75x ist die beliebteste Geschwindigkeit für manuelle Transkription — schnell genug, um keine Langeweile aufkommen zu lassen, langsam genug, um ohne ständiges Zurückspulen mittippen zu können.