So funktioniert tonhöhenerhaltende Geschwindigkeitsanpassung
Herkömmliche Geschwindigkeitsänderung erhöht die Tonhöhe beim Beschleunigen (Chipmunk-Effekt) und senkt sie beim Verlangsamen. Moderne Zeitdehnungsalgorithmen lösen dieses Problem, indem sie Tempo und Tonhöhe voneinander trennen.
CleverUtils verwendet WSOLA (Waveform Similarity Overlap-Add), einen zeitdomänenbasierten Algorithmus, der das Audio in kurze überlappende Segmente zerlegt, diese neu positioniert und übergeblendet. Beim Beschleunigen überlappen sich die Segmente stärker; beim Verlangsamen werden Lücken mit interpoliertem Audio gefüllt.
Das Ergebnis ist eine Tempoänderung ohne Tonhöhenverschiebung — Stimmen klingen bei jeder Geschwindigkeit natürlich. WSOLA funktioniert am besten im Bereich von 0,5x bis 2,0x. Jenseits dieser Grenzen werden Artefakte spürbar, da der Algorithmus an seine Grenzen stößt.
So funktioniert es: WSOLA analysiert die Wellenformähnlichkeit, um optimale Überlappungspunkte zu finden, und blendet dann zwischen Segmenten über. Dadurch wird das natürliche Timbre und die Tonhöhe des Originalaudios erhalten, während nur die Wiedergabedauer geändert wird.
Leitfaden zu Geschwindigkeitseinstellungen
Wählen Sie den richtigen Geschwindigkeitsmultiplikator für Ihren Anwendungsfall:
| Geschwindigkeit | Dauerveränderung | Am besten für | Qualität |
|---|---|---|---|
| 0,5x | 2× länger | Musikübung, detaillierte Transkription | Gut — leichte Artefakte möglich |
| 0,75x | 1,33× länger | Intensive Vorlesungen, Sprachenlernen | Ausgezeichnet |
| 1,0x | Keine Änderung | Originalgeschwindigkeit (nur Formatkonvertierung) | Perfekt |
| 1,25x | 20% kürzer | Podcasts (Einsteiger beim Schnellhören) | Ausgezeichnet |
| 1,5x | 33% kürzer | Podcasts, Hörbücher (beliebteste Einstellung) | Ausgezeichnet |
| 1,75x | 43% kürzer | Erfahrene Schnellhörer | Sehr gut |
| 2,0x | 50% kürzer | Schnelle Wiederholung, bekannte Inhalte | Gut — Sprache noch verständlich |
AAC-Geschwindigkeitsanpassung: Podcasts und Streaming-Audio
AAC ist der Standard-Audiocodec für Apple Podcasts, YouTube und viele Streaming-Dienste. Als AAC-Dateien heruntergeladene Podcast-Episoden gehören zu den am häufigsten geschwindigkeitsangepassten Audiodateien — über 25% der Podcast-Hörer verwenden schnellere Wiedergabegeschwindigkeiten.
Der beliebteste Arbeitsablauf: Eine Podcast-Episode herunterladen (oft als AAC), auf 1,5x beschleunigen und für das Offline-Hören auf jedem Gerät in MP3 konvertieren. Dies spart ein Drittel der Hörzeit, während die Stimme des Moderators natürlich und verständlich bleibt.
Für Lehrinhalt ermöglicht die Verlangsamung von AAC-Vorlesungen auf 0,75x den Studierenden mehr Zeit zum Verarbeiten komplexer Inhalte und zum Mitschreiben. Der tonhöhenerhaltende Algorithmus stellt sicher, dass die Stimme des Professors in ihrer natürlichen Lage bleibt, anstatt künstlich tief zu klingen.
Beliebt bei Podcast-Hörern: 1,5x-Geschwindigkeit kürzt eine 60-minütige Episode auf 40 Minuten, während die Sprache vollkommen klar bleibt. Beginnen Sie mit 1,25x, wenn Sie neu beim Schnellhören sind.