SoXr Resampler: Audiophile Abtastraten­konvertierung für WAV in Studioqualität

Erfahren Sie, wie CleverUtils.com die SoXr-Resampler-Bibliothek mit 28-Bit-Präzision und Shibata-Dithering einsetzt, um artefaktfreie WAV-Konvertierungen zu liefern — dieselbe Engine, der Audiophile-Tools wie SoX, foobar2000 und JRiver vertrauen.

Mit SoXr nach WAV konvertieren

SoXr-Resampling wird bei jeder Konvertierung automatisch angewendet

Audio WAV

Tippen, um eine Datei auszuwählen

oder

Supports M4A, WAV, FLAC, OGG, AAC, WMA, AIFF, OPUS • Max 100 MB

SoXr-Resampling wird automatisch angewendet. Dateien werden innerhalb von 2 Stunden gelöscht.

Was ist Audio-Resampling?

Wenn Sie Audio von einer Abtastrate in eine andere konvertieren (z. B. 44,1 kHz MP3 → 48 kHz WAV für die Videobearbeitung), muss jeder einzelne Sample auf einem neuen Zeitraster neu berechnet werden. Dieser Vorgang wird als Resampling bezeichnet.

Ein naiver Ansatz — einfaches Weglassen oder Duplizieren von Samples — erzeugt hörbare Klicks und Aliasing. Professionelle Resampler verwenden mathematische Interpolation (typischerweise Polyphasen-FIR-Filter), um aus diskreten Samples ein kontinuierliches Signal zu rekonstruieren und es dann mit der neuen Rate neu abzutasten. Die Qualität dieser Interpolation entscheidet, ob Ihr Audio transparent bleibt oder Artefakte aufweist.

Schlüsselkonzept: Laut dem Nyquist-Shannon-Theorem kann jedes bandbegrenzte Signal, das mit mehr als der doppelten Frequenz seiner höchsten Komponente abgetastet wird, perfekt rekonstruiert werden. Resampling nutzt dieses Theorem — ein hochwertiger Resampler kann Raten ohne hörbare Qualitätsverluste ändern.

Was ist SoXr?

Die SoXr (SoX Resampler Library) ist eine Open-Source-Resampling-Engine in Audiophile-Qualität, die ursprünglich für das SoX (Sound eXchange) Kommandozeilen-Audiotool entwickelt wurde. Sie verwendet einen FFT-basierten Polyphasen-Algorithmus, der Ergebnisse liefert, die vom Originalsignal praktisch nicht zu unterscheiden sind.

SoXr wird von professioneller Audiosoftware wie foobar2000, JRiver Media Center, MPV und VLC eingesetzt. CleverUtils.com integriert SoXr über den aresample-Filter von FFmpeg und wendet ihn bei jeder WAV-Konvertierung automatisch an.

Parameter Wert Funktion
EngineSoXr (CR64)64-Bit-Gleitkommaberechnung mit doppelter Genauigkeit
Präzision28-Bit~168 dB Signal-Rausch-Verhältnis — weit unterhalb des hörbaren Rauschpegels
DitheringShibataPsychoakustisch geformtes Rauschen, das Quantisierungsartefakte aus dem empfindlichsten Hörbereich von 1–5 kHz herausschiebt
Anti-AliasingAutomatischSteiles Tiefpassfilter verhindert Aliasing beim Downsampling

SoXr vs. FFmpegs Standard-Resampler

FFmpeg enthält zwei Resampling-Backends: das Standard-Backend swresample (SWR) und das optionale soxr. Hier ein Vergleich:

Aspekt swresample (Standard) SoXr
AlgorithmusKaiser-gefenstertes Sinc (lineare Phase)FFT-basiertes überabgetastetes Polyphasen-Verfahren
Interne Präzision16-Bit (Standard) oder 32-Bit-Float64-Bit-Double (CR64-Engine)
Aliasing-UnterdrückungGut (−100 dB typisch)Ausgezeichnet (−168 dB bei precision=28)
DitheringDreieckig (flaches Spektrum)Shibata (rauschgeformt, weniger hörbar)
GeschwindigkeitSchnellerGeringfügig langsamer (~10–15 % mehr CPU)
Durchlassbereich-WelligkeitMessbar nahe NyquistVernachlässigbar
Beste VerwendungEchtzeit-Streaming, VideowiedergabeMastering, Archivierung, Distribution

Fazit: swresample ist auf Geschwindigkeit optimiert und für die Echtzeit-Wiedergabe völlig ausreichend. SoXr ist auf Qualität optimiert und die richtige Wahl, wenn eine Datei gespeichert, verteilt oder weiterbearbeitet werden soll — genau das, wofür ein Konverter gedacht ist.

Shibata-Dithering erklärt

Wenn Audio zwischen Bittiefen konvertiert wird (z. B. 32-Bit-Float intern → 16-Bit-WAV-Ausgabe), entstehen durch Rundungsfehler Quantisierungsrauschen. Dithering fügt vor dem Runden eine winzige Rauschkomponente hinzu, um die unangenehmen Verzerrungsmuster zu eliminieren.

Nicht alle Dithering-Methoden sind gleichwertig. Standard-Dreiecksdithering (TPDF) verteilt das Rauschen gleichmäßig über das Frequenzspektrum. Shibata-Dithering verwendet psychoakustische Rauschformung, um dieses Rauschen in Frequenzbereiche zu verschieben, wo das menschliche Gehör am wenigsten empfindlich ist:

Dither-Typ Rauschverteilung Hörbarkeit
Keins (Abschneiden)Kein Rauschen hinzugefügtSchlechteste Option — hörbarer Klirrfaktor
Rechteckig (RPDF)Flach, zufälligBeseitigt Verzerrung, flacher Rauschpegel
Dreieckig (TPDF)Flach, unkorreliertBesser — kein Modulationsrauschen
Shibata (rauschgeformt)Aus dem Bereich 1–5 kHz verschobenAm wenigsten hörbar — nutzt die Hörkurve aus

Warum das wichtig ist: Das menschliche Gehör ist zwischen 1–5 kHz am empfindlichsten (Fletcher-Munson-Kurve). Shibata-Dithering verschiebt Quantisierungsrauschen in den weniger empfindlichen Hochfrequenzbereich oberhalb von 10 kHz und macht es dadurch selbst auf High-End-Monitoring-Equipment praktisch unhörbar.

Wann findet Resampling statt?

SoXr wird bei jeder WAV-Konvertierung auf CleverUtils.com automatisch angewendet, hat aber in folgenden Szenarien den größten Einfluss:

Szenario Beispiel SoXr-Einfluss
Downsampling von Hi-Res96 kHz FLAC → 44,1 kHz WAVKritisch — verhindert Aliasing-Artefakte
Musik → Video-Rate44,1 kHz MP3 → 48 kHz WAVWichtig — saubere Ratenkonvertierung
Sprach-Downsampling48 kHz Podcast → 22,05 kHz WAVWichtig — erhält Sprachklarheit
Gleiche Rate44,1 kHz MP3 → 44,1 kHz WAVMinimal — Dithering wird bei Bittiefenänderungen weiterhin angewendet

Der größte Qualitätsunterschied zeigt sich beim Downsampling — wenn die Zielrate niedriger als die Quellrate ist. Ohne ordnungsgemäßes Anti-Aliasing (das SoXr automatisch übernimmt) falten sich Frequenzen oberhalb der neuen Nyquist-Grenze als Verzerrungen in den hörbaren Bereich zurück.

28-Bit-Präzision: Was das bedeutet

SoXrs Parameter precision=28 legt die interne Berechnung auf 28 effektive Bits unter Verwendung der CR64-Engine (constant-rate, 64-Bit) fest. Dies entspricht einem Signal-Rausch-Verhältnis von ca. 168 dB.

Zum Vergleich:

  • 16-Bit-Audio hat ~96 dB Dynamikumfang
  • 24-Bit-Audio hat ~144 dB Dynamikumfang
  • SoXr bei precision=28 rechnet mit ~168 dB — 24 dB unterhalb des Rauschpegels selbst von 24-Bit-Audio

Das bedeutet, dass der Resampling-Prozess selbst kein hörbares Rauschen einführt, nicht einmal bei 24-Bit-Mastern. Die interne Berechnung des Resamplers ist leiser als das leiseste Geräusch, das eine Aufnahme in der realen Welt erfassen kann.

Warum nicht precision=32? Höhere Präzisionswerte erhöhen die CPU-Zeit mit abnehmenden Erträgen. Bei precision=28 arbeitet SoXr bereits 24 dB unterhalb des Rauschpegels von 24-Bit-Audio — eine weitere Erhöhung wäre unhörbar und unpraktisch. Dies ist der Sweetspot, den die meisten professionellen Audio-Tools verwenden.

So verwendet CleverUtils SoXr

Jede WAV-Konvertierung auf CleverUtils.com durchläuft diese Pipeline:

  1. Upload — Ihre Audiodatei wird über HTTPS empfangen
  2. Dekodieren — FFmpeg liest das Quellformat (MP3, FLAC, M4A, OGG usw.)
  3. Resampling — SoXr konvertiert zu Ihrer gewählten Abtastrate und Bittiefe
  4. Dithering — Shibata-Rauschformung wird bei der Bittiefen-Konvertierung angewendet
  5. Kodieren — saubere PCM-Samples werden in den WAV-Container geschrieben
  6. Download — Ihre WAV-Datei ist bereit

Der gesamte Prozess ist automatisch. Sie wählen einfach Ihre Zieleinstellungen (Abtastrate, Bittiefe, Kanäle) und CleverUtils erledigt den Rest mit SoXr im Hintergrund. Keine Konfiguration erforderlich, kein „Qualitätsmodus"-Schalter — jede Konvertierung erhält dasselbe Resampling in Studioqualität.

Bereit zur Konvertierung?

Konvertieren Sie Ihr Audio mit SoXr-Resampling nach WAV

Audio WAV

Tippen, um eine Datei auszuwählen

oder

Supports M4A, WAV, FLAC, OGG, AAC, WMA, AIFF, OPUS • Max 100 MB

Häufig gestellte Fragen

SoXr (SoX Resampler Library) ist eine Resampling-Engine in Audiophile-Qualität, die FFT-basierte Polyphasen-Algorithmen mit 28-Bit-Präzision verwendet. FFmpegs Standard-Backend swresample nutzt einen einfacheren Kaiser-gefensterten Sinc-Filter, der nahe der Nyquist-Frequenz messbare Aliasing-Effekte verursachen kann. SoXr eliminiert diese Artefakte vollständig und verwendet Shibata-Dithering für psychoakustisch optimierte Rauschformung.

Shibata-Dithering ist eine psychoakustisch optimierte Rauschformungsmethode, die Quantisierungsrauschen aus dem Bereich von 1–5 kHz herausschiebt, wo das menschliche Gehör am empfindlichsten ist (Fletcher-Munson-Kurve). Das Ergebnis ist Dither-Rauschen, das weniger wahrnehmbar ist als Standard-Dreieck- oder Rechteck-Dithering, obwohl die Gesamtrauschenergie ähnlich ist.

Für das gelegentliche Zuhören ist der Unterschied nicht hörbar. SoXr ist besonders wichtig beim Downsampling von Hi-Res-Audio (z. B. 96 kHz auf 44,1 kHz), wo Aliasing eines minderwertigen Resamplers auf High-End-Monitoring-Equipment hörbar werden könnte. Es gewährleistet auch bit-perfekte Transparenz für professionelle Mastering-Workflows, bei denen kumulative Verarbeitungsfehler eine Rolle spielen.

Nein. SoXr wird bei jeder WAV-Konvertierung auf CleverUtils.com automatisch angewendet. Laden Sie einfach Ihre Datei hoch, wählen Sie Ihre WAV-Einstellungen (Abtastrate, Bittiefe, Kanäle), und der SoXr-Resampler erledigt den Rest. Kein spezieller Schalter oder Konfiguration erforderlich.

Resampling findet immer dann statt, wenn die Ziel-Abtastrate von der Quell-Abtastrate abweicht — zum Beispiel beim Konvertieren eines 44,1 kHz MP3 in 48 kHz WAV für Video oder beim Downsampling eines 96 kHz FLAC auf 44,1 kHz zum CD-Brennen. Selbst wenn die Abtastraten übereinstimmen, sorgt SoXrs Shibata-Dithering für saubere Bittiefen-Übergänge (z. B. internes 32-Bit-Float → 16-Bit-Ausgabe).

Weitere MP3 zu WAV-Anleitungen

WAV-Samplerate & Bittiefe erklärt: Welche Einstellungen Sie verwenden sollten
Verstehen Sie, was Samplerate, Bittiefe und Kanäle für WAV-Dateien bedeuten. Erfahren Sie, welche Einstellungen Sie f...
MP3 zu WAV Geschwindigkeitsänderung: Tempo für die Bearbeitung anpassen
Ändern Sie die Wiedergabegeschwindigkeit von MP3-Dateien und konvertieren Sie sie in unkomprimiertes WAV. Verlangsame...
MP3 zu WAV Bass-Boost: Unkomprimierte Ausgabe für Lautsprecher
Wenden Sie Bass-Boost auf MP3-Dateien an und konvertieren Sie diese in unkomprimiertes WAV. Keine verlustbehaftete Ne...
MP3 zu WAV Lautstärke erhöhen: Leise MP3-Dateien für die Bearbeitung verstärken
Erhöhen Sie die Lautstärke leiser MP3-Aufnahmen und konvertieren Sie sie in unkomprimiertes WAV. Ohne verlustbehaftet...
MP3 zu WAV Fade In/Out: Unkomprimierte Ausgabe mit weichen Übergängen
Fügen Sie Fade-In- und Fade-Out-Effekte zu MP3-Dateien hinzu und konvertieren Sie diese in unkomprimiertes WAV. Wähle...
MP3 zu WAV Lautheits-Normalisierung: Einheitliche Lautstärke für jeden Track
MP3-Dateien aus verschiedenen Alben, Jahrzehnten und Quellen werden bei sehr unterschiedlichen Lautstärkepegeln gemas...
Verbessert die Konvertierung von MP3 zu WAV die Qualität? (Der Mythos erklärt)
„WAV hat eine höhere Qualität als MP3, also sollte das Konvertieren von MP3 zu WAV die Qualität verbessern." Dies ist...
Zurück zum MP3-zu-WAV-Konverter

Funktion vorschlagen

0 / 2000