Was ist die Sample Rate?
Die Sample Rate (Abtastfrequenz) ist die Anzahl der Messungen eines analogen Audiosignals pro Sekunde, die als digitaler Wert gespeichert werden. Jede Messung wird als Sample (Abtastwert) bezeichnet. Bei 44.100 Hz (44,1 kHz) wird das Audio 44.100 Mal pro Sekunde gemessen.
Stellen Sie es sich wie die Bildrate eines Videos vor: Ein Film mit 24 Bildern pro Sekunde erfasst 24 Standbilder pro Sekunde. Höhere Bildraten erfassen flüssigere Bewegungen. Ebenso erfassen höhere Sample Rates mehr Details in der Audio-Wellenform.
Das entscheidende Konzept ist das Nyquist-Theorem: Ein digitales System kann jede Frequenz bis zur Hälfte seiner Sample Rate perfekt reproduzieren. Diese Frequenzobergrenze nennt man die Nyquist-Frequenz:
- 44,1 kHz → erfasst bis zu 22,05 kHz
- 48 kHz → erfasst bis zu 24 kHz
- 96 kHz → erfasst bis zu 48 kHz
- 192 kHz → erfasst bis zu 96 kHz
Das menschliche Gehör endet bei etwa 20 kHz (realistisch 15–17 kHz bei den meisten Erwachsenen). Das bedeutet: 44,1 kHz erfasst bereits jede hörbare Frequenz mit etwas Reserve nach oben.
Die Mathematik ist eindeutig: Das Nyquist-Theorem ist keine Näherung oder Vereinfachung. Es ist mathematisch bewiesen, dass eine Sample Rate des 2×-Wertes der höchsten Frequenz eine perfekte Rekonstruktion des Originalsignals liefert — nicht „nahezu perfekt", sondern mathematisch identisch. Höhere Sample Rates verbessern die Wiedergabe hörbarer Frequenzen nicht.
44,1 kHz — Der CD-Standard
44,1 kHz wurde 1980 von Sony und Philips als CD-Standard gewählt. Die Zahl war nicht willkürlich — sie ergab sich aus der Notwendigkeit, Frequenzen bis 20 kHz zu erfassen (laut Nyquist mindestens 40 kHz erforderlich) plus einem kleinen Schutzband für den Anti-Aliasing-Filter. Der konkrete Wert von 44.100 stammte aus der Kompatibilität mit den damals genutzten videobasierten PCM-Aufnahmesystemen.
- Nyquist-Frequenz: 22,05 kHz — komfortabel über der 20-kHz-Obergrenze des menschlichen Gehörs
- Standard seit: 1982 (Red Book CD)
- Verwendet von: CDs, den meisten Musik-Downloads, iTunes/Apple-Music-Quelldateien, Spotify-Quelldateien
- Unkomprimierte Bitrate (Stereo, 16-bit): 1.411 kbps
Nach über 40 Jahren als dominierendes Musikformat genießt 44,1 kHz universelle Kompatibilität. Jeder MP3-Player, jedes Smartphone, jedes Autoradio, jeder Bluetooth-Lautsprecher und jeder DAC der Welt verarbeitet es korrekt. Es ist die sicherste Wahl für die Musikdistribution.
48 kHz — Der Video-/Broadcast-Standard
48 kHz wurde als Standard für professionelles Video- und Broadcast-Audio übernommen. Es wurde von der AES (Audio Engineering Society) gewählt und in DAT-Recordern (Digital Audio Tape) standardisiert.
- Nyquist-Frequenz: 24 kHz — geringfügig höher als 44,1 kHz, wobei die zusätzlichen 2 kHz unhörbar sind
- Standard seit: 1985 (DAT), 1995 (DVD)
- Verwendet von: YouTube, den meisten DAWs (Pro Tools, Logic, Standard-Projekten in Ableton), DVD/Blu-ray, Broadcast-TV, Film
- Unkomprimierte Bitrate (Stereo, 16-bit): 1.536 kbps
Der Grund, warum Video 48 kHz statt 44,1 kHz nutzt, ist überwiegend historisch: Video-Bildraten (24, 25, 30 fps) teilen sich glatt in 48.000, aber nicht in 44.100. Das vereinfacht die Audio-Video-Synchronisation in Broadcast- und Postproduktions-Workflows.
Für die MP3-Ausgabe: Der hörbare Unterschied zwischen 44,1 kHz und 48 kHz ist null. Beide erfassen den gesamten Bereich des menschlichen Gehörs. Die Wahl zwischen ihnen betrifft die Workflow-Kompatibilität, nicht die Audioqualität.
96 kHz und höher — Marketing vs. Realität
Hochauflösendes Audio bei 96 kHz und 192 kHz wird stark von Geräteherstellern und „Hi-Res"-Musikdiensten beworben. Diese Sample Rates erfassen Ultraschallfrequenzen weit jenseits des menschlichen Gehörs:
| Sample Rate | Nyquist-Frequenz | Dateigröße (1 Min., 16-bit Stereo) | Hörbarer Vorteil? |
|---|---|---|---|
| 44,1 kHz | 22,05 kHz | 10,1 MB | Voller Hörbereich |
| 48 kHz | 24 kHz | 11 MB | Identisch mit 44,1 kHz |
| 96 kHz | 48 kHz | 22 MB | Keiner — Ultraschall |
| 192 kHz | 96 kHz | 44 MB | Keiner — Ultraschall |
Es gibt legitime Produktionsgründe, mit 96 kHz aufzunehmen:
- Sanfterer Anti-Aliasing-Filter: Das Übergangsband zwischen Durchlassfrequenz und Nyquist-Frequenz ist breiter, was sanftere Filter mit weniger Phasenverzerrung im hörbaren Bereich erlaubt. Bei 44,1 kHz muss der Filter sehr steil sein, um alles über 22 kHz zu kappen.
- Reserve für Pitch Shifting: Eine Verlangsamung um 50 % halbiert alle Frequenzen. Eine 96-kHz-Aufnahme, die um eine Oktave nach unten gepitched wird, hat noch 48 kHz Inhalt — alles bleibt über der Hörschwelle.
- Oversampling während der Verarbeitung: Manche Plugins arbeiten intern mit höheren Sample Rates, um Aliasing durch nichtlineare Effekte (Verzerrung, Sättigung) zu vermeiden.
Für die MP3-Ausgabe bringen hohe Sample Rates jedoch keinerlei Vorteil. Der MP3-Encoder verwendet einen Tiefpassfilter, der alles über etwa 16–20 kHz entfernt (je nach Bitrate), und das psychoakustische Modell arbeitet nur mit hörbaren Frequenzen. Inhalte über 22 kHz in einer 96-kHz-Quelle werden vor dem Encoding verworfen.
Welche Sample Rate für MP3?
Für die überwiegende Mehrheit der Anwendungsfälle ist die Antwort einfach: 44,1 kHz.
| Anwendungsfall | Empfohlene Sample Rate | Grund |
|---|---|---|
| Musikdistribution | 44,1 kHz | CD-Standard, maximale Kompatibilität |
| Podcasts | 44,1 kHz | Branchenstandard, funktioniert auf allen Playern |
| Video-Tonspur (YouTube) | 48 kHz | Passt zur Video-Timeline, vermeidet Resampling |
| Game-Audio | 44,1 oder 48 kHz | Hängt von der Engine ab; Unity Standard 44,1, Unreal 48 |
| Klingeltöne / Benachrichtigungen | 44,1 kHz | Maximale Telefon-Kompatibilität |
| Hörbücher | 44,1 kHz | Standard für alle Hörbuch-Plattformen |
Das einzige Szenario, in dem 48 kHz für MP3 sinnvoll ist, ist, wenn das Audio Teil eines Videoprojekts ist, in dem die gesamte Pipeline (Kamera, Schnitt-Timeline, Export) mit 48 kHz läuft. In diesem Fall vermeidet das Beibehalten von 48 kHz einen unnötigen Resampling-Schritt. Für jedes eigenständige Audio — Musik, Podcasts, Sprachaufnahmen — ist 44,1 kHz die richtige Wahl.
Was passiert, wenn Sie die Sample Rate ändern
Das Ändern der Sample Rate einer Audiodatei nennt man Resampling. Es ist ein mathematischer Prozess, der die Audio-Wellenform mit der neuen Rate neu berechnet.
Downsampling (z. B. 96 kHz auf 44,1 kHz)
Downsampling ist sicher und für Hörzwecke faktisch verlustfrei. Der Resampler wendet einen Tiefpassfilter an, um Frequenzen über der neuen Nyquist-Frequenz (22,05 kHz für 44,1 kHz) zu entfernen, und berechnet dann die Samples neu. Da die entfernten Frequenzen ohnehin oberhalb des menschlichen Gehörs lagen, ist das hörbare Ergebnis identisch.
- 96 → 44,1 kHz: entfernt Inhalt über 22 kHz (unhörbar), ~54 % kleinere Datei
- 48 → 44,1 kHz: entfernt Inhalt über 22 kHz (unhörbar), ~8 % kleinere Datei
Upsampling (z. B. 44,1 kHz auf 96 kHz)
Upsampling ist mathematisch sauber, aber sinnlos für Qualitätsverbesserung. Der Resampler erzeugt neue Samples durch Interpolation zwischen vorhandenen. Die resultierende Datei ist größer (mehr Samples pro Sekunde), enthält aber keine neuen Audioinformationen. Frequenzen über 22 kHz wurden in der ursprünglichen 44,1-kHz-Aufnahme nie erfasst und können daher nicht rekonstruiert werden.
- 44,1 → 96 kHz: Datei verdoppelt sich in der Größe, kein neuer Audioinhalt
- 44,1 → 48 kHz: Datei geringfügig größer, kein hörbarer Unterschied
Die Foto-Analogie: Downsampling ist wie das Zuschneiden eines Bildes, um Pixel zu entfernen, die Sie auf Ihrem Bildschirm nie sehen werden. Upsampling ist wie das Vergrößern eines kleinen Fotos — Sie bekommen mehr Pixel, aber keine zusätzlichen Details. Die neuen Pixel werden mathematisch gefolgert, nicht aus der Realität erfasst.
Bei der Konvertierung von WAV zu MP3 übernimmt der Encoder das Resampling bei Bedarf automatisch. Wenn Ihre WAV-Quelle 96 kHz hat und Sie zu MP3 mit 44,1 kHz encodieren, führt der Encoder das Downsampling während des Encoding-Prozesses durch. Es ist nicht nötig, die WAV-Datei vorher separat zu resamplen.