Wat is sample rate?
De sample rate (bemonsteringsfrequentie) is het aantal keren per seconde dat een analoog audiosignaal wordt gemeten en als digitale waarde vastgelegd. Elke meting heet een sample. Bij 44.100 Hz (44,1 kHz) wordt de audio 44.100 keer per seconde gemeten.
Zie het als de framerate van video: een film met 24 frames per seconde legt 24 stilstaande beelden per seconde vast. Hogere framerates leggen vloeiendere beweging vast. Op dezelfde manier leggen hogere sample rates meer detail in de audio-golfvorm vast.
Het kritieke concept is de Nyquist-stelling: een digitaal systeem kan elke frequentie tot de helft van zijn sample rate perfect reproduceren. Dit frequentieplafond heet de Nyquist-frequentie:
- 44,1 kHz → legt vast tot 22,05 kHz
- 48 kHz → legt vast tot 24 kHz
- 96 kHz → legt vast tot 48 kHz
- 192 kHz → legt vast tot 96 kHz
Het menselijk gehoor reikt tot ongeveer 20 kHz (en realistisch 15–17 kHz voor de meeste volwassenen). Dit betekent dat 44,1 kHz al elke frequentie vastlegt die je kunt horen, met een kleine marge erboven.
De wiskunde is duidelijk: de Nyquist-stelling is geen benadering of vereenvoudiging. Het is wiskundig bewezen dat een sample rate van 2× de hoogste frequentie een perfecte reconstructie van het oorspronkelijke signaal oplevert — geen "bijna perfect", maar wiskundig identiek. Hogere sample rates verbeteren de weergave van hoorbare frequenties niet.
44,1 kHz — De cd-standaard
44,1 kHz werd in 1980 door Sony en Philips gekozen als cd-standaard. Het getal was niet willekeurig — het kwam voort uit de noodzaak om frequenties tot 20 kHz vast te leggen (waarvoor volgens Nyquist minstens 40 kHz nodig is) plus een kleine guard band voor het anti-aliasingfilter. De specifieke waarde 44.100 kwam voort uit de compatibiliteit met de op video gebaseerde PCM-opnamesystemen die destijds in gebruik waren.
- Nyquist-frequentie: 22,05 kHz — ruim boven de bovengrens van 20 kHz van het menselijk gehoor
- Standaard sinds: 1982 (Red Book CD)
- Gebruikt door: cd's, de meeste muziekdownloads, bronbestanden van iTunes/Apple Music, bronbestanden van Spotify
- Niet-gecomprimeerde bitrate (stereo, 16-bit): 1.411 kbps
Na meer dan 40 jaar als dominant muziekformaat geniet 44,1 kHz universele compatibiliteit. Elke MP3-speler, telefoon, autoradio, Bluetooth-luidspreker en DAC ter wereld verwerkt het correct. Het is de veiligste keuze voor muziekdistributie.
48 kHz — De video-/broadcaststandaard
48 kHz werd aangenomen als standaard voor professionele video- en broadcast-audio. Het werd gekozen door de AES (Audio Engineering Society) en gestandaardiseerd in DAT-recorders (Digital Audio Tape).
- Nyquist-frequentie: 24 kHz — iets hoger dan 44,1 kHz, hoewel de extra 2 kHz onhoorbaar zijn
- Standaard sinds: 1985 (DAT), 1995 (DVD)
- Gebruikt door: YouTube, de meeste DAW's (Pro Tools, Logic, standaard Ableton-projecten), DVD/Blu-ray, broadcast-televisie, film
- Niet-gecomprimeerde bitrate (stereo, 16-bit): 1.536 kbps
De reden dat video 48 kHz gebruikt in plaats van 44,1 kHz is grotendeels historisch: video-framerates (24, 25, 30 fps) delen netjes in 48.000, maar niet in 44.100. Dit vereenvoudigt de audio-videosynchronisatie in broadcast- en post-productieworkflows.
Voor MP3-uitvoer: het hoorbare verschil tussen 44,1 kHz en 48 kHz is nul. Beide bestrijken het volledige bereik van het menselijk gehoor. De keuze tussen beide gaat over workflow-compatibiliteit, niet over audiokwaliteit.
96 kHz en hoger — Marketing vs realiteit
High-resolution audio op 96 kHz en 192 kHz wordt sterk gepromoot door apparatuurfabrikanten en "hi-res"-muziekdiensten. Deze sample rates leggen ultrasone frequenties vast die ver boven het menselijk gehoor liggen:
| Sample rate | Nyquist-frequentie | Bestandsgrootte (1 min, 16-bit stereo) | Hoorbaar voordeel? |
|---|---|---|---|
| 44,1 kHz | 22,05 kHz | 10,1 MB | Volledige hoorbereik |
| 48 kHz | 24 kHz | 11 MB | Gelijk aan 44,1 kHz |
| 96 kHz | 48 kHz | 22 MB | Geen — ultrasoon |
| 192 kHz | 96 kHz | 44 MB | Geen — ultrasoon |
Er zijn legitieme productieredenen om op 96 kHz op te nemen:
- Soepeler anti-aliasingfilter: de overgangsband tussen de doorlaatfrequentie en de Nyquist-frequentie is breder, waardoor zachtere filters mogelijk zijn met minder fasevervorming in het hoorbare bereik. Bij 44,1 kHz moet het filter erg steil zijn om alles boven 22 kHz af te kappen.
- Marge voor pitch shifting: audio met 50 % vertragen halveert alle frequenties. Een opname op 96 kHz die een octaaf naar beneden wordt getoonhoogt, heeft nog steeds 48 kHz aan inhoud — alles blijft boven de hoorbaarheidsdrempel.
- Oversampling tijdens verwerking: sommige plug-ins verwerken intern op hogere sample rates om aliasing door niet-lineaire effecten (vervorming, saturatie) te voorkomen.
Voor MP3-uitvoer bieden hoge sample rates echter geen enkel voordeel. De MP3-encoder gebruikt een laagdoorlaatfilter dat alles boven ongeveer 16–20 kHz verwijdert (afhankelijk van de bitrate), en het psychoakoestisch model werkt alleen op hoorbare frequenties. Inhoud boven 22 kHz in een 96 kHz-bron wordt voor het coderen weggegooid.
Welke sample rate voor MP3?
Voor de overgrote meerderheid van de gebruiksgevallen is het antwoord eenvoudig: 44,1 kHz.
| Gebruikssituatie | Aanbevolen sample rate | Reden |
|---|---|---|
| Muziekdistributie | 44,1 kHz | CD-standaard, maximale compatibiliteit |
| Podcasts | 44,1 kHz | Industriestandaard, werkt op alle spelers |
| Videogeluid (YouTube) | 48 kHz | Komt overeen met video-tijdlijn, vermijdt resampling |
| Game-audio | 44,1 of 48 kHz | Hangt af van engine; Unity standaard 44,1, Unreal 48 |
| Beltonen / meldingen | 44,1 kHz | Maximale telefooncompatibiliteit |
| Luisterboeken | 44,1 kHz | Standaard voor alle luisterboekplatforms |
Het enige scenario waarin 48 kHz zinvol is voor MP3, is wanneer de audio deel uitmaakt van een videoproject waarbij de hele pipeline (camera, montage-tijdlijn, export) op 48 kHz draait. In dat geval voorkomt het behouden van 48 kHz een onnodige resampling-stap. Voor alle losstaande audio — muziek, podcasts, spraakopnamen — is 44,1 kHz de juiste keuze.
Wat gebeurt er als je de sample rate verandert
De sample rate van een audiobestand veranderen heet resampling. Het is een wiskundig proces dat de audiogolfvorm op de nieuwe rate herberekent.
Downsampling (bv. 96 kHz naar 44,1 kHz)
Downsampling is veilig en effectief verliesvrij voor luisterdoeleinden. De resampler past een laagdoorlaatfilter toe om frequenties boven de nieuwe Nyquist-frequentie (22,05 kHz voor 44,1 kHz) te verwijderen, en herberekent dan de samples. Omdat de verwijderde frequenties toch al boven het menselijk gehoor lagen, is het hoorbare resultaat identiek.
- 96 → 44,1 kHz: verwijdert inhoud boven 22 kHz (onhoorbaar), bestand ~54 % kleiner
- 48 → 44,1 kHz: verwijdert inhoud boven 22 kHz (onhoorbaar), bestand ~8 % kleiner
Upsampling (bv. 44,1 kHz naar 96 kHz)
Upsampling is wiskundig correct, maar zinloos voor kwaliteitsverbetering. De resampler maakt nieuwe samples door tussen bestaande te interpoleren. Het resulterende bestand is groter (meer samples per seconde), maar bevat geen nieuwe audio-informatie. Frequenties boven 22 kHz zijn nooit vastgelegd door de oorspronkelijke 44,1 kHz-opname, dus ze kunnen niet worden gereconstrueerd.
- 44,1 → 96 kHz: bestand verdubbelt in grootte, geen nieuwe audio-inhoud
- 44,1 → 48 kHz: bestand iets groter, geen hoorbaar verschil
De foto-analogie: downsampling is als een afbeelding bijsnijden om pixels te verwijderen die je toch nooit op je scherm zou zien. Upsampling is als een kleine foto vergroten — je krijgt meer pixels, maar geen extra detail. De nieuwe pixels worden wiskundig afgeleid, niet uit de werkelijkheid vastgelegd.
Bij het converteren van WAV naar MP3 verzorgt de encoder indien nodig automatisch het resamplen. Als je bron-WAV 96 kHz is en je codeert naar MP3 op 44,1 kHz, voert de encoder tijdens het coderen het downsamplen uit. Het is niet nodig om het WAV-bestand vooraf apart te resamplen.