¿Qué es la frecuencia de muestreo?
La frecuencia de muestreo (sample rate) es el número de veces por segundo que se mide y registra una señal de audio analógica como valor digital. Cada medición se denomina muestra. A 44.100 Hz (44,1 kHz), el audio se mide 44.100 veces cada segundo.
Piénsalo como la velocidad de fotogramas de un vídeo: una película a 24 fotogramas por segundo capta 24 imágenes fijas por segundo. Tasas de fotogramas más altas captan movimientos más fluidos. De forma similar, frecuencias de muestreo más altas capturan más detalle en la forma de onda del audio.
El concepto crítico es el teorema de Nyquist: un sistema digital puede reproducir perfectamente cualquier frecuencia hasta la mitad de su frecuencia de muestreo. Este techo de frecuencia se denomina frecuencia de Nyquist:
- 44,1 kHz → capta hasta 22,05 kHz
- 48 kHz → capta hasta 24 kHz
- 96 kHz → capta hasta 48 kHz
- 192 kHz → capta hasta 96 kHz
La audición humana llega como mucho a unos 20 kHz (y de forma realista 15–17 kHz para la mayoría de adultos). Esto significa que 44,1 kHz ya capta cualquier frecuencia que puedas oír, con un pequeño margen por encima.
Las matemáticas están claras: el teorema de Nyquist no es una aproximación ni una simplificación. Está demostrado matemáticamente que una frecuencia de muestreo de 2× la frecuencia más alta proporciona una reconstrucción perfecta de la señal original — no «casi perfecta», sino matemáticamente idéntica. Frecuencias de muestreo más altas no mejoran la reproducción de las frecuencias audibles.
44,1 kHz — El estándar del CD
44,1 kHz fue elegido como estándar del CD en 1980 por Sony y Philips. La cifra no fue arbitraria — se derivó de la necesidad de captar frecuencias hasta 20 kHz (lo que requiere al menos 40 kHz por Nyquist) más una pequeña banda de guarda para el filtro anti-aliasing. El valor concreto de 44.100 procedía de la compatibilidad con los sistemas de grabación PCM basados en vídeo utilizados en aquel momento.
- Frecuencia de Nyquist: 22,05 kHz — cómodamente por encima del límite superior de 20 kHz de la audición humana
- Estándar desde: 1982 (CD Red Book)
- Usado por: CDs, la mayoría de descargas musicales, archivos fuente de iTunes/Apple Music, archivos fuente de Spotify
- Bitrate sin comprimir (estéreo, 16-bit): 1.411 kbps
Tras más de 40 años como formato musical dominante, 44,1 kHz disfruta de compatibilidad universal. Todo reproductor MP3, teléfono, autorradio, altavoz Bluetooth y DAC del planeta lo gestiona correctamente. Es la opción más segura para distribución musical.
48 kHz — El estándar de vídeo/broadcast
48 kHz fue adoptado como estándar para audio profesional de vídeo y broadcast. Fue elegido por la AES (Audio Engineering Society) y estandarizado en grabadoras DAT (Digital Audio Tape).
- Frecuencia de Nyquist: 24 kHz — ligeramente superior a 44,1 kHz, aunque los 2 kHz extra son inaudibles
- Estándar desde: 1985 (DAT), 1995 (DVD)
- Usado por: YouTube, la mayoría de DAWs (Pro Tools, Logic, proyectos por defecto de Ableton), DVD/Blu-ray, televisión broadcast, cine
- Bitrate sin comprimir (estéreo, 16-bit): 1.536 kbps
La razón por la que el vídeo usa 48 kHz en lugar de 44,1 kHz es en gran parte histórica: las velocidades de fotogramas de vídeo (24, 25, 30 fps) dividen exactamente 48.000 pero no 44.100. Esto simplifica la sincronización audio-vídeo en flujos de trabajo de broadcast y postproducción.
Para salida MP3: la diferencia audible entre 44,1 kHz y 48 kHz es nula. Ambos cubren todo el rango de la audición humana. La elección entre ellos es cuestión de compatibilidad de flujo de trabajo, no de calidad de audio.
96 kHz y superior — Marketing vs realidad
El audio de alta resolución a 96 kHz y 192 kHz es muy promocionado por fabricantes de equipos y servicios de música «hi-res». Estas frecuencias de muestreo capturan frecuencias ultrasónicas muy por encima de la audición humana:
| Frecuencia de muestreo | Frecuencia de Nyquist | Tamaño de archivo (1 min, 16-bit estéreo) | ¿Beneficio audible? |
|---|---|---|---|
| 44,1 kHz | 22,05 kHz | 10,1 MB | Rango completo audible |
| 48 kHz | 24 kHz | 11 MB | Igual que 44,1 kHz |
| 96 kHz | 48 kHz | 22 MB | Ninguno — ultrasónico |
| 192 kHz | 96 kHz | 44 MB | Ninguno — ultrasónico |
Existen razones legítimas de producción para grabar a 96 kHz:
- Filtro anti-aliasing más suave: la banda de transición entre la frecuencia de paso y la frecuencia de Nyquist es más ancha, lo que permite filtros más suaves con menos distorsión de fase en el rango audible. A 44,1 kHz, el filtro debe ser muy abrupto para cortar todo lo que esté por encima de 22 kHz.
- Margen para pitch shifting: ralentizar el audio un 50 % reduce a la mitad todas las frecuencias. Una grabación a 96 kHz bajada una octava aún tiene 48 kHz de contenido — todo permanece por encima del umbral audible.
- Sobremuestreo durante el procesado: algunos plugins procesan internamente a frecuencias más altas para evitar aliasing causado por efectos no lineales (distorsión, saturación).
Sin embargo, para salida MP3, las frecuencias de muestreo altas no aportan ningún beneficio. El codificador MP3 usa un filtro paso-bajo que elimina todo por encima de aproximadamente 16–20 kHz (según el bitrate), y el modelo psicoacústico solo opera sobre frecuencias audibles. Cualquier contenido por encima de 22 kHz en una fuente de 96 kHz se descarta antes de la codificación.
¿Qué frecuencia de muestreo para MP3?
Para la gran mayoría de casos de uso, la respuesta es simple: 44,1 kHz.
| Caso de uso | Frecuencia recomendada | Razón |
|---|---|---|
| Distribución musical | 44,1 kHz | Estándar CD, máxima compatibilidad |
| Pódcasts | 44,1 kHz | Estándar de la industria, funciona en todos los reproductores |
| Banda sonora de vídeo (YouTube) | 48 kHz | Coincide con la línea de tiempo del vídeo, evita resampleo |
| Audio de videojuegos | 44,1 o 48 kHz | Depende del motor; Unity por defecto 44,1, Unreal 48 |
| Tonos de llamada / alertas | 44,1 kHz | Máxima compatibilidad con teléfonos |
| Audiolibros | 44,1 kHz | Estándar para todas las plataformas de audiolibros |
El único escenario donde 48 kHz tiene sentido para MP3 es cuando el audio forma parte de un proyecto de vídeo en el que toda la cadena (cámara, línea de tiempo de edición, exportación) trabaja a 48 kHz. En ese caso, mantener el audio a 48 kHz evita un paso de resampleo innecesario. Para todo audio independiente — música, pódcasts, grabaciones de voz — 44,1 kHz es la elección correcta.
Qué ocurre cuando cambias la frecuencia de muestreo
Cambiar la frecuencia de muestreo de un archivo de audio se llama resampleo. Es un proceso matemático que recalcula la forma de onda del audio a la nueva frecuencia.
Downsampling (p. ej., 96 kHz a 44,1 kHz)
El downsampling es seguro y prácticamente sin pérdida a efectos de escucha. El resampleador aplica un filtro paso-bajo para eliminar las frecuencias por encima de la nueva frecuencia de Nyquist (22,05 kHz para 44,1 kHz), y luego recalcula las muestras. Como las frecuencias eliminadas estaban de todos modos por encima de la audición humana, el resultado audible es idéntico.
- 96 → 44,1 kHz: elimina contenido por encima de 22 kHz (inaudible), archivo ~54 % más pequeño
- 48 → 44,1 kHz: elimina contenido por encima de 22 kHz (inaudible), archivo ~8 % más pequeño
Upsampling (p. ej., 44,1 kHz a 96 kHz)
El upsampling es matemáticamente correcto pero inútil para mejorar la calidad. El resampleador crea nuevas muestras interpolando entre las existentes. El archivo resultante es mayor (más muestras por segundo) pero no contiene nueva información de audio. Las frecuencias por encima de 22 kHz nunca fueron capturadas en la grabación original a 44,1 kHz, por lo que no se pueden reconstruir.
- 44,1 → 96 kHz: el archivo duplica su tamaño, ningún contenido nuevo de audio
- 44,1 → 48 kHz: archivo ligeramente mayor, ninguna diferencia audible
La analogía de la foto: el downsampling es como recortar una imagen para eliminar píxeles que nunca verás en tu pantalla. El upsampling es como ampliar una foto pequeña — obtienes más píxeles, pero no más detalle. Los nuevos píxeles se infieren matemáticamente, no se capturan de la realidad.
Al convertir WAV a MP3, el codificador maneja el resampleo automáticamente si es necesario. Si tu WAV fuente está a 96 kHz y codificas a MP3 a 44,1 kHz, el codificador hace el downsampling durante el proceso de codificación. No hace falta resamplear el archivo WAV por separado de antemano.