¿Qué es stereo vs mono?
El audio stereo utiliza dos channels independientes — izquierdo y derecho. Cada channel lleva una señal distinta, lo que crea una sensación de amplitud espacial: las guitarras pueden situarse a la izquierda, las voces en el centro, los teclados a la derecha. Esta separación espacial imita cómo percibimos el sonido en el mundo real con dos oídos.
El audio mono (monoaural) usa un solo channel. La misma señal sale de ambos altavoces o auriculares. No hay separación espacial — todo se sitúa en el centro del escenario sonoro.
- Stereo: 2 channels, imagen espacial, escenario sonoro más amplio
- Mono: 1 channel, sonido centrado, igual por ambos altavoces
La distinción importa más de lo que parece. Para contenido basado en voz como los podcasts, el mono no solo es suficiente — suele ser preferible. Para música con una mezcla stereo cuidada, pasar a mono significa perder la dimensión espacial que buscaba el productor.
Distinción importante: un archivo «stereo» puede contener channels izquierdo y derecho idénticos (dual mono). Esto es solo audio mono desperdiciando espacio en un contenedor stereo. El verdadero stereo tiene contenido distinto en cada channel.
Impacto en el tamaño del archivo
A igual bitrate, los archivos MP3 mono son aproximadamente un 50 % más pequeños que los stereo. Esto se debe a que el mono codifica un channel en lugar de dos, reduciendo efectivamente a la mitad los datos necesarios.
| Bitrate | Stereo (1 hora) | Mono (1 hora) | Ahorro |
|---|---|---|---|
| 320 kbps | 144 MB | 72 MB | 72 MB (50 %) |
| 192 kbps | 86 MB | 43 MB | 43 MB (50 %) |
| 128 kbps | 58 MB | 29 MB | 29 MB (50 %) |
| 96 kbps | 43 MB | 22 MB | 21 MB (~50 %) |
| 64 kbps | 29 MB | 14,5 MB | 14,5 MB (50 %) |
Para un podcast semanal que publica 4 episodios de una hora al mes, pasar de 128 kbps stereo a 96 kbps mono ahorra ~144 MB al mes de almacenamiento en el hosting — y los oyentes descargan más rápido sin pérdida perceptible de calidad para la voz.
Alternativamente: en lugar de usar mono para ahorrar espacio al mismo bitrate, puedes usar mono a un bitrate más alto para obtener mejor calidad con el mismo tamaño de archivo que el stereo. Por ejemplo, 128 kbps mono suena mejor que 128 kbps stereo porque todo el presupuesto de bitrate va a un único channel.
Cuándo usar mono
El mono es la opción adecuada cuando el contenido de audio es intrínsecamente de fuente única o cuando el campo stereo no aporta valor:
- Podcasts: Apple Podcasts recomienda mono para programas hablados. La voz de un único narrador es mono por naturaleza — no hay información espacial que preservar.
- Audiolibros: al igual que los podcasts, los audiolibros son una sola voz. El mono reduce el tamaño del archivo a la mitad sin penalización de calidad.
- Notas de voz y dictados: grabados con el único micrófono de un teléfono, son señales mono almacenadas en contenedores stereo. Convertir a verdadero mono reduce a la mitad el tamaño del archivo.
- Grabaciones telefónicas y de VoIP: el audio de teléfono es intrínsecamente mono, típicamente a 8–16 kHz.
- Sistemas PA y megafonía pública: la mayoría de los montajes PA son mono. Los archivos stereo se mezclan a mono para la reproducción de todos modos.
- Música de fondo para vídeo: cuando la música suena bajo por detrás de una narración, la amplitud stereo es imperceptible. El mono ahorra ancho de banda.
Cuándo usar stereo
El stereo es esencial cuando la dimensión espacial del audio forma parte de la experiencia:
- Música: los productores pasan horas colocando los instrumentos en el campo stereo. Pasar a mono colapsa ese trabajo — guitarras, teclados y coros se amontonan en el centro.
- Diseño sonoro y audio de cine: sonidos ambientales, ambience y efectos dependen del posicionamiento stereo (o surround) para la inmersión.
- Grabaciones binaurales: grabadas con dos micrófonos colocados en la posición de los oídos humanos, el audio binaural crea una experiencia de escucha 3D que queda totalmente destruida con la conversión a mono.
- Grabaciones de conciertos en directo: la imagen stereo captura el ambiente de la sala y la posición del público.
- ASMR y audio espacial: todo el atractivo depende de los sonidos que se mueven entre los channels izquierdo y derecho.
Joint stereo: lo mejor de ambos mundos
Los codificadores MP3 (incluido LAME, el codificador open source de referencia) ofrecen un modo llamado joint stereo que combina la eficiencia del mono con la calidad espacial del stereo.
El joint stereo funciona dividiendo los dos channels en:
- Mid (M): la suma de izquierdo + derecho — la señal central compatible con mono
- Side (S): la diferencia entre izquierdo y derecho — la información de amplitud stereo
Como la señal mid transporta la mayor parte de la energía de audio, y la señal side suele ser más tranquila y más sencilla, el codificador puede asignar más bits al mid y menos al side. Resultado: mejor calidad global que codificar izquierdo y derecho de forma independiente al mismo bitrate.
| Modo stereo | Cómo funciona | Ideal para |
|---|---|---|
| Stereo simple | L y R codificados de forma independiente | Bitrates altos (256+ kbps) |
| Joint stereo (M/S) | Codificación Mid/Side, adaptativa por frame | Casi todo contenido (por defecto en LAME) |
| Mono forzado | L+R mezclados en un solo channel | Voz, podcasts, notas de voz |
El modo auto joint stereo predeterminado de LAME alterna dinámicamente entre M/S y stereo simple frame a frame, eligiendo el que produce mejor calidad para cada frame de 26 milisegundos. Por eso la configuración por defecto es casi siempre la mejor opción para contenido musical stereo.
Consejo práctico: para música, deja activado el modo joint stereo por defecto del codificador. Para voz y podcasts, selecciona mono explícitamente para obtener el ahorro de tamaño. El joint stereo solo ayuda si hay contenido stereo real que preservar.
Estándares de la industria del podcast
La industria del podcast se ha estandarizado en gran medida en MP3 mono para la distribución. Esto es lo que recomiendan las principales plataformas:
| Plataforma | Formato recomendado | Notas |
|---|---|---|
| Apple Podcasts | MP3, 96 kbps mono | Mono recomendado para contenido hablado |
| Spotify | MP3, 96–128 kbps | Acepta tanto mono como stereo |
| Google Podcasts | MP3, hasta 320 kbps | Sin recomendación específica mono/stereo |
| Libsyn | MP3, 128 kbps mono | Ahorra almacenamiento en el plan de hosting |
| Buzzsprout | MP3, 96 kbps mono | Optimiza automáticamente las subidas a mono |
El razonamiento es directo: la voz de un único narrador no lleva información stereo. Codificarla como stereo duplica el tamaño del archivo sin ningún beneficio audible. Incluso los programas tipo entrevista donde dos personas hablan alternadamente no se benefician realmente del stereo — el cerebro del oyente localiza el habla por el contenido, no por la posición del pan.
Para episodios de podcast con segmentos musicales integrados (jingles de intro/outro, música de fondo), algunos podcasters graban en stereo pero distribuyen en mono. La ligera pérdida de amplitud stereo en los segmentos musicales es un compromiso valioso a cambio de la reducción del 50 % en el tamaño del archivo de todo el episodio.