Estándar de la industria: 96–128 kbps CBR mono
Si quieres la respuesta corta: codifica tu podcast como MP3, 96–128 kbps, CBR, mono, 44,1 kHz. Es lo que recomienda Apple Podcasts, lo que acepta Spotify y lo que prácticamente toda plataforma de hosting de podcasts espera.
| Ajuste | Valor recomendado | Por qué |
|---|---|---|
| Formato | MP3 | Compatibilidad universal en todas las apps de podcast |
| Bitrate | 96–128 kbps | 96 para voz pura; 128 si hay segmentos musicales |
| Modo de bitrate | CBR (bitrate constante) | Navegación fiable, tamaño de archivo predecible |
| Canales | Mono | La voz es mono; reduce a la mitad el tamaño frente a estéreo |
| Sample rate | 44,1 kHz | Estándar del CD, máxima compatibilidad |
| Loudness | -16 LUFS | Estándar para plataformas de podcast |
Regla rápida: 96 kbps mono para programas 100 % hablados. 128 kbps mono si tu podcast tiene segmentos musicales importantes (jingles de intro/outro, música de fondo). Pasar de 128 kbps en un podcast malgasta almacenamiento y ancho de banda sin beneficio audible para la voz.
¿Por qué CBR y no VBR?
Para música, VBR (bitrate variable) suele preferirse porque asigna más bits a pasajes complejos y menos al silencio, mejorando la calidad por byte. Para podcasts, sin embargo, CBR es la opción más segura por varias razones prácticas:
- Navegación fiable: los archivos CBR permiten a los reproductores de podcast calcular cualquier posición temporal a partir del desplazamiento en bytes. VBR requiere una tabla de búsqueda separada (cabecera Xing/VBRI), y algunas apps antiguas no la manejan bien — provocando tiempos inexactos o saltos a la posición equivocada.
- Estimación precisa de duración: los feeds RSS incluyen un tamaño de archivo (enclosure length). Con CBR, las apps pueden estimar la duración del episodio solo a partir del tamaño. VBR lo hace imposible sin analizar la cabecera.
- Tamaños de archivo predecibles: con CBR puedes calcular tamaños exactos antes de codificar. A 96 kbps, cada minuto cuesta exactamente 720 KB. Esto facilita la planificación de almacenamiento en tu cuenta de hosting.
- Fiabilidad en streaming: CBR transmite a tasa constante, más fácil de gestionar por los algoritmos de buffer de las apps de podcast, especialmente en conexiones móviles lentas.
La ventaja de calidad de VBR sobre CBR es mínima para contenido hablado. La voz es mucho menos compleja que la música, así que VBR ahorraría bits sobre todo en silencios — donde la calidad da igual. Los beneficios prácticos de CBR superan la ganancia marginal de eficiencia de VBR para podcasts.
¿Por qué mono en los podcasts?
Un podcast con un solo narrador es, por naturaleza, audio mono. La voz proviene de una sola fuente y no lleva información estéreo significativa. Codificarla en estéreo duplica el tamaño del archivo sin beneficio audible.
- Archivos 50 % más pequeños: un episodio de 1 hora a 96 kbps mono pesa ~42 MB. El mismo episodio a 96 kbps estéreo pesaría ~42 MB pero con el bitrate repartido entre dos canales idénticos, reduciendo la calidad por canal.
- Recomendación de Apple: Apple Podcasts recomienda explícitamente mono para podcasts de palabra hablada en sus directrices para podcasters.
- Mejor calidad por bit: al mismo bitrate, mono asigna todos los bits a un canal. A 96 kbps mono, cada segundo recibe 96 kbits de datos. A 96 kbps estéreo, cada canal recibe solo ~48 kbits. La versión mono suena notablemente mejor.
- Reproducción universal: el audio mono suena idéntico por ambos altavoces/auriculares. Los oyentes escuchan lo mismo con un auricular o con los dos.
Programas de entrevistas: incluso las entrevistas a dos personas se distribuyen típicamente en mono. Podrías panoramizar al anfitrión y al invitado a izquierda y derecha, pero eso genera una experiencia desagradable para quien usa un solo auricular. La mayoría de podcasters profesionales mezclan todas las voces al centro y exportan en mono.
Sample rate: quédate con 44,1 kHz
Para distribución de podcasts, 44,1 kHz es el sample rate correcto. Aquí el porqué:
- Estándar del CD: 44,1 kHz es el estándar de audio digital desde 1982. Todo dispositivo, app y plataforma lo soporta sin remuestreo.
- Supera las necesidades de la voz: la voz humana va de unos 85 Hz a 8 kHz (con silbidos que llegan a ~12 kHz). 44,1 kHz captura frecuencias hasta 22,05 kHz — muy por encima de cualquier contenido del habla.
- Máxima compatibilidad: algunos decodificadores MP3 antiguos y sistemas embebidos pueden no manejar correctamente archivos MP3 a 48 kHz. 44,1 kHz funciona en todas partes.
- Ningún beneficio al subir más: 48 kHz, 96 kHz o sample rates mayores capturan frecuencias ultrasónicas que no existen en la voz y que, además, la codificación MP3 no preserva.
Si tu software de grabación captura a 48 kHz (común en DAWs orientadas a vídeo), la conversión a 44,1 kHz durante la codificación MP3 es automática y sin pérdida audible para contenido hablado. Los codificadores modernos manejan este remuestreo de forma transparente.
Planificación de tamaño para hosts de podcast
Los planes de hosting de podcasts suelen estar limitados por almacenamiento (p. ej., los planes de Libsyn se basan en cuota mensual de subida). Conocer los tamaños de archivo con antelación ayuda a elegir el plan adecuado y evitar excesos.
| Duración | 96 kbps mono | 128 kbps mono | 128 kbps estéreo | 192 kbps estéreo |
|---|---|---|---|---|
| 15 min | 10,5 MB | 14 MB | 14 MB | 21 MB |
| 30 min | 21 MB | 28 MB | 28 MB | 42 MB |
| 1 hora | 42 MB | 56 MB | 56 MB | 84 MB |
| 2 horas | 84 MB | 112 MB | 112 MB | 168 MB |
Para un programa semanal que publica 4 episodios de una hora al mes:
- 96 kbps mono: ~168 MB/mes — cabe en el plan básico de Libsyn (250 MB)
- 128 kbps mono: ~224 MB/mes — ajustado en el plan de 250 MB
- 192 kbps estéreo: ~336 MB/mes — requiere un plan mayor
Fórmula rápida: tamaño (MB) = bitrate (kbps) × duración (segundos) ÷ 8.000. Por ejemplo, 96 kbps × 3.600 segundos ÷ 8.000 = 43,2 MB para un episodio de 1 hora.
Etiquetas ID3 para podcasts
Las etiquetas ID3 son metadatos incrustados en el archivo MP3. Las apps de podcast las leen para mostrar la información del episodio. Archivos bien etiquetados parecen profesionales y ayudan a los oyentes a navegar tu contenido.
- Título (TIT2): el título del episodio. Que sea conciso — los títulos largos se truncan en las interfaces de las apps de podcast.
- Artista (TPE1): el nombre de tu podcast/programa.
- Álbum (TALB): el nombre de tu podcast/programa (igual que el artista en la mayoría de podcasts).
- Número de pista (TRCK): número de episodio (ayuda a ordenar en algunas apps).
- Género (TCON): pon «Podcast».
- Año (TDRC): año de publicación.
- Carátula (APIC): arte del episodio o del programa. Mantenla por debajo de 500 KB — imágenes grandes hinchan cada archivo de episodio. Usa JPEG a 1400×1400 o 3000×3000 píxeles comprimido a calidad 70–80.
Aunque los feeds RSS también transportan estos metadatos, las etiquetas ID3 embebidas aseguran que la información permanezca con el archivo, incluso al descargarse por separado o compartirse fuera de una app de podcast.
Normalización para un volumen constante
La normalización de loudness asegura que tu podcast suene a un volumen constante — sin saltos ni caídas bruscas que obliguen al oyente a tocar el volumen.
La industria del podcast ha adoptado -16 LUFS (Loudness Units Full Scale) como objetivo:
- -16 LUFS: el estándar en la mayoría de plataformas de podcast. Lo bastante alto para oírse claro en entornos ruidosos, lo bastante bajo para evitar distorsión.
- -14 LUFS: usado por Spotify para música. Algunos podcasters apuntan a este valor para una reproducción un poco más alta, pero deja menos headroom.
- Límite de true peak: mantén los picos en o por debajo de -1 dBTP (decibelios True Peak). Esto evita artefactos de clipping por picos inter-muestra durante la codificación MP3 y la reconstrucción DAC.
| Plataforma | Loudness objetivo | Límite true peak |
|---|---|---|
| Apple Podcasts | -16 LUFS | -1 dBTP |
| Spotify | -14 LUFS (música) / -16 LUFS (voz) | -1 dBTP |
| YouTube | -14 LUFS | -1 dBTP |
| EBU R128 (radiodifusión) | -23 LUFS | -1 dBTP |
Aplica la normalización de loudness antes de la codificación MP3, durante tu etapa de edición/masterización. Normalizar tras la codificación puede introducir pérdida de calidad adicional. La mayoría de software de edición de podcast (Audacity, Hindenburg, Adobe Audition, Descript) incluye la normalización de loudness como función estándar.
La consistencia importa más que la cifra exacta. Un podcast que se mantiene en -18 LUFS suena mejor para el oyente que uno que oscila entre -12 y -22 LUFS de un episodio a otro. Elige un objetivo y mantenlo en todos los episodios.