Cómo Funciona la Calidad Vorbis
La mayoría de los códecs de audio (MP3, AAC) te permiten elegir un bitrate objetivo — 128 kbps, 256 kbps, 320 kbps. El codificador decide qué conservar y qué descartar para alcanzar ese número. Vorbis adopta un enfoque diferente: estableces un nivel de calidad y el codificador determina cuántos bits necesita cada fotograma de audio según su complejidad.
En FFmpeg y la mayoría de las herramientas de codificación, el parámetro de calidad Vorbis va de 0 a 10 (algunas herramientas permiten valores fraccionarios e incluso negativos hasta -1). Mayor calidad implica:
- Se preserva más detalle espectral
- Se asignan más bits por fotograma
- Archivos de salida más grandes
- Mayor fidelidad a la fuente lossless original
Como Vorbis es inherentemente VBR, el bitrate varía constantemente. Un archivo Q5 puede codificar un pasaje silencioso a 60 kbps y un clímax orquestal complejo a 250 kbps. Los números siguientes son promedios para música estéreo típica.
Sintaxis FFmpeg: ffmpeg -i input.wav -c:a libvorbis -q:a 5 output.ogg — el parámetro -q:a establece el nivel de calidad (0–10).
Tabla de Calidad a Bitrate
La siguiente tabla muestra los bitrates promedio para audio estéreo a 44,1 kHz. Los bitrates reales varían según el contenido — la música compleja promedia más, mientras que el habla y el audio simple promedian menos.
| Nivel de Calidad | Bitrate Prom. (estéreo) | Calidad Perceptual | Equivalente MP3 |
|---|---|---|---|
| Q-1 | ~45 kbps | Muy bajo — artefactos severos | ~64 kbps CBR |
| Q0 | ~64 kbps | Bajo — artefactos notorios | ~80–96 kbps CBR |
| Q1 | ~80 kbps | Aceptable para voz | ~96–112 kbps CBR |
| Q2 | ~96 kbps | Buena para voz, aceptable para música | ~112–128 kbps CBR |
| Q3 | ~112 kbps | Buena — artefactos menores en audio complejo | ~128–160 kbps CBR |
| Q4 | ~128 kbps | Buena — equivalente al nivel gratuito de Spotify | ~160 kbps CBR |
| Q5 | ~160 kbps | Muy buena — transparente para la mayoría | ~192 kbps CBR / VBR V2 |
| Q6 | ~192 kbps | Excelente — casi transparente | ~224 kbps CBR / VBR V1 |
| Q7 | ~224 kbps | Transparente — indistinguible de la fuente | ~256 kbps CBR / VBR V0 |
| Q8 | ~256 kbps | Transparente | ~280–320 kbps CBR |
| Q9 | ~320 kbps | Transparente — nivel Premium de Spotify | ~320 kbps CBR |
| Q10 | ~500 kbps | Máximo — excesivo para escucha | Sin equivalente en MP3 |
Ajustes Recomendados según el Caso de Uso
El nivel de calidad "correcto" depende totalmente de lo que estés codificando y dónde se va a usar:
| Caso de Uso | Calidad Recomendada | Canales | Por qué |
|---|---|---|---|
| Voz / podcasts | Q2–Q3 | Mono | La voz tiene contenido espectral simple; Q2 mono (~48 kbps) es transparente |
| Música general | Q5 | Estéreo | ~160 kbps — transparente para la mayoría, buen equilibrio tamaño/calidad |
| Archivado de alta calidad | Q7 | Estéreo | ~224 kbps — indistinguible de la fuente, tamaño de archivo razonable |
| Efectos de sonido (juegos) | Q1–Q3 | Mono | Los efectos cortos toleran más compresión; mono ahorra un 50% frente a estéreo |
| Música de fondo (juegos) | Q4–Q5 | Estéreo | Equilibra el tamaño de descarga con la calidad de música durante el juego |
| Streaming de audio web | Q4 | Estéreo | ~128 kbps — carga rápida, buena calidad para audio de fondo |
| Calidad máxima | Q8–Q10 | Estéreo | Rendimientos decrecientes por encima de Q7 — usa FLAC si necesitas lossless real |
Cómo Spotify se Relaciona con la Escala de Calidad
Spotify es el mayor usuario de OGG Vorbis del mundo. Entender sus niveles de calidad ayuda a contextualizar la escala:
- Bajo (móvil gratuito): ~96 kbps — aproximadamente Q2. Compresión audible en música compleja, pero clara para voz y pistas simples.
- Normal (escritorio gratuito): ~160 kbps — aproximadamente Q5. El punto de equilibrio que suena bien a la mayoría con cualquier equipo.
- Alta calidad: ~160 kbps — igual que Normal, disponible para todos los usuarios.
- Muy alta (Premium): ~320 kbps — aproximadamente Q9. Calidad transparente en cualquier equipo.
Si Q5 es suficientemente bueno para más de 600 millones de oyentes de Spotify, es un valor predeterminado sólido para la mayoría de las aplicaciones. El Q9 Premium es esencialmente un ajuste "sin compromisos" donde el tamaño del archivo es irrelevante porque Spotify gestiona el ancho de banda.
Consejo: al convertir OGG a MP3, iguala o supera ligeramente el nivel de calidad OGG. Un archivo OGG Q5 (~160 kbps) se convierte bien a MP3 VBR V2 (~190 kbps). Consulta nuestra guía de bitrate OGG a MP3 para una correspondencia detallada.
El Umbral de Transparencia
Transparencia en compresión de audio significa que el archivo comprimido es perceptualmente indistinguible del original lossless en pruebas de escucha a ciegas. Para OGG Vorbis, la comunidad Hydrogenaudio — la comunidad de pruebas de audio más rigurosa en línea — ha establecido referencias claras:
- Q5 (~160 kbps): transparente para la mayoría de los oyentes con equipos típicos. Los artefactos solo son detectables con "muestras asesinas" muy específicas elegidas para exponer las debilidades del códec.
- Q7 (~224 kbps): transparente para prácticamente todos los oyentes, incluidos ingenieros de audio entrenados con equipos de referencia. Consenso de Hydrogenaudio: "casi nadie percibe diferencias por encima de Q7".
- Q8–Q10: más allá de la percepción humana. Estos ajustes existen para usuarios que quieren certeza matemática, pero no ofrecen ningún beneficio audible sobre Q7.
La conclusión práctica: Q5 es el mínimo para una escucha consciente de la calidad, Q7 es el techo de la mejora audible. Cualquier valor por encima de Q7 desperdicia espacio de almacenamiento sin ningún beneficio perceptual.
Tamaño de Archivo por Minuto en Cada Nivel de Calidad
La siguiente tabla muestra los tamaños de archivo aproximados para un minuto de audio estéreo a 44,1 kHz en cada nivel de calidad Vorbis:
| Calidad | Bitrate Prom. | Tamaño / Min. | Tamaño / Canción 4 min | Tamaño / Álbum 60 min |
|---|---|---|---|---|
| Q0 | ~64 kbps | 0,48 MB | 1,9 MB | 28,8 MB |
| Q1 | ~80 kbps | 0,60 MB | 2,4 MB | 36,0 MB |
| Q2 | ~96 kbps | 0,72 MB | 2,9 MB | 43,2 MB |
| Q3 | ~112 kbps | 0,84 MB | 3,4 MB | 50,4 MB |
| Q4 | ~128 kbps | 0,96 MB | 3,8 MB | 57,6 MB |
| Q5 | ~160 kbps | 1,20 MB | 4,8 MB | 72,0 MB |
| Q6 | ~192 kbps | 1,44 MB | 5,8 MB | 86,4 MB |
| Q7 | ~224 kbps | 1,68 MB | 6,7 MB | 100,8 MB |
| Q8 | ~256 kbps | 1,92 MB | 7,7 MB | 115,2 MB |
| Q9 | ~320 kbps | 2,40 MB | 9,6 MB | 144,0 MB |
| Q10 | ~500 kbps | 3,75 MB | 15,0 MB | 225,0 MB |
| WAV (ref) | 1.411 kbps | 10,1 MB | 40,3 MB | 605 MB |
A Q5, un álbum completo de 60 minutos ocupa apenas 72 MB — aproximadamente el 12% del tamaño WAV sin comprimir. Pasar a Q7 lo aumenta a ~101 MB (17% del WAV). El salto de Q7 a Q10 más que duplica el tamaño del archivo (de 101 MB a 225 MB) sin ningún beneficio audible para la mayoría de los oyentes.
Para desarrolladores de juegos: usar Q2 mono para efectos de sonido en lugar de Q5 estéreo reduce el tamaño del archivo aproximadamente un 75% (0,36 MB/min frente a 1,20 MB/min). Para un juego con 30 minutos de efectos de sonido, eso representa más de 25 MB ahorrados en la descarga.