Fundamentos de la Visión Humana
La retina humana contiene dos tipos de células detectoras de luz: bastones y conos. Los bastones detectan brillo (luminancia) y superan en número a los conos — aproximadamente 120 millones de bastones versus solo 6 millones de conos. Los conos detectan color (crominancia) y vienen en tres subtipos (rojo, verde, azul), cada uno respondiendo a una longitud de onda diferente de luz.
Esta proporción de 20:1 tiene una consecuencia profunda: su sistema visual resuelve el brillo con mucho más detalle espacial que resuelve el color. Puede detectar un borde de brillo agudo (texto negro sobre papel blanco) hasta aproximadamente 1 arcminuto de ángulo visual. Pero para un borde de color puro (texto rojo sobre fondo verde a igual brillo), su resolución baja dramáticamente — necesita aproximadamente 4× el tamaño para detectar el mismo nivel de detalle.
Este hecho biológico es la base de prácticamente toda compresión de imágenes y videos con pérdida. JPEG, MPEG, H.264, HEVC, AV1 — todos explotan el mismo principio. Reduzca la resolución del color mientras mantiene la resolución de brillo intacta, y el ojo humano no lo nota. El nombre técnico para esta técnica es el submuestreo de crominancia.
Espacio de Color YCbCr
Su pantalla de computadora funciona en el espacio de color RGB (Rojo, Verde, Azul), donde cada píxel obtiene tres valores que definen su color mediante la mezcla de luz. Pero JPEG no comprime RGB directamente. Antes de que comience la compresión, JPEG convierte cada píxel de RGB a YCbCr:
- Y (Luma) — el componente de brillo. Esto lleva la información de luminancia: qué tan claro u oscuro es cada píxel. Si extrajera solo el canal Y, vería una versión perfecta en escala de grises de la imagen.
- Cb (Croma Azul) — la diferencia de color azul-amarillo. Esto describe cuánto se desvía el color del píxel del gris en la dirección azul/amarillo.
- Cr (Croma Rojo) — la diferencia de color rojo-verde. Esto describe la desviación en la dirección rojo/verde.
Esta separación es la idea clave. Una vez que el brillo y el color están en canales separados, puede tratarlos de forma independiente. Mantenga Y a resolución completa para bordes nítidos y detalles finos. Reduzca la resolución de Cb y Cr porque el ojo no lo notará. Eso es submuestreo de crominancia.
¿Por qué no simplemente comprimir RGB? En RGB, la información de brillo se distribuye entre los tres canales. No puede reducir la resolución del color sin también reducir la resolución del brillo. YCbCr separa claramente los dos, permitiendo una compresión selectiva que coincida con la percepción humana.
El Sistema de Notación: Qué Significan 4:4:4, 4:2:2 y 4:2:0
El submuestreo de crominancia utiliza una notación de tres números J:a:b que describe cómo se distribuyen las muestras de color en un bloque de referencia. La notación es notoriamente confusa, pero aquí está el significado práctico:
4:4:4 — Sin Submuestreo (Color Completo)
Cada píxel individual obtiene su propio valor de luminancia (Y) y sus propios valores de color (Cb, Cr). Nada se reduce. Esto produce la salida de la más alta calidad y los archivos más grandes. Para cada 4 píxeles en una fila, hay 4 muestras de luma y 4 muestras de croma.
4:2:2 — Submuestreo Horizontal
Cada píxel conserva su propio valor de luminancia, pero la resolución del color se reduce a la mitad horizontalmente. En cada fila de 4 píxeles, hay 4 muestras de luma pero solo 2 muestras de croma. Cada par de píxeles adyacentes horizontalmente comparte un valor de color. La resolución del color vertical permanece sin cambios.
4:2:0 — Submuestreo Horizontal y Vertical
Cada píxel conserva su propio valor de luminancia, pero la resolución del color se reduce a la mitad tanto horizontal como verticalmente. Un bloque de 2×2 de cuatro píxeles comparte un único valor de color. Este es el esquema de submuestreo común más agresivo — y el más utilizado, porque proporciona ahorros dramáticos de tamaño de archivo con impacto visual insignificante en fotografías.
| Submuestreo | Resolución del Color | Reducción de Datos | Tamaño de Archivo vs 4:4:4 | Mejor Para |
|---|---|---|---|---|
| 4:4:4 | Completa (1:1) | Ninguna | Línea base (mayor) | Texto, gráficos, capturas de pantalla |
| 4:2:2 | Reducida horizontalmente | 33% menos datos de croma | ~10–15% menor | Video profesional, transmisión |
| 4:2:0 | Reducida de ambas formas (bloque 2×2) | 75% menos datos de croma | ~25–33% menor | Fotos, imágenes web, video de consumo |
La columna de "reducción de datos" se refiere solo a los canales de crominancia. Como el canal de luminancia (que lleva la mayor parte de la información visual) nunca se submuestrea, la reducción total del tamaño de archivo es menor de lo que la reducción bruta de croma sugiere. En la práctica, cambiar de 4:4:4 a 4:2:0 ahorra aproximadamente 25–33% del tamaño total del archivo con la misma configuración de calidad.
Impacto Visual: Cuándo Importa y Cuándo No
El impacto visual del submuestreo de crominancia depende completamente del contenido de la imagen. Para algunas imágenes, 4:2:0 es indistinguible de 4:4:4. Para otras, la diferencia es claramente visible.
Fotografías: 4:2:0 es Prácticamente Invisible
Las fotografías naturales contienen degradados suave de color — cielo, piel, follaje, agua, tela. Estos degradados no tienen bordes de color nítidos para que el ojo los detecte. Cuando reduce la resolución del color a la mitad en ambas dimensiones, las transiciones de color permanecen suaves porque los degradados originales eran suaves. En comparaciones lado a lado, incluso los fotógrafos capacitados tienen dificultades para distinguir 4:2:0 de 4:4:4 en fotos típicas.
Por eso cada cámara de consumo, cada plataforma de redes sociales y cada navegador web utiliza 4:2:0 para fotos JPEG por defecto. El compromiso de calidad es abrumadoramente favorable: archivos 25–33% más pequeños sin diferencia de calidad visible.
Texto y Gráficos: 4:2:0 Crea Artefactos Visibles
Las capturas de pantalla, las maquetas de interfaz de usuario, los logotipos, los diagramas y las imágenes con mucho texto son otra historia. Estos contienen transiciones de color nítidas — una letra roja sobre fondo blanco, un botón verde con texto blanco, una línea azul sobre una cuadrícula gris. Cuando el submuestreo 4:2:0 promedia el color en un bloque de píxeles 2×2, estos bordes agudos se vuelven borrosos.
El resultado es franja de color — una mancha visible de color que se filtra más allá de los bordes de elementos nítidos. El texto negro sobre fondo blanco generalmente es bueno porque el contraste es puramente en el canal de luminancia (negro y blanco difieren solo en brillo). Pero texto de color sobre fondo contrastante es donde los artefactos 4:2:0 se vuelven obvios.
| Tipo de Contenido | 4:4:4 | 4:2:2 | 4:2:0 |
|---|---|---|---|
| Fotos de paisaje | Perfecto | Perfecto | Perfecto |
| Retratos / tonos de piel | Perfecto | Perfecto | Perfecto |
| Fotos de productos | Perfecto | Perfecto | Perfecto |
| Texto negro sobre blanco | Perfecto | Perfecto | Bueno |
| Texto de color / elementos de interfaz | Perfecto | Franja leve | Franja visible |
| Capturas de pantalla de código | Perfecto | Franja leve | Notable |
| Logotipos con líneas de color fino | Perfecto | Artefactos menores | Sangrado de color |
Impacto en el Tamaño del Archivo
Los ahorros de tamaño de archivo del submuestreo de crominancia son sustanciales y consistentes. En una imagen sin comprimir, cada píxel tiene tres componentes: Y, Cb y Cr. A 4:4:4, los tres se almacenan a resolución completa. A 4:2:0, los canales Cb y Cr contienen solo el 25% de las muestras — una reducción del 75% en los datos de crominancia.
Dado que los canales de crominancia representan aproximadamente un tercio a la mitad de los datos totales (según el contenido de la imagen y la compresión), el impacto práctico en el tamaño del archivo es:
| Submuestreo | Tamaño de Archivo Típico | Ejemplo (foto de 10 MP a Q85) |
|---|---|---|
| 4:4:4 | Línea base (100%) | ~3,2 MB |
| 4:2:2 | ~85–90% | ~2,8 MB |
| 4:2:0 | ~67–75% | ~2,3 MB |
Para un sitio web que sirve miles de imágenes, la diferencia entre 4:4:4 y 4:2:0 se suma dramáticamente. Una galería de fotos con 100 imágenes ahorra aproximadamente 90 MB de ancho de banda usando 4:2:0 en lugar de 4:4:4, sin diferencia de calidad visible para contenido fotográfico.
Compuesto con calidad: Los ahorros de submuestreo de crominancia se componen con la reducción de calidad JPEG. A Q85 con 4:2:0, una foto es aproximadamente 5–8 veces más pequeña que el PNG original — la configuración de calidad y el submuestreo trabajan juntos para reducir el tamaño del archivo mucho más allá de lo que cada uno logra solo.
Comportamiento y Valores Por Defecto de ImageMagick
El codificador JPEG de ImageMagick selecciona automáticamente el submuestreo de crominancia basado en la configuración -quality. Este es uno de los aspectos más pasados por alto de la compresión JPEG con ImageMagick:
| Configuración de Calidad | Submuestreo Por Defecto | Razón |
|---|---|---|
| Q90–Q100 | 4:4:4 | Se solicita alta calidad → conservar color completo |
| Q1–Q89 | 4:2:0 | Calidad inferior → compresión agresiva |
Este cambio automático significa que establecer la calidad a 90 versus 89 produce un aumento desproporcionado en el tamaño del archivo. No es solo un paso de calidad — es el paso de calidad más el cambio de 4:2:0 a 4:4:4 en submuestreo. Muchos usuarios notan que los archivos Q90 son sorprendentemente más grandes que los archivos Q89 y asumen que ImageMagick está roto. No es así — el cambio de submuestreo es el culpable.
Anulación del Valor Por Defecto
Puede controlar explícitamente el submuestreo de crominancia con la bandera -sampling-factor:
# 4:4:4 (no subsampling — best for text/graphics)
convert input.png -quality 85 -sampling-factor 1x1 output.jpg
# 4:2:2 (balanced — used in professional video)
convert input.png -quality 85 -sampling-factor 2x1 output.jpg
# 4:2:0 (smallest — best for photos)
convert input.png -quality 85 -sampling-factor 2x2 output.jpg
El factor de muestreo usa el formato HxV donde H es muestreo horizontal y V es muestreo vertical. 1x1 significa sin submuestreo (4:4:4), 2x1 significa reducido horizontalmente (4:2:2) y 2x2 significa reducido en ambas direcciones (4:2:0).
Q85 + 4:4:4: Una técnica común para capturas de pantalla e imágenes con mucho texto es -quality 85 -sampling-factor 1x1. Esto le da ahorros de tamaño de archivo de la configuración de calidad mientras preserva la resolución de color completa para texto nítido. Sin -sampling-factor 1x1, Q85 usa 4:2:0 por defecto y el texto de color tendrá franja visible.
Recomendaciones por Tipo de Contenido
Aquí hay una guía práctica de decisión para elegir el submuestreo de crominancia correcto:
Use 4:2:0 Cuando:
- Fotografías de cualquier tipo — paisajes, retratos, fotos de productos, comida, arquitectura
- Imágenes web — imágenes destacadas, ilustraciones de blog, publicaciones en redes sociales
- Adjuntos de correo electrónico — la reducción de tamaño de archivo ayuda con los límites de adjuntos
- Miniaturas y vistas previas — el tamaño de pantalla pequeño enmascaras cualquier posible artefacto
- Cualquier imagen donde el tamaño del archivo importe más que los bordes de color perfectos
Use 4:4:4 Cuando:
- Capturas de pantalla con texto de color — código con resaltado de sintaxis, elementos de interfaz de color
- Logotipos y activos de marca — los límites de color precisos importan para la integridad de la marca
- Diagramas técnicos — las líneas y etiquetas de color necesitan bordes nítidos
- Maquetas de interfaz de usuario y archivos de diseño — reproducción de color perfecta requerida
- Imágenes médicas o científicas — la precisión del color es crítica
Use 4:2:2 Cuando:
- Producción de video profesional — estándar de transmisión para contenido de estudio
- Imágenes de contenido mixto — fotos con superposiciones de texto donde 4:4:4 es excesivo pero 4:2:0 crea franjas visibles
- Fotografía de gama alta donde se requiere la calidad absoluta máxima pero los tamaños de archivo 4:4:4 son impracticables
En caso de duda: Para fotografías, use 4:2:0 sin dudarlo. Para cualquier cosa con texto o bordes de color nítidos, use 4:4:4. El punto medio 4:2:2 rara vez es necesario para imágenes fijas — es principalmente un formato de producción de video.
Submuestreo de Crominancia Más Allá de JPEG
El submuestreo de crominancia no es único para JPEG. Prácticamente todos los medios visuales con pérdida lo utilizan:
| Formato / Codec | Submuestreo Común | Notas |
|---|---|---|
| JPEG | 4:2:0 (por defecto), 4:4:4 | Valor por defecto depende del codificador |
| WebP | 4:2:0 (modo con pérdida) | Sin opción para 4:4:4 en WebP con pérdida |
| AVIF | 4:2:0, 4:4:4 | 4:4:4 disponible pero aumenta el tamaño del archivo |
| H.264 / H.265 video | 4:2:0 (consumidor), 4:2:2 (pro) | 4:4:4 solo en perfiles especializados |
| Blu-ray / Streaming | 4:2:0 | Estándar para todo video de consumo |
| PNG | Ninguno (sin pérdida) | RGB completo preservado, sin submuestreo |
WebP es notable por no ofrecer 4:4:4 en su modo con pérdida. Si tiene una captura de pantalla con texto de color y necesita el archivo más pequeño con colores nítidos, WebP con pérdida puede no ser ideal — use JPEG a 4:4:4, PNG (sin pérdida) o WebP sin pérdida en su lugar.
AVIF, el nuevo competidor, admite 4:4:4 y lo combina con compresión más eficiente que JPEG. Para imágenes ricas en texto que deben comprimirse con pérdida, AVIF con 4:4:4 puede producir archivos más pequeños que JPEG 4:4:4 a la misma calidad visual.