Grundlagen des menschlichen Sehvermögens
Die menschliche Netzhaut enthält zwei Arten von Lichtzellen: Stäbchen und Zapfen. Stäbchen erkennen Helligkeit (Luminanz) und sind bei weitem zahlreicher als Zapfen — etwa 120 Millionen Stäbchen gegenüber nur 6 Millionen Zapfen. Zapfen erkennen Farbe (Chrominanz) und es gibt drei Untertypen (Rot, Grün, Blau), die jeweils auf eine andere Lichtwellenlänge reagieren.
Dieses Verhältnis von 20:1 hat eine tiefgreifende Konsequenz: Ihr Sehsystem löst Helligkeit mit einer viel höheren räumlichen Auflösung auf als es Farbe auflöst. Sie können eine scharfe Helligkeitskante (schwarzer Text auf weißem Papier) bis zu etwa 1 Bogenminute Sehwinkel erkennen. Aber bei einer reinen Farbkante (roter Text auf grünem Hintergrund bei gleicher Helligkeit) sinkt Ihre Auflösung dramatisch — Sie benötigen ungefähr 4× die Größe, um das gleiche Detailniveau zu erkennen.
Diese biologische Tatsache ist die Grundlage für praktisch alle verlustbehaftete Bild- und Videokompression. JPEG, MPEG, H.264, HEVC, AV1 — sie alle nutzen das gleiche Prinzip. Reduzieren Sie die Farbauflösung, während die Helligkeitsauflösung erhalten bleibt, und das menschliche Auge bemerkt es nicht. Der Fachbegriff für diese Technik ist die Chroma-Unterabtastung.
YCbCr-Farbraum
Ihr Computerbildschirm arbeitet im RGB-Farbraum (Rot, Grün, Blau), wobei jedes Pixel drei Werte erhält, die seine Farbe durch Lichtmischung definieren. Aber JPEG komprimiert RGB nicht direkt. Bevor die Kompression beginnt, konvertiert JPEG jeden Pixel von RGB zu YCbCr:
- Y (Luma) — die Helligkeitskomponente. Dies trägt die Leuchtdichteinformation: wie hell oder dunkel jedes Pixel ist. Wenn Sie nur den Y-Kanal extrahiert hätten, würden Sie eine perfekte Graustufen-Version des Bildes sehen.
- Cb (Chroma Blau) — der Blau-Gelb-Farbunterschied. Dies beschreibt, wie sehr die Farbe des Pixels von Grau in der Blau-/Gelbrichtung abweicht.
- Cr (Chroma Rot) — der Rot-Grün-Farbunterschied. Dies beschreibt die Abweichung in der Rot-/Grünrichtung.
Diese Trennung ist die Schlüsselidee. Sobald Helligkeit und Farbe in separaten Kanälen sind, können Sie sie unabhängig voneinander behandeln. Behalten Sie Y in voller Auflösung für scharfe Kanten und feine Details. Reduzieren Sie Cb und Cr, da das Auge es nicht bemerkt. Das ist die Chroma-Unterabtastung.
Warum nicht einfach RGB komprimieren? In RGB ist die Helligkeitsinformation auf alle drei Kanäle verteilt. Sie können die Farbauflösung nicht reduzieren, ohne auch die Helligkeitsauflösung zu reduzieren. YCbCr trennt die beiden sauber und ermöglicht eine selektive Kompression, die der menschlichen Wahrnehmung entspricht.
Das Notationssystem: Was 4:4:4, 4:2:2 und 4:2:0 bedeuten
Die Chroma-Unterabtastung verwendet eine dreistellige Notation J:a:b, die beschreibt, wie Farbproben in einem Referenzblock verteilt werden. Die Notation ist bekannt verwirrend, aber hier ist die praktische Bedeutung:
4:4:4 — Keine Unterabtastung (vollständige Farbe)
Jedes einzelne Pixel erhält einen eigenen Leuchtdichtewert (Y) und eigene Farbwerte (Cb, Cr). Nichts wird reduziert. Dies erzeugt die höchste Ausgabequalität und die größten Dateien. Für alle 4 Pixel in einer Zeile gibt es 4 Luma-Proben und 4 Chroma-Proben.
4:2:2 — Horizontale Unterabtastung
Jedes Pixel behält seinen eigenen Leuchtdichtewert, aber die Farbauflösung wird horizontal halbiert. In jeder Zeile von 4 Pixeln gibt es 4 Luma-Proben, aber nur 2 Chroma-Proben. Jedes Paar horizontal benachbarter Pixel teilt einen Farbwert. Die vertikale Farbauflösung bleibt unverändert.
4:2:0 — Horizontale und vertikale Unterabtastung
Jedes Pixel behält seinen eigenen Leuchtdichtewert, aber die Farbauflösung wird sowohl horizontal als auch vertikal halbiert. Ein 2×2-Block aus vier Pixeln teilt einen einzelnen Farbwert. Dies ist das aggressivste häufig verwendete Unterabtastungsschema — und das am weitesten verbreitete, da es dramatische Dateispeicherungen mit vernachlässigbaren visuellen Auswirkungen auf Fotografien bietet.
| Unterabtastung | Farbauflösung | Datensenkung | Dateigröße vs 4:4:4 | Am besten geeignet für |
|---|---|---|---|---|
| 4:4:4 | Vollständig (1:1) | Keine | Basis (größt) | Text, Grafiken, Screenshots |
| 4:2:2 | Horizontal halbiert | 33% weniger Chroma-Daten | ~10–15% kleiner | Professionelle Videos, Rundfunk |
| 4:2:0 | In beide Richtungen halbiert (2×2-Block) | 75% weniger Chroma-Daten | ~25–33% kleiner | Fotos, Web-Bilder, Consumer-Videos |
Die Spalte „Datensenkung" bezieht sich nur auf die Chrominanzkanäle. Da der Leuchtdichtekanal (der die meisten visuellen Informationen trägt) niemals unterabgetastet wird, ist die Gesamtdateispeicherung geringer als die rohe Chroma-Reduktion vermuten lässt. In der Praxis sparen Sie beim Wechsel von 4:4:4 zu 4:2:0 etwa 25–33% der Gesamtdateigröße bei der gleichen Qualitätseinstellung.
Visuelle Auswirkung: Wenn es zählt und wenn nicht
Die visuelle Auswirkung der Chroma-Unterabtastung hängt vollständig vom Inhalt des Bildes ab. Bei manchen Bildern ist 4:2:0 nicht vom 4:4:4 zu unterscheiden. Bei anderen ist der Unterschied deutlich sichtbar.
Fotografien: 4:2:0 ist praktisch unsichtbar
Natürliche Fotografien enthalten sanfte Farbverläufe — Himmel, Haut, Laub, Wasser, Stoff. Diese Verläufe haben keine scharfen Farbkanten für das Auge zu erkennen. Wenn Sie die Farbauflösung in beide Richtungen halbieren, bleiben die Farbübergänge sanft, da die ursprünglichen Verläufe sanft waren. In direkten Vergleichen haben selbst ausgebildete Fotografen Schwierigkeiten, 4:2:0 von 4:4:4 bei typischen Fotos zu unterscheiden.
Deshalb verwendet jede Verbraucherkamera, jede Social-Media-Plattform und jeder Webbrowser standardmäßig 4:2:0 für JPEG-Fotos. Der Qualitätskompromiss ist überwiegend günstig: 25–33% kleinere Dateien ohne sichtliche Qualitätsunterschiede.
Text und Grafiken: 4:2:0 erzeugt sichtbare Artefakte
Screenshots, UI-Modelle, Logos, Diagramme und textlastige Bilder sind eine andere Geschichte. Diese enthalten scharfe Farbübergänge — ein rotes Zeichen auf weißem Hintergrund, ein grüner Knopf mit weißem Text, eine blaue Linie auf grauem Raster. Wenn die 4:2:0-Unterabtastung die Farbe über einen 2×2-Pixelblock mittelt, werden diese scharfen Kanten unscharf.
Das Ergebnis ist ein Farbfringing — ein sichtbares Verschmieren von Farbe, das über die Kanten scharfer Elemente hinaus blutet. Schwarzer Text auf weißem Hintergrund ist normalerweise in Ordnung, da der Kontrast rein im Leuchtdichtekanal liegt (Schwarz und Weiß unterscheiden sich nur in der Helligkeit). Aber farbiger Text auf kontrastreichem Hintergrund ist, wo 4:2:0-Artefakte offensichtlich werden.
| Inhaltstyp | 4:4:4 | 4:2:2 | 4:2:0 |
|---|---|---|---|
| Landschaftsfotos | Perfekt | Perfekt | Perfekt |
| Porträts / Hauttöne | Perfekt | Perfekt | Perfekt |
| Produktfotos | Perfekt | Perfekt | Perfekt |
| Schwarzer Text auf Weiß | Perfekt | Perfekt | Gut |
| Farbiger Text / UI-Elemente | Perfekt | Leichtes Fringing | Sichtbares Fringing |
| Code-Screenshots | Perfekt | Leichtes Fringing | Auffällig |
| Logos mit dünnen farbigen Linien | Perfekt | Kleinere Artefakte | Farbblutung |
Auswirkung auf die Dateigröße
Die Dateispeicherungen durch Chroma-Unterabtastung sind beträchtlich und konsistent. Bei einem unkomprimierten Bild hat jedes Pixel drei Komponenten: Y, Cb und Cr. Bei 4:4:4 werden alle drei in voller Auflösung gespeichert. Bei 4:2:0 enthalten die Cb- und Cr-Kanäle nur noch 25% der Proben — eine 75%ige Reduktion der Chrominanzendaten.
Da die Chrominanzkanäle etwa ein Drittel bis die Hälfte der Gesamtdaten darstellen (abhängig vom Bildinhalt und der Kompression), ist die praktische Auswirkung auf die Dateigröße:
| Unterabtastung | Typische Dateigröße | Beispiel (10 MP Foto bei Q85) |
|---|---|---|
| 4:4:4 | Basis (100%) | ~3,2 MB |
| 4:2:2 | ~85–90% | ~2,8 MB |
| 4:2:0 | ~67–75% | ~2,3 MB |
Für eine Website mit Tausenden von Bildern summieren sich die Unterschiede zwischen 4:4:4 und 4:2:0 dramatisch auf. Eine Fotogalerie mit 100 Bildern spart ungefähr 90 MB Bandbreite durch die Verwendung von 4:2:0 anstelle von 4:4:4, ohne Qualitätsunterschiede bei fotografischem Inhalt.
Kombiniert mit Qualität: Die Einsparungen durch Chroma-Unterabtastung ergänzen sich mit der Reduzierung der JPEG-Qualität. Bei Q85 mit 4:2:0 ist ein Foto etwa 5–8x kleiner als das original PNG — die Qualitätseinstellung und die Unterabtastung wirken zusammen, um die Dateigröße weit über das hinaus zu reduzieren, was jede allein erreicht.
ImageMagick-Verhalten und Standardvorgaben
ImageMagick's JPEG-Encoder wählt automatisch die Chroma-Unterabtastung basierend auf der -quality-Einstellung. Dies ist einer der am häufigsten übersehenen Aspekte der JPEG-Kompression mit ImageMagick:
| Qualitätseinstellung | Standardmäßige Unterabtastung | Begründung |
|---|---|---|
| Q90–Q100 | 4:4:4 | Hohe Qualität angefordert → vollständige Farbe beibehalten |
| Q1–Q89 | 4:2:0 | Niedrigere Qualität → aggressive Kompression |
Dieser automatische Wechsel bedeutet, dass die Einstellung der Qualität auf 90 vs 89 einen unverhältnismäßig großen Sprung der Dateigröße erzeugt. Es ist nicht nur ein Qualitätsschritt — es ist der Qualitätsschritt plus der Wechsel von 4:2:0 zu 4:4:4 Unterabtastung. Viele Benutzer bemerken, dass Q90-Dateien überraschend größer sind als Q89-Dateien und gehen davon aus, dass ImageMagick fehlerhaft ist. Das ist nicht der Fall — der Unterabtastungswechsel ist der Schuldige.
Überschreibung der Standardvorgabe
Sie können die Chroma-Unterabtastung explizit mit dem Flag -sampling-factor steuern:
# 4:4:4 (no subsampling — best for text/graphics)
convert input.png -quality 85 -sampling-factor 1x1 output.jpg
# 4:2:2 (balanced — used in professional video)
convert input.png -quality 85 -sampling-factor 2x1 output.jpg
# 4:2:0 (smallest — best for photos)
convert input.png -quality 85 -sampling-factor 2x2 output.jpg
Der Sampling-Faktor verwendet das Format HxV, wobei H die horizontale Abtastung und V die vertikale Abtastung ist. 1x1 bedeutet keine Unterabtastung (4:4:4), 2x1 bedeutet horizontal halbiert (4:2:2) und 2x2 bedeutet in beide Richtungen halbiert (4:2:0).
Q85 + 4:4:4: Eine häufig verwendete Technik für Screenshots und textlastige Bilder ist -quality 85 -sampling-factor 1x1. Dies gibt Ihnen Dateispeicherungen aus der Qualitätseinstellung, während die volle Farbauflösung für scharfen Text erhalten bleibt. Ohne -sampling-factor 1x1 verwendet Q85 standardmäßig 4:2:0 und farbiger Text hat sichtbares Fringing.
Empfehlungen nach Inhaltstyp
Hier ist ein praktischer Entscheidungsleitfaden zur Wahl der richtigen Chroma-Unterabtastung:
Verwenden Sie 4:2:0 wenn:
- Fotografien jeglicher Art — Landschaften, Porträts, Produktfotografie, Lebensmittel, Architektur
- Web-Bilder — Hero-Bilder, Blog-Illustrationen, Social-Media-Beiträge
- E-Mail-Anhänge — Dateispeicherung hilft mit Anhangsgrenzen
- Miniaturansichten und Vorschau — kleine Anzeigegröße maskiert alle möglichen Artefakte
- Jedes Bild, bei dem die Dateigröße wichtiger ist als pixelgenaue Farbkanten
Verwenden Sie 4:4:4 wenn:
- Screenshots mit farbigem Text — syntax-hervorgehobener Code, farbige UI-Elemente
- Logos und Markensicherung — genaue Farbgrenzen sind wichtig für die Markenintegrität
- Technische Diagramme — farbige Linien und Beschriftungen brauchen scharfe Kanten
- UI-Modelle und Designdateien — pixelgenaue Farbwiedergabe erforderlich
- Medizinische oder wissenschaftliche Bildgebung — Farbgenauigkeit ist kritisch
Verwenden Sie 4:2:2 wenn:
- Professionelle Videoproduktion — Rundfunkstandard für Studioinhalte
- Bilder mit gemischtem Inhalt — Fotos mit Textübergängen, wo 4:4:4 übertrieben ist, aber 4:2:0 sichtbares Fringing erzeugt
- High-End-Fotografie, bei der absolute maximale Qualität erforderlich ist, aber 4:4:4-Dateispeicherungen unpraktisch sind
Im Zweifelsfall: Verwenden Sie für Fotografien 4:2:0 ohne Zögern. Für alles mit Text oder scharfen Farbkanten verwenden Sie 4:4:4. Der 4:2:2 Mittelweg ist selten für Standbilder erforderlich — es ist in erster Linie ein Videoproduktionsformat.
Chroma-Unterabtastung jenseits von JPEG
Die Chroma-Unterabtastung ist nicht nur auf JPEG beschränkt. Praktisch alle verlustbehafteten visuellen Medien verwenden sie:
| Format / Codec | Häufige Unterabtastung | Anmerkungen |
|---|---|---|
| JPEG | 4:2:0 (Standard), 4:4:4 | Encoder-abhängige Standardvorgabe |
| WebP | 4:2:0 (verlustfreier Modus) | Keine Option für 4:4:4 in verlustfreiem WebP |
| AVIF | 4:2:0, 4:4:4 | 4:4:4 verfügbar, aber erhöht Dateigröße |
| H.264 / H.265 Video | 4:2:0 (Consumer), 4:2:2 (Pro) | 4:4:4 nur in spezialisierten Profilen |
| Blu-ray / Streaming | 4:2:0 | Standard für alle Consumer-Videos |
| PNG | Keine (verlustfrei) | Vollständiges RGB erhalten, keine Unterabtastung |
WebP ist bemerkenswert für die Nicht-Angebot von 4:4:4 in seinem verlustfreien Modus. Wenn Sie einen Screenshot mit farbigem Text haben und die kleinste Datei mit scharfen Farben benötigen, ist verlustfreies WebP möglicherweise nicht ideal — verwenden Sie stattdessen JPEG bei 4:4:4, PNG (verlustfrei) oder verlustfreies WebP.
AVIF, der neueste Konkurrent, unterstützt 4:4:4 und kombiniert ihn mit einer effizienteren Kompression als JPEG. Für textlastige Bilder, die verlustfrei komprimiert werden müssen, kann AVIF mit 4:4:4 kleinere Dateien als JPEG 4:4:4 bei gleicher visueller Qualität erzeugen.