Wie die Vorbis-Qualität funktioniert
Die meisten Audio-Codecs (MP3, AAC) erlauben es Ihnen, eine Zielbitrate zu wählen — 128 kbps, 256 kbps, 320 kbps. Der Encoder entscheidet dann, was beibehalten und was verworfen wird, um diese Zahl zu erreichen. Vorbis verfolgt einen anderen Ansatz: Sie legen eine Qualitätsstufe fest, und der Encoder ermittelt, wie viele Bits jeder Audio-Frame basierend auf seiner Komplexität benötigt.
In FFmpeg und den meisten Encoding-Tools reicht der Vorbis-Qualitätsparameter von 0 bis 10 (einige Tools erlauben Dezimalwerte und sogar negative Werte bis zu -1). Eine höhere Qualität bedeutet:
- Mehr spektrales Detail wird bewahrt
- Mehr Bits werden pro Frame zugeteilt
- Größere Ausgabedateien
- Näher am ursprünglichen verlustfreien Quellmaterial
Da Vorbis von Natur aus VBR ist, schwankt die Bitrate ständig. Eine Q5-Datei kann eine stille Passage mit 60 kbps und einen komplexen orchestralen Höhepunkt mit 250 kbps kodieren. Die unten aufgeführten Zahlen sind Durchschnittswerte für typische Stereomusik.
FFmpeg-Syntax: ffmpeg -i input.wav -c:a libvorbis -q:a 5 output.ogg — der Parameter -q:a legt die Qualitätsstufe fest (0–10).
Qualitäts-zu-Bitrate-Zuordnung
Die folgende Tabelle zeigt durchschnittliche Bitraten für Stereo-Audio mit 44,1 kHz. Die tatsächlichen Bitraten variieren je nach Inhalt — komplexe Musik liegt im Durchschnitt höher, Sprache und einfaches Audio liegen im Durchschnitt niedriger.
| Qualitätsstufe | Ø Bitrate (Stereo) | Wahrnehmungsqualität | MP3-Äquivalent |
|---|---|---|---|
| Q-1 | ~45 kbps | Sehr niedrig — starke Artefakte | ~64 kbps CBR |
| Q0 | ~64 kbps | Niedrig — merkliche Artefakte | ~80–96 kbps CBR |
| Q1 | ~80 kbps | Akzeptabel für Sprache | ~96–112 kbps CBR |
| Q2 | ~96 kbps | Gut für Sprache, ausreichend für Musik | ~112–128 kbps CBR |
| Q3 | ~112 kbps | Gut — geringe Artefakte bei komplexem Audio | ~128–160 kbps CBR |
| Q4 | ~128 kbps | Gut — entspricht Spotify Free Tier | ~160 kbps CBR |
| Q5 | ~160 kbps | Sehr gut — transparent für die meisten Hörer | ~192 kbps CBR / VBR V2 |
| Q6 | ~192 kbps | Ausgezeichnet — nahezu transparent | ~224 kbps CBR / VBR V1 |
| Q7 | ~224 kbps | Transparent — nicht vom Original zu unterscheiden | ~256 kbps CBR / VBR V0 |
| Q8 | ~256 kbps | Transparent | ~280–320 kbps CBR |
| Q9 | ~320 kbps | Transparent — Spotify Premium Tier | ~320 kbps CBR |
| Q10 | ~500 kbps | Maximum — übertrieben für das Hören | Kein MP3-Äquivalent |
Empfohlene Einstellungen nach Anwendungsfall
Die „richtige" Qualitätsstufe hängt vollständig davon ab, was Sie kodieren und wo es verwendet wird:
| Anwendungsfall | Empfohlene Qualität | Kanäle | Begründung |
|---|---|---|---|
| Sprache / Podcasts | Q2–Q3 | Mono | Sprache hat einfachen spektralen Inhalt; Q2 Mono (~48 kbps) ist transparent |
| Allgemeine Musik | Q5 | Stereo | ~160 kbps — transparent für die meisten Hörer, gutes Größe/Qualität-Verhältnis |
| Hochqualitätsarchivierung | Q7 | Stereo | ~224 kbps — nicht vom Original zu unterscheiden, vernünftige Dateigröße |
| Spiele-SFX | Q1–Q3 | Mono | Kurze Effekte vertragen mehr Komprimierung; Mono spart 50% gegenüber Stereo |
| Spiele-Hintergrundmusik | Q4–Q5 | Stereo | Ausgewogenes Verhältnis zwischen Download-Größe und Musikqualität im Gameplay |
| Web-Audio-Streaming | Q4 | Stereo | ~128 kbps — schnelles Laden, gute Qualität für Hintergrundaudio |
| Maximale Qualität | Q8–Q10 | Stereo | Abnehmender Nutzen über Q7 — verwenden Sie FLAC, wenn Sie echtes Lossless benötigen |
Wie Spotify der Qualitätsskala entspricht
Spotify ist der weltgrößte Nutzer von OGG Vorbis. Das Verständnis ihrer Qualitätsstufen hilft dabei, die Skala einzuordnen:
- Niedrig (Free mobil): ~96 kbps — ungefähr Q2. Hörbarer Komprimierungsaufwand bei komplexer Musik, aber klar für Sprache und einfache Titel.
- Normal (Free Desktop): ~160 kbps — ungefähr Q5. Der Sweet Spot, der für die meisten Hörer auf den meisten Geräten gut klingt.
- Hohe Qualität: ~160 kbps — wie Normal, für alle Nutzer verfügbar.
- Sehr hohe Qualität (Premium): ~320 kbps — ungefähr Q9. Transparente Qualität auf jedem Gerät.
Wenn Q5 für 600+ Millionen Spotify-Hörer gut genug ist, ist es ein solider Standard für die meisten Anwendungen. Premiums Q9 ist im Wesentlichen eine „keine Kompromisse"-Einstellung, bei der die Dateigröße irrelevant ist, da Spotify die Bandbreite übernimmt.
Tipp: Beim Konvertieren von OGG zu MP3 sollten Sie die OGG-Qualitätsstufe erreichen oder leicht übertreffen. Eine Q5-OGG-Datei (~160 kbps) lässt sich gut zu MP3 VBR V2 (~190 kbps) konvertieren. Weitere Details finden Sie in unserem OGG zu MP3 Bitrate-Leitfaden.
Die Transparenzschwelle
Transparenz bei der Audiokomprimierung bedeutet, dass die komprimierte Datei in verblindeten Hörtests nicht vom verlustfreien Original zu unterscheiden ist. Für OGG Vorbis hat die Hydrogenaudio-Community — die strengste Audio-Test-Community online — klare Benchmarks etabliert:
- Q5 (~160 kbps): transparent für die Mehrheit der Hörer auf typischen Geräten. Artefakte sind nur bei sehr spezifischen „Killer-Samples" erkennbar, die gezielt ausgewählt wurden, um Codec-Schwächen aufzudecken.
- Q7 (~224 kbps): transparent für praktisch alle Hörer, einschließlich geschulter Tontechniker auf Referenz-Geräten. Hydrogenaudio-Konsens: „Fast niemand hört über Q7 hinaus."
- Q8–Q10: jenseits der menschlichen Wahrnehmung. Diese Einstellungen existieren für Nutzer, die mathematische Gewissheit wünschen, bieten aber keinen hörbaren Vorteil gegenüber Q7.
Die praktische Schlussfolgerung: Q5 ist die Untergrenze für qualitätsbewusstes Hören, Q7 ist die Obergrenze des hörbaren Verbesserungspotenzials. Alles über Q7 verschwendet Speicherplatz ohne wahrnehmbaren Gewinn.
Dateigröße pro Minute bei jeder Qualitätsstufe
Die folgende Tabelle zeigt ungefähre Dateigrößen für eine Minute Stereo-Audio mit 44,1 kHz bei jeder Vorbis-Qualitätsstufe:
| Qualität | Ø Bitrate | Größe / Minute | Größe / 4-min-Song | Größe / 60-min-Album |
|---|---|---|---|---|
| Q0 | ~64 kbps | 0,48 MB | 1,9 MB | 28,8 MB |
| Q1 | ~80 kbps | 0,60 MB | 2,4 MB | 36,0 MB |
| Q2 | ~96 kbps | 0,72 MB | 2,9 MB | 43,2 MB |
| Q3 | ~112 kbps | 0,84 MB | 3,4 MB | 50,4 MB |
| Q4 | ~128 kbps | 0,96 MB | 3,8 MB | 57,6 MB |
| Q5 | ~160 kbps | 1,20 MB | 4,8 MB | 72,0 MB |
| Q6 | ~192 kbps | 1,44 MB | 5,8 MB | 86,4 MB |
| Q7 | ~224 kbps | 1,68 MB | 6,7 MB | 100,8 MB |
| Q8 | ~256 kbps | 1,92 MB | 7,7 MB | 115,2 MB |
| Q9 | ~320 kbps | 2,40 MB | 9,6 MB | 144,0 MB |
| Q10 | ~500 kbps | 3,75 MB | 15,0 MB | 225,0 MB |
| WAV (Ref) | 1.411 kbps | 10,1 MB | 40,3 MB | 605 MB |
Bei Q5 benötigt ein vollständiges 60-minütiges Album nur 72 MB — etwa 12% der unkomprimierten WAV-Größe. Der Wechsel zu Q7 erhöht dies auf ~101 MB (17% von WAV). Der Sprung von Q7 zu Q10 verdoppelt die Dateigröße mehr als (101 MB auf 225 MB) ohne hörbaren Vorteil für die meisten Hörer.
Für Spieleentwickler: Die Verwendung von Q2 Mono für Soundeffekte statt Q5 Stereo reduziert die Dateigröße um etwa 75% (0,36 MB/min vs. 1,20 MB/min). Bei einem Spiel mit 30 Minuten SFX spart das über 25 MB beim Download.