Comment fonctionne la qualité Vorbis
La plupart des codecs audio (MP3, AAC) vous permettent de choisir un débit cible — 128 kbps, 256 kbps, 320 kbps. L’encodeur décide ensuite de ce qu’il conserve ou supprime pour atteindre ce chiffre. Vorbis adopte une approche différente : vous définissez un niveau de qualité, et l’encodeur détermine le nombre de bits nécessaires pour chaque trame audio en fonction de sa complexité.
Dans FFmpeg et la plupart des outils d’encodage, le paramètre de qualité Vorbis varie de 0 à 10 (certains outils acceptent des valeurs décimales et même des valeurs négatives jusqu’à -1). Un niveau de qualité élevé implique :
- Plus de détails spectraux préservés
- Plus de bits alloués par trame
- Des fichiers de sortie plus volumineux
- Un résultat plus proche de la source lossless originale
Vorbis étant intrinsèquement en VBR, le débit fluctue en permanence. Un fichier Q5 peut encoder un passage silencieux à 60 kbps et un climax orchestral complexe à 250 kbps. Les chiffres ci-dessous sont des moyennes pour de la musique stéréo typique.
Syntaxe FFmpeg : ffmpeg -i input.wav -c:a libvorbis -q:a 5 output.ogg — le paramètre -q:a définit le niveau de qualité (0–10).
Correspondance qualité / débit
Le tableau suivant indique les débits moyens pour un audio stéréo 44,1 kHz. Les débits réels varient selon le contenu — la musique complexe donne des moyennes plus élevées, la voix et les sons simples des moyennes plus faibles.
| Niveau de qualité | Débit moy. (stéréo) | Qualité perceptuelle | Équivalent MP3 |
|---|---|---|---|
| Q-1 | ~45 kbps | Très faible — artefacts importants | ~64 kbps CBR |
| Q0 | ~64 kbps | Faible — artefacts perceptibles | ~80–96 kbps CBR |
| Q1 | ~80 kbps | Acceptable pour la voix | ~96–112 kbps CBR |
| Q2 | ~96 kbps | Bon pour la voix, correct pour la musique | ~112–128 kbps CBR |
| Q3 | ~112 kbps | Bon — artefacts mineurs sur les sons complexes | ~128–160 kbps CBR |
| Q4 | ~128 kbps | Bon — équivalent Spotify Free | ~160 kbps CBR |
| Q5 | ~160 kbps | Très bon — transparent pour la plupart des auditeurs | ~192 kbps CBR / VBR V2 |
| Q6 | ~192 kbps | Excellent — quasi transparent | ~224 kbps CBR / VBR V1 |
| Q7 | ~224 kbps | Transparent — indiscernable de la source | ~256 kbps CBR / VBR V0 |
| Q8 | ~256 kbps | Transparent | ~280–320 kbps CBR |
| Q9 | ~320 kbps | Transparent — niveau Spotify Premium | ~320 kbps CBR |
| Q10 | ~500 kbps | Maximum — superflu pour l’écoute | Pas d’équivalent MP3 |
Paramètres recommandés par cas d’usage
Le niveau de qualité « idéal » dépend entièrement de ce que vous encodez et de l’usage prévu :
| Cas d’usage | Qualité recommandée | Canaux | Pourquoi |
|---|---|---|---|
| Voix / podcasts | Q2–Q3 | Mono | La voix a un contenu spectral simple ; Q2 mono (~48 kbps) est transparent |
| Musique générale | Q5 | Stéréo | ~160 kbps — transparent pour la plupart, bon équilibre taille/qualité |
| Archivage haute qualité | Q7 | Stéréo | ~224 kbps — indiscernable de la source, taille de fichier raisonnable |
| SFX de jeux vidéo | Q1–Q3 | Mono | Les effets courts tolèrent plus de compression ; le mono économise 50 % vs stéréo |
| Musique de fond (jeux vidéo) | Q4–Q5 | Stéréo | Équilibre taille de téléchargement et qualité musicale en cours de jeu |
| Streaming audio web | Q4 | Stéréo | ~128 kbps — chargement rapide, bonne qualité pour l’audio d’ambiance |
| Qualité maximale | Q8–Q10 | Stéréo | Rendements décroissants au-delà de Q7 — utilisez FLAC si vous avez besoin du vrai lossless |
Correspondance entre Spotify et l’échelle de qualité
Spotify est le plus grand utilisateur mondial d’OGG Vorbis. Comprendre leurs niveaux de qualité aide à contextualiser l’échelle :
- Faible (Free mobile) : ~96 kbps — environ Q2. Compression audible sur les musiques complexes, mais clair pour la voix et les pistes simples.
- Normal (Free bureau) : ~160 kbps — environ Q5. Le compromis idéal qui sonne bien pour la plupart des auditeurs sur la plupart des équipements.
- Haute qualité : ~160 kbps — identique à Normal, disponible pour tous les utilisateurs.
- Très haute qualité (Premium) : ~320 kbps — environ Q9. Qualité transparente sur n’importe quel équipement.
Si Q5 convient à plus de 600 millions d’abonnés Spotify, c’est un excellent choix par défaut pour la plupart des applications. Le Q9 Premium est essentiellement un réglage « sans compromis » où la taille du fichier n’a pas d’importance car Spotify gère la bande passante.
Conseil : lorsque vous convertissez OGG en MP3, égalez ou dépassez légèrement le niveau de qualité OGG. Un fichier OGG Q5 (~160 kbps) se convertit bien en MP3 VBR V2 (~190 kbps). Consultez notre guide des débits OGG vers MP3 pour une correspondance détaillée.
Le seuil de transparence
La transparence en compression audio signifie que le fichier compressé est perceptuellement indiscernable de l’original lossless lors de tests d’écoute à l’aveugle. Pour OGG Vorbis, la communauté Hydrogenaudio — la communauté de tests audio la plus rigoureuse en ligne — a établi des repères clairs :
- Q5 (~160 kbps) : transparent pour la majorité des auditeurs sur un équipement courant. Les artefacts ne sont détectables que sur des « killer samples » très spécifiques, choisis précisément pour exposer les faiblesses des codecs.
- Q7 (~224 kbps) : transparent pour pratiquement tous les auditeurs, y compris les ingénieurs du son expérimentés sur un équipement de référence. Consensus Hydrogenaudio : « presque personne n’entend au-dessus de Q7 ».
- Q8–Q10 : au-delà de la perception humaine. Ces réglages existent pour les utilisateurs qui veulent une certitude mathématique, mais ils n’offrent aucun bénéfice audible par rapport à Q7.
La conclusion pratique : Q5 est le plancher pour une écoute soucieuse de la qualité, Q7 est le plafond de l’amélioration audible. Tout ce qui dépasse Q7 gaspille de l’espace de stockage sans gain perceptuel.
Taille de fichier par minute à chaque niveau de qualité
Le tableau suivant indique les tailles de fichiers approximatives pour une minute d’audio stéréo 44,1 kHz à chaque niveau de qualité Vorbis :
| Qualité | Débit moy. | Taille / minute | Taille / chanson 4 min | Taille / album 60 min |
|---|---|---|---|---|
| Q0 | ~64 kbps | 0,48 Mo | 1,9 Mo | 28,8 Mo |
| Q1 | ~80 kbps | 0,60 Mo | 2,4 Mo | 36,0 Mo |
| Q2 | ~96 kbps | 0,72 Mo | 2,9 Mo | 43,2 Mo |
| Q3 | ~112 kbps | 0,84 Mo | 3,4 Mo | 50,4 Mo |
| Q4 | ~128 kbps | 0,96 Mo | 3,8 Mo | 57,6 Mo |
| Q5 | ~160 kbps | 1,20 Mo | 4,8 Mo | 72,0 Mo |
| Q6 | ~192 kbps | 1,44 Mo | 5,8 Mo | 86,4 Mo |
| Q7 | ~224 kbps | 1,68 Mo | 6,7 Mo | 100,8 Mo |
| Q8 | ~256 kbps | 1,92 Mo | 7,7 Mo | 115,2 Mo |
| Q9 | ~320 kbps | 2,40 Mo | 9,6 Mo | 144,0 Mo |
| Q10 | ~500 kbps | 3,75 Mo | 15,0 Mo | 225,0 Mo |
| WAV (réf.) | 1 411 kbps | 10,1 Mo | 40,3 Mo | 605 Mo |
En Q5, un album complet de 60 minutes ne représente que 72 Mo — environ 12 % de la taille WAV non compressée. Passer à Q7 augmente ce chiffre à ~101 Mo (17 % du WAV). Le saut de Q7 à Q10 multiplie plus que doubler la taille du fichier (101 Mo à 225 Mo) sans aucun bénéfice audible pour la plupart des auditeurs.
Pour les développeurs de jeux : utiliser Q2 mono pour les effets sonores au lieu de Q5 stéréo réduit la taille des fichiers d’environ 75 % (0,36 Mo/min contre 1,20 Mo/min). Pour un jeu avec 30 minutes de SFX, cela représente plus de 25 Mo économisés au téléchargement.