Come Funziona la Qualità Vorbis
La maggior parte dei codec audio (MP3, AAC) ti permette di scegliere un bitrate target — 128 kbps, 256 kbps, 320 kbps. L’encoder decide poi cosa mantenere e cosa scartare per raggiungere quel numero. Vorbis adotta un approccio diverso: imposti un livello di qualità e l’encoder determina quanti bit servono per ogni frame audio in base alla sua complessità.
In FFmpeg e nella maggior parte degli strumenti di codifica, il parametro di qualità Vorbis va da 0 a 10 (alcuni strumenti consentono valori frazionari e persino negativi fino a -1). Una qualità più alta significa:
- Maggiori dettagli spettrali preservati
- Più bit allocati per frame
- File di output più grandi
- Più vicino alla sorgente lossless originale
Poiché Vorbis è intrinsecamente VBR, il bitrate varia costantemente. Un file Q5 potrebbe codificare un passaggio silenzioso a 60 kbps e un climax orchestrale complesso a 250 kbps. I valori seguenti sono medie per musica stereo tipica.
Sintassi FFmpeg: ffmpeg -i input.wav -c:a libvorbis -q:a 5 output.ogg — il parametro -q:a imposta il livello di qualità (0–10).
Corrispondenza Qualità-Bitrate
La tabella seguente mostra i bitrate medi per audio stereo a 44,1 kHz. I bitrate effettivi variano in base al contenuto — la musica complessa ha medie più alte, voce e audio semplici hanno medie più basse.
| Livello di Qualità | Bitrate Medio (stereo) | Qualità Percepita | Equivalente MP3 |
|---|---|---|---|
| Q-1 | ~45 kbps | Molto bassa — artefatti pesanti | ~64 kbps CBR |
| Q0 | ~64 kbps | Bassa — artefatti percepibili | ~80–96 kbps CBR |
| Q1 | ~80 kbps | Accettabile per la voce | ~96–112 kbps CBR |
| Q2 | ~96 kbps | Buona per la voce, discreta per la musica | ~112–128 kbps CBR |
| Q3 | ~112 kbps | Buona — artefatti minori su audio complesso | ~128–160 kbps CBR |
| Q4 | ~128 kbps | Buona — equivalente al tier gratuito di Spotify | ~160 kbps CBR |
| Q5 | ~160 kbps | Molto buona — trasparente per la maggior parte degli ascoltatori | ~192 kbps CBR / VBR V2 |
| Q6 | ~192 kbps | Eccellente — quasi trasparente | ~224 kbps CBR / VBR V1 |
| Q7 | ~224 kbps | Trasparente — indistinguibile dalla sorgente | ~256 kbps CBR / VBR V0 |
| Q8 | ~256 kbps | Trasparente | ~280–320 kbps CBR |
| Q9 | ~320 kbps | Trasparente — tier Premium di Spotify | ~320 kbps CBR |
| Q10 | ~500 kbps | Massima — eccessiva per l’ascolto | Nessun equivalente MP3 |
Impostazioni Consigliate per Caso d'Uso
Il livello di qualità "giusto" dipende interamente da cosa stai codificando e dove verrà utilizzato:
| Caso d'Uso | Qualità Consigliata | Canali | Perché |
|---|---|---|---|
| Voce / podcast | Q2–Q3 | Mono | La voce ha contenuto spettrale semplice; Q2 mono (~48 kbps) è trasparente |
| Musica generica | Q5 | Stereo | ~160 kbps — trasparente per la maggior parte degli ascoltatori, buon equilibrio dimensioni/qualità |
| Archiviazione alta qualità | Q7 | Stereo | ~224 kbps — indistinguibile dalla sorgente, dimensione file ragionevole |
| SFX per videogiochi | Q1–Q3 | Mono | Gli effetti brevi tollerano maggiore compressione; il mono risparmia il 50% rispetto allo stereo |
| Musica di sottofondo per giochi | Q4–Q5 | Stereo | Bilancia le dimensioni del download con la qualità musicale durante il gameplay |
| Streaming audio web | Q4 | Stereo | ~128 kbps — caricamento rapido, buona qualità per audio di sottofondo |
| Qualità massima | Q8–Q10 | Stereo | Rendimenti decrescenti sopra Q7 — usa FLAC se hai bisogno di vero lossless |
Come Spotify Si Mappa sulla Scala di Qualità
Spotify è il maggiore utente al mondo di OGG Vorbis. Capire i loro tier di qualità aiuta a contestualizzare la scala:
- Bassa (mobile gratuito): ~96 kbps — circa Q2. Compressione udibile su musica complessa, ma chiara per la voce e tracce semplici.
- Normale (desktop gratuito): ~160 kbps — circa Q5. Il punto di equilibrio che suona bene alla maggior parte degli ascoltatori con la maggior parte delle apparecchiature.
- Alta qualità: ~160 kbps — uguale a Normale, disponibile per tutti gli utenti.
- Altissima (Premium): ~320 kbps — circa Q9. Qualità trasparente su qualsiasi apparecchiatura.
Se Q5 è sufficiente per oltre 600 milioni di ascoltatori Spotify, è un ottimo valore predefinito per la maggior parte delle applicazioni. Il Q9 Premium è essenzialmente un'impostazione "senza compromessi" dove le dimensioni del file sono irrilevanti perché Spotify gestisce la banda.
Consiglio: quando converti OGG in MP3, abbina o supera leggermente il livello di qualità OGG. Un file OGG Q5 (~160 kbps) si converte bene in MP3 VBR V2 (~190 kbps). Consulta la nostra guida ai bitrate OGG in MP3 per una mappatura dettagliata.
La Soglia di Trasparenza
Trasparenza nella compressione audio significa che il file compresso è percettivamente indistinguibile dall’originale lossless in test di ascolto in cieco. Per OGG Vorbis, la comunità Hydrogenaudio — la più rigorosa comunità di test audio online — ha stabilito benchmark chiari:
- Q5 (~160 kbps): trasparente per la maggior parte degli ascoltatori su apparecchiature tipiche. Gli artefatti sono rilevabili solo su specifici "killer sample" scelti appositamente per esporre le debolezze del codec.
- Q7 (~224 kbps): trasparente per praticamente tutti gli ascoltatori, inclusi ingegneri audio esperti con apparecchiature di riferimento. Consenso Hydrogenaudio: "quasi nessuno sente differenze sopra Q7."
- Q8–Q10: oltre la percezione umana. Queste impostazioni esistono per gli utenti che vogliono certezza matematica, ma non offrono alcun beneficio udibile rispetto a Q7.
La conclusione pratica: Q5 è il minimo per un ascolto attento alla qualità, Q7 è il massimo del miglioramento udibile. Qualsiasi valore sopra Q7 spreca spazio di archiviazione senza alcun guadagno percettivo.
Dimensione del File per Minuto a Ogni Livello di Qualità
La tabella seguente mostra le dimensioni approssimative per un minuto di audio stereo a 44,1 kHz a ogni livello di qualità Vorbis:
| Qualità | Bitrate Medio | Dimensione / Minuto | Dimensione / Canzone 4 min | Dimensione / Album 60 min |
|---|---|---|---|---|
| Q0 | ~64 kbps | 0,48 MB | 1,9 MB | 28,8 MB |
| Q1 | ~80 kbps | 0,60 MB | 2,4 MB | 36,0 MB |
| Q2 | ~96 kbps | 0,72 MB | 2,9 MB | 43,2 MB |
| Q3 | ~112 kbps | 0,84 MB | 3,4 MB | 50,4 MB |
| Q4 | ~128 kbps | 0,96 MB | 3,8 MB | 57,6 MB |
| Q5 | ~160 kbps | 1,20 MB | 4,8 MB | 72,0 MB |
| Q6 | ~192 kbps | 1,44 MB | 5,8 MB | 86,4 MB |
| Q7 | ~224 kbps | 1,68 MB | 6,7 MB | 100,8 MB |
| Q8 | ~256 kbps | 1,92 MB | 7,7 MB | 115,2 MB |
| Q9 | ~320 kbps | 2,40 MB | 9,6 MB | 144,0 MB |
| Q10 | ~500 kbps | 3,75 MB | 15,0 MB | 225,0 MB |
| WAV (rif) | 1.411 kbps | 10,1 MB | 40,3 MB | 605 MB |
A Q5, un album completo di 60 minuti occupa solo 72 MB — circa il 12% della dimensione WAV non compressa. Passando a Q7 si arriva a ~101 MB (17% del WAV). Il salto da Q7 a Q10 più che raddoppia la dimensione del file (da 101 MB a 225 MB) senza alcun beneficio udibile per la maggior parte degli ascoltatori.
Per gli sviluppatori di videogiochi: usare Q2 mono per gli effetti sonori invece di Q5 stereo riduce la dimensione del file di circa il 75% (0,36 MB/min vs 1,20 MB/min). Per un gioco con 30 minuti di SFX, questo significa oltre 25 MB risparmiati dal download.