Qu'est-ce que le stereo et le mono ?
L'audio stereo utilise deux canaux indépendants — gauche et droit. Chaque canal transporte un signal différent, ce qui crée une impression de largeur spatiale : les guitares peuvent se placer à gauche, la voix au centre, les claviers à droite. Cette séparation spatiale imite la manière dont nous entendons le son dans la vie réelle avec nos deux oreilles.
L'audio mono (monaural) utilise un seul canal. Le même signal est diffusé par les deux enceintes ou écouteurs. Il n'y a pas de séparation spatiale — tout se retrouve au centre de la scène sonore.
- Stereo : 2 canaux, image spatiale, scène sonore plus large
- Mono : 1 canal, son centré, identique des deux côtés
La distinction compte plus qu'on ne le pense. Pour les contenus parlés comme les podcasts, le mono est non seulement suffisant — il est souvent préférable. Pour une musique avec un mixage stereo soigné, passer en mono signifie perdre la dimension spatiale voulue par le producteur.
Distinction importante : un fichier « stereo » peut contenir des canaux gauche et droit identiques (dual mono). Ce n'est que de l'audio mono qui gaspille de la place dans un conteneur stereo. Un vrai stereo a un contenu différent dans chaque canal.
Impact sur la taille du fichier
À bitrate égal, les fichiers MP3 mono sont environ 50 % plus petits que les stereo. C'est parce que le mono encode un canal au lieu de deux, réduisant de moitié la quantité de données nécessaire.
| Bitrate | Stereo (1 heure) | Mono (1 heure) | Économie |
|---|---|---|---|
| 320 kbps | 144 Mo | 72 Mo | 72 Mo (50 %) |
| 192 kbps | 86 Mo | 43 Mo | 43 Mo (50 %) |
| 128 kbps | 58 Mo | 29 Mo | 29 Mo (50 %) |
| 96 kbps | 43 Mo | 22 Mo | 21 Mo (~50 %) |
| 64 kbps | 29 Mo | 14,5 Mo | 14,5 Mo (50 %) |
Pour un podcast hebdomadaire publiant 4 épisodes d'une heure par mois, passer de 128 kbps stereo à 96 kbps mono économise ~144 Mo par mois d'hébergement — et les auditeurs téléchargent plus vite sans perte perceptible de qualité pour la parole.
Alternativement : au lieu d'utiliser le mono pour économiser de la place à bitrate constant, vous pouvez utiliser le mono à un bitrate plus élevé pour une meilleure qualité à taille de fichier équivalente au stereo. Par exemple, 128 kbps mono sonne mieux que 128 kbps stereo car tout le budget bitrate est alloué à un seul canal.
Quand utiliser le mono
Le mono est le bon choix quand le contenu audio est par nature mono-source ou quand le champ stereo n'apporte rien :
- Podcasts : Apple Podcasts recommande le mono pour les émissions parlées. La voix d'un narrateur unique est mono par nature — il n'y a aucune information spatiale à préserver.
- Livres audio : comme les podcasts, les livres audio sont une voix unique. Le mono divise la taille par deux sans aucune perte de qualité.
- Mémos vocaux et dictées : enregistrés par le microphone unique d'un téléphone, ce sont des signaux mono stockés dans des conteneurs stereo. Convertir en vrai mono divise la taille par deux.
- Enregistrements téléphoniques et VoIP : l'audio téléphonique est intrinsèquement mono, typiquement à 8–16 kHz.
- Systèmes PA et sonorisation publique : la plupart des installations PA sont mono. Les fichiers stereo sont de toute façon ramenés en mono pour la lecture.
- Musique de fond pour vidéo : quand la musique joue discrètement derrière une narration, la largeur stereo est imperceptible. Le mono économise la bande passante.
Quand utiliser le stereo
Le stereo est essentiel quand la dimension spatiale de l'audio fait partie de l'expérience :
- Musique : les producteurs passent des heures à placer les instruments dans le champ stereo. Convertir en mono anéantit ce travail — guitares, claviers, chœurs s'entassent au centre.
- Sound design et audio de film : sons d'ambiance, atmosphères et effets s'appuient sur un placement stereo (ou surround) pour l'immersion.
- Enregistrements binauraux : captés avec deux microphones placés en positions d'oreilles humaines, l'audio binaural crée une expérience d'écoute 3D totalement détruite par une conversion en mono.
- Enregistrements de concerts live : l'image stereo capture l'ambiance de la salle et la position du public.
- ASMR et audio spatial : tout l'attrait repose sur les sons qui se déplacent entre les canaux gauche et droit.
Joint stereo : le meilleur des deux mondes
Les encodeurs MP3 (y compris LAME, l'encodeur open-source de référence) proposent un mode appelé joint stereo qui combine l'efficacité du mono avec la qualité spatiale du stereo.
Le joint stereo fonctionne en divisant les deux canaux en :
- Mid (M) : la somme de gauche + droit — le signal central compatible mono
- Side (S) : la différence entre gauche et droit — l'information de largeur stereo
Comme le signal mid porte la majeure partie de l'énergie audio, et que le signal side est souvent plus calme et plus simple, l'encodeur peut allouer plus de bits au mid et moins au side. Résultat : meilleure qualité globale qu'un encodage indépendant des canaux gauche et droit au même bitrate.
| Mode stereo | Fonctionnement | Idéal pour |
|---|---|---|
| Stereo simple | L et R encodés indépendamment | Bitrates élevés (256+ kbps) |
| Joint stereo (M/S) | Encodage Mid/Side, adaptatif par frame | La plupart des contenus (défaut LAME) |
| Mono forcé | L+R mixés en un seul canal | Parole, podcasts, mémos vocaux |
Le mode auto joint stereo par défaut de LAME bascule dynamiquement entre M/S et stereo simple image par image, choisissant à chaque frame de 26 millisecondes celui qui produit la meilleure qualité. C'est pourquoi le réglage par défaut est presque toujours le meilleur choix pour de la musique stereo.
Conseil pratique : pour la musique, laissez activé le mode joint stereo par défaut de l'encodeur. Pour la parole et les podcasts, sélectionnez explicitement le mono pour obtenir l'économie de taille. Le joint stereo n'aide que s'il y a du vrai contenu stereo à préserver.
Standards de l'industrie du podcast
L'industrie du podcast s'est largement standardisée sur le MP3 mono pour la distribution. Voici ce que recommandent les principales plateformes :
| Plateforme | Format recommandé | Notes |
|---|---|---|
| Apple Podcasts | MP3, 96 kbps mono | Mono recommandé pour la parole |
| Spotify | MP3, 96–128 kbps | Accepte mono et stereo |
| Google Podcasts | MP3, jusqu'à 320 kbps | Pas de recommandation mono/stereo spécifique |
| Libsyn | MP3, 128 kbps mono | Économise le stockage du forfait d'hébergement |
| Buzzsprout | MP3, 96 kbps mono | Optimise automatiquement les uploads en mono |
Le raisonnement est simple : la voix d'un narrateur unique ne porte aucune information stereo. L'encoder en stereo double la taille du fichier sans aucun bénéfice audible. Même les émissions d'interview où deux personnes parlent alternativement ne tirent pas vraiment parti du stereo — le cerveau de l'auditeur localise la parole par le contenu, pas par la position dans le panoramique.
Pour les épisodes de podcast avec segments musicaux intégrés (jingles d'intro/outro, musique de fond), certains podcasteurs enregistrent en stereo mais diffusent quand même en mono. La légère perte de largeur stereo sur les segments musicaux est un compromis valable pour la réduction de 50 % de la taille sur tout l'épisode.