Was ist stereo vs mono?
Stereo-Audio nutzt zwei unabhängige channel — links und rechts. Jeder channel führt ein anderes Signal, wodurch ein Eindruck räumlicher Breite entsteht: Gitarren können links sitzen, Gesang in der Mitte, Keyboards rechts. Diese räumliche Trennung imitiert, wie wir Klang in der realen Welt mit zwei Ohren wahrnehmen.
Mono-Audio (monaural) nutzt einen einzigen channel. Dasselbe Signal kommt aus beiden Lautsprechern oder Ohrstöpseln. Es gibt keine räumliche Trennung — alles sitzt in der Mitte der Klangbühne.
- Stereo: 2 channels, räumliche Abbildung, breitere Klangbühne
- Mono: 1 channel, zentrierter Klang, gleich aus beiden Lautsprechern
Der Unterschied zählt mehr, als man denkt. Für sprachbasierte Inhalte wie Podcasts ist mono nicht nur ausreichend — es wird oft bevorzugt. Bei Musik mit sorgfältigem Stereomischung bedeutet mono den Verlust der vom Produzenten beabsichtigten räumlichen Dimension.
Wichtige Unterscheidung: eine „stereo"-Datei kann identische L/R-channels enthalten (dual mono). Das ist nur mono-Audio, das Platz in einem stereo-Container verschwendet. Echtes stereo hat unterschiedliche Inhalte in jedem channel.
Auswirkung auf die Dateigröße
Bei gleicher Bitrate sind mono MP3-Dateien ungefähr 50 % kleiner als stereo. Das liegt daran, dass mono einen channel statt zwei kodiert, was den benötigten Datenumfang effektiv halbiert.
| Bitrate | Stereo (1 Stunde) | Mono (1 Stunde) | Ersparnis |
|---|---|---|---|
| 320 kbps | 144 MB | 72 MB | 72 MB (50 %) |
| 192 kbps | 86 MB | 43 MB | 43 MB (50 %) |
| 128 kbps | 58 MB | 29 MB | 29 MB (50 %) |
| 96 kbps | 43 MB | 22 MB | 21 MB (~50 %) |
| 64 kbps | 29 MB | 14,5 MB | 14,5 MB (50 %) |
Für einen wöchentlichen Podcast, der 4 einstündige Folgen pro Monat veröffentlicht, spart der Wechsel von 128 kbps stereo auf 96 kbps mono ~144 MB pro Monat an Hosting-Speicher — und Hörer bekommen schnellere Downloads ohne wahrnehmbaren Qualitätsverlust für Sprache.
Alternativ: statt mono zu nutzen, um bei gleicher Bitrate Platz zu sparen, können Sie mono bei einer höheren Bitrate für bessere Qualität bei gleicher Dateigröße wie stereo verwenden. Zum Beispiel klingt 128 kbps mono besser als 128 kbps stereo, weil das gesamte Bitraten-Budget in einen channel fließt.
Wann mono verwenden
Mono ist die richtige Wahl, wenn der Audioinhalt von Natur aus aus einer Quelle stammt oder wenn das stereo-Feld keinen Mehrwert bietet:
- Podcasts: Apple Podcasts empfiehlt mono für gesprochene Sendungen. Die Stimme eines einzelnen Sprechers ist von Natur aus mono — es gibt keine räumliche Information zu erhalten.
- Hörbücher: wie Podcasts sind Hörbücher eine einzelne Stimme. Mono halbiert die Dateigröße ohne jeden Qualitätsverlust.
- Sprachmemos und Diktate: aufgenommen mit dem einzelnen Mikrofon eines Telefons sind dies mono-Signale, die in stereo-Containern gespeichert werden. Die Konvertierung in echtes mono halbiert die Dateigröße.
- Telefon- und VoIP-Aufnahmen: Telefon-Audio ist von Natur aus mono, typischerweise bei 8–16 kHz Samplerate.
- PA-Systeme und öffentliche Durchsagen: die meisten PA-Setups sind mono. Stereo-Dateien werden für die Wiedergabe ohnehin auf mono heruntergemischt.
- Hintergrundmusik für Video: wenn Musik leise hinter einer Erzählung läuft, ist stereo-Breite nicht wahrnehmbar. Mono spart Bandbreite.
Wann stereo verwenden
Stereo ist unverzichtbar, wenn die räumliche Dimension des Audios Teil des Erlebnisses ist:
- Musik: Produzenten verbringen Stunden damit, Instrumente im stereo-Feld zu platzieren. Die Konvertierung in mono vernichtet diese Arbeit — Gitarren, Keyboards, Backing Vocals stapeln sich alle in der Mitte.
- Sound Design und Filmton: Umgebungsgeräusche, Ambience und Effekte basieren für die Immersion auf stereo- (oder Surround-)Platzierung.
- Binaurale Aufnahmen: aufgenommen mit zwei Mikrofonen in Ohrposition, erzeugt binaurales Audio ein 3D-Hörerlebnis, das durch mono-Konvertierung vollständig zerstört wird.
- Live-Konzertaufnahmen: das stereo-Bild fängt Raumambiente und Publikumsposition ein.
- ASMR und räumliches Audio: der gesamte Reiz hängt davon ab, dass sich Klänge zwischen linken und rechten channels bewegen.
Joint stereo: das Beste aus beiden Welten
MP3-Encoder (einschließlich LAME, dem Gold-Standard-Open-Source-Encoder) bieten einen Modus namens joint stereo, der die Effizienz von mono mit der räumlichen Qualität von stereo verbindet.
Joint stereo funktioniert, indem die beiden channels aufgeteilt werden in:
- Mid (M): die Summe aus links + rechts — das mono-kompatible Mittensignal
- Side (S): die Differenz zwischen links und rechts — die stereo-Breiteninformation
Da das mid-Signal den Großteil der Audioenergie trägt und das side-Signal oft leiser und einfacher ist, kann der Encoder mehr Bits dem mid und weniger dem side zuweisen. Das Ergebnis: bessere Gesamtqualität als eine unabhängige Kodierung von L und R bei gleicher Bitrate.
| Stereo-Modus | Funktionsweise | Am besten für |
|---|---|---|
| Einfaches stereo | L und R unabhängig kodiert | Hohe Bitraten (256+ kbps) |
| Joint stereo (M/S) | Mid/Side-Kodierung, adaptiv pro Frame | Die meisten Inhalte (LAME-Standard) |
| Erzwungenes mono | L+R in einen channel gemischt | Sprache, Podcasts, Sprachmemos |
Der Standardmodus auto joint stereo von LAME wechselt dynamisch Frame für Frame zwischen M/S und einfachem stereo und wählt jenen, der für jeden 26-Millisekunden-Frame die bessere Qualität liefert. Deshalb ist die Standardeinstellung fast immer die beste Wahl für stereo-Musikinhalte.
Praktischer Rat: für Musik lassen Sie den Standard joint stereo-Modus des Encoders aktiviert. Für Sprache und Podcasts wählen Sie explizit mono, um die Dateigrößen-Ersparnis zu erhalten. Joint stereo hilft nur, wenn es tatsächlich stereo-Inhalt zu erhalten gibt.
Standards der Podcast-Branche
Die Podcast-Branche hat sich weitgehend auf mono MP3 für die Distribution standardisiert. Hier ist, was die großen Plattformen empfehlen:
| Plattform | Empfohlenes Format | Hinweise |
|---|---|---|
| Apple Podcasts | MP3, 96 kbps mono | Mono empfohlen für gesprochenes Wort |
| Spotify | MP3, 96–128 kbps | Akzeptiert mono und stereo |
| Google Podcasts | MP3, bis zu 320 kbps | Keine spezielle mono/stereo-Empfehlung |
| Libsyn | MP3, 128 kbps mono | Spart Speicher im Hosting-Tarif |
| Buzzsprout | MP3, 96 kbps mono | Optimiert Uploads automatisch zu mono |
Die Begründung ist einfach: die Stimme eines einzelnen Sprechers trägt keine stereo-Information. Sie als stereo zu kodieren verdoppelt die Dateigröße ohne hörbaren Nutzen. Selbst Interview-Formate, bei denen zwei Personen abwechselnd sprechen, profitieren nicht wirklich von stereo — das Gehirn des Hörers lokalisiert Sprache anhand des Inhalts, nicht anhand der Pan-Position.
Für Podcast-Folgen mit eingebetteten Musiksegmenten (Intro-/Outro-Jingles, Hintergrundmusik) nehmen manche Podcaster in stereo auf, verbreiten aber trotzdem in mono. Der geringe Verlust an stereo-Breite in den Musiksegmenten ist ein lohnender Kompromiss für die 50 %ige Dateigrößenreduktion über die gesamte Folge.