zurück zum Artikel

25 Jahre MP3: Die Klang-Quetsche hat Geburtstag

Karl-Gerhard Haas
25 Jahre MP3: Die Klang-Quetsche hat Geburtstag

Erste erfolgreiche Tests: Mit dem MP3-Vorläufer OCF gelang Fraunhofer IIS im Frühjahr 1990 die Echtzeitübertragung von Musik in CD-ähnlicher Qualität über ISDN-Leitungen.

(Bild: K. Fuchs/Fraunhofer IIS)

Am 14. Juli wird die Audio-Datenreduktion MP3 ein Vierteljahrhundert alt – eine Erfolgsgeschichte aus Deutschland, die noch lange nicht zu Ende ist.

Das mit den Jubiläen in der Technik ist knifflig – denn meist gibt es gleich mehrere Termine, die als Geburtstag in Frage kommen. So ist es auch bei MP3: Für nach ihrem Verfahren eingedampfte Audiodateien legten die Projektbeteiligten beim federführenden Fraunhofer-Institut für Integrierte Schaltungen (IIS) am 14. Juli 1995 nach interner Abstimmung ".mp3" als Dateiendung fest. Im Hause hießen die Files bis zu diesem Zeitpunkt ".bit". Aber fixiert wurde das ausgefuchste und von einigen gar als überkomplex gescholtene System schon auf dem MPEG-Meeting vom 2. bis 6. November 1992 in London. Die Entwicklungsgeschichte reicht gar bis in die 1970er zurück – die "Schwangerschaft" währte also mehr als ein Jahrzehnt.

MP3 ist die Kurzform von MPEG 1/Layer III – die Abkürzung MPEG (Empeg gesprochen) steht für "Moving Picture Experts Group" [1]. MPEG befasste sich mit Verfahren zur Datenreduktion von Bildern und musste sich daher auch für den Ton etwas einfallen lassen. Ziel: Die vergleichsweise hohe Datenrate von per PCM (Pulse Code Modulation) digitalisierten Audiosignalen auf Mengen eindampfen, die digitalen Hörfunk ermöglichen oder den Einsatz auf Datenträgern, die weniger Kapazität haben als die CD [2].

Daran forschte man an vielen Stellen der Welt – Sony tüftelte für seine MiniDisc an Atrac, Dolby an AC-1, dem Vorläufer des später als Dolby Digital vermarkteten AC-3. Alleine in Deutschland und den Niederlanden gab es anfangs drei Lager: Die erste Gruppe entstand um Philips und das Münchner Institut für Rundfunktechnik (IRT) und werkelte an einem "Musicam" genannten System. Zunächst als Einzelkämpfer war Karlheinz Brandenburg unterwegs, der an der Universität Erlangen Möglichkeiten erforschte, subjektiv klangneutral die Datenflut digitaler Tonsignale zu bändigen. "Wir wollten das Signal so speichern, dass es alles enthält, was vom Innenohr an die Nervenbahnen weitergegeben wird", sagt Brandenburg im Gespräch mit heise online. Team Drei bildete sich mit Detlef Krahé an der Universität Duisburg und Ernst F. Schröder von Thomson (damals Telefunken, heute Technicolor). Letztlich waren es Team 2 und 3, deren Arbeit in MP3 mündete.

Brandenburg handelte im Auftrag: Sein Doktorvater, Professor Dieter Seitzer, später Gründer des Fraunhofer IIS, hatte in den 1970ern den Gedanken, Musik übers aufkommende ISDN-Telefonnetz in Hi-Fi-Qualität zu verbreiten. Er wollte sich erste Ideen schützen lassen – das Patent wurde aber zunächst nicht erteilt, weil die Prüfer der Ansicht waren, nach dem Stand der Technik könne man mit den angepeilten Bitraten keine Musik übertragen. Daraufhin fand Seitzer in Karlheinz Brandenburg den Doktoranden, der sich des Themas annahm. Recht bald wechselte Brandenburg ans gerade gegründete IIS, wo eine Gruppe unter Leitung von Professor Heinz Gerhäuser weiterforschte.

25 Jahre MP3 (0 Bilder) [3]

[4]

Anfangs bremste alle Forscher die verfügbare Rechenleistung – unter Umständen dauerte es Stunden, bis man ein Klangbeispiel mit den jeweils geforderten Parametern codiert hatte. In Europa nahm die Technik mit der Vergabe des EU-Projekts 147 ("Eureka") Fahrt auf, das dem digitalen Rundfunk in der EU zum Durchbruch verhelfen sollte. Gleichzeitig waren die ersten Echtzeitsysteme verfügbar, die die Forschung wesentlich beschleunigten. 1988 gründete sich MPEG, nach diversen Hörtests kam zuerst MPEG 1/Layer I als abgespeckte Musicam-Variante auf der längst vergessenen digitalen Compactcassette (DCC) kurzzeitig zum Einsatz.

MPEG 1/Layer II ist die etwas komplexere Musicam-Variante. Sie ist bei SD-Digital-TV und -Radio via Kabel und Satellit der Standard und wird fürs terrestrische Digitalradio DAB (Digital Audio Broadcast) genutzt. In Deutschland konnte sich DAB aber nicht durchsetzen [5]. MPEG 1/Layer III – eben MP3 – fußt auf der Thomson-/Fraunhofer-Entwicklung ASPEC (Adaptive Spectral Perceptual Entropy Coding) und der modifizierten diskreten Cosinustransformation (MDCT). Letztere ist eine der MP3-Schlüsseltechnologien – sie kam ins System, nachdem 1988 die Uni Hannover mit Hans-Georg Musmann und Bernd Edler zum Projekt gestoßen war.

Während Layer II im Rundfunk das Rennen machte, hatten die Teams um Thomson und Fraunhofer erst das Nachsehen. Doch die Geduld zahlte sich aus. Thomson-Mann Schröder sagte heise online: "Brandenburg hatte Weitsicht und Durchhaltevermögen." Er suchte nach Anwendungen abseits des klassischen Rundfunks und setzte auf die schnell wachsende Rechenleistung von PC-Prozessoren.

Dann passierten mehrere Dinge nahezu gleichzeitig: ITT-Intermetall (heute Micronas) lieferte mit dem MASC 3500 den ersten Einchip-Signalprozessor, der sich als MP3-Decoder programmieren ließ. Das – gescheiterte – digitale Satellitenradio "Worldspace" setzte auf MP3 als Codec, die US-Firma Telos Systems baute auf MP3-Basis Technik für die Zuspielung von Außenübertragungen zu Rundfunkstudios. Brandenburg: "Deren Gründer Steve Church, hat uns Tipps gegeben, wir wir MP3 vermarkten können. Unter anderem sagte er uns: ‘Schaut Euch das Internet an!’‟

Das tat man in Erlangen; die Ausgründung Opticom verteilte ein MP3-Wiedergabeprogramm für Windows-Rechner. Die kostenlose Version spielte nur 20-Sekundenschnipsel, die Vollversion vermarktete man für kleines Geld. Die großen Summen, sagt Brandenburg, wollte das Team mit dem Encoder und den Lizenzen für Hardwareplayer verdienen. "Das Pech, nicht für DAB ausgewählt worden zu sein, wurde unser Glück. Denn die Verträge für DAB sahen vor, dass die beteiligten Firmen untereinander keine Lizenzen verlangen durften. Für MP3 galt das nicht.‟

So kostete die Encoderlizenz 250 US-Dollar. Ein australischer Hacker erwarb die Software mit gestohlenen Kreditkartendaten, bastelte für den Encoder eine neue Benutzeroberfläche und stellte seine Frankenstein-Software mit dem Vermerk, der Encoder sei nun Freeware und "Thank you, Fraunhofer" ins Netz. Fraunhofer konnte davon aber auch profitieren. "Durch den kostenlos verfügbaren Encoder stieg die Zahl derjenigen, die unser Format benutzten und uns unterm Strich dennoch Lizenzeinnahmen brachten‟, sagt Brandenburg.

Der in C geschriebene Quellcode des MP3-Encoders hingegen war offiziell frei zugänglich. Er hatte aber einen Fehler: Es gab Differenzen zwischen dem tatsächlich realisierten Encoder und der Dokumentation. Der Quellcode wurde auf den realen Encoder optimiert, die Doku bezog sich auf den theoretischen Encoder. Brandenburg: "Uns selbst fiel das erst nach zwei Jahren auf und wir beschlossen, das nicht an die große Glocke zu hängen."

Hobbyisten, die sich aus dem Code ihren eigenen MP3-Encoder kompilieren wollten, standen aber dumm da – bis das Lame-Projekt das Problem flickte. Der erste, 1998 erschienene Lame-MP3-Encoder war tatsächlich nur eine Fehlerkorrektur des Fraunhofer-Codes. Nachdem Fraunhofer sich neuen Projekten zuwandte, bauten die Lame-Entwickler von Grund auf einen eigenen Encoder, der die Klangqualität des Originals längst übertroffen hat.

Mit dem Aufkommen immer schnellerer Internetzugänge blieben die MP3-Dateien der Nutzer nicht auf deren Rechnern: Tauschbörsen wie Napster, Kazaa und später Bittorrent führten zum massenhaften illegalen Musikvertrieb. Den Verkauf von MP3-Playern und den ersten musikfähigen Handys, später Smartphones, förderte das – und es war die Firma Apple, die mit iTunes den ersten legalen Netz-Musikladen aufzog. Heutzutage ist der Verkauf von Musik in Dateiform Standard, die CD-Absätze seit Jahren rückläufig.

Im Jahr 2020 ist das Lizenzprogramm längst beendet, da auch die letzten von Fraunhofer und Thomson gehaltenen MP3-Patente erloschen sind. Nicht einmal Brandenburg kann aber verbindlich sagen, ob noch irgendein Teil von MP3 durch etwaige andere Patente geschützt sein könnte. Er selbst korrigierte im Nachfolgeformat AAC (Advanced Audio Coding) ein Problem, das er als "den einzigen wirklichen Fehler von MP3" bezeichnet: "Bei der Standardisierung haben wir bei der Layerkonstruktion Kompromisse schließen müssen – durch die verwendete Hybridfilterbank klingen Kastagnetten immer noch schlimm. Es wäre schon damals besser gegangen, wurde aber aus Gründen der Standardisierungspolitik nicht implementiert.‟

Auch wenn AAC der bessere Codec ist: Wer Wert auf maximale Kompatibilität legt, nutzt immer noch MP3 – denn wenn ein Gerät überhaupt ein datenreduziertes Audioformat wiedergibt, dann ist es mit Sicherheit MP3. Auch Internetradios senden überwiegend MP3 – einmal mehr der Kompatibilität wegen. So halten es auch viele legale Downloadanbieter. Streamingdienste hingegen, die auf Smartphones meist per App spielen, setzten auf AAC, Ogg-Vorbis oder verlustfreie Formate.

Karlheinz Brandenburg, vor 20 Jahren Gründungsdirektor des Fraunhofer-Instituts für Digitale Medientechnologie (IDMT) in Ilmenau, ging dort im Juli 2019 in den Ruhestand. Seit April 2020 ruht auch seine reguläre Professur an der Uni Ilmenau. Und, ja: Brandenburg kann die A-cappella-Version von Suzan Vegas "Tom’s Diner" noch hören, das sich während der MP3-Entwicklung als schwer zu meisterndes Hörbeispiel bewährte. Potenzial für noch effizientere Audio-Codecs sieht er nicht. "Ich habe schon vor zehn Jahren gesagt: Das Thema ist jetzt durch.‟

(dahe [6])


URL dieses Artikels:
https://www.heise.de/-4842295

Links in diesem Artikel:
[1] https://mpeg.chiariglione.org/
[2] https://www.heise.de/newsticker/meldung/40-Jahre-CD-Die-silberne-Klang-Revolution-4327845.html
[3] https://www.heise.de/bilderstrecke/bilderstrecke_4842538.html?back=4842295;back=4842295
[4] https://www.heise.de/bilderstrecke/bilderstrecke_4842538.html?back=4842295;back=4842295
[5] https://www.heise.de/news/90-Jahre-Radio-in-Deutschland-2035291.html
[6] mailto:dahe@heise.de