Vor 25 Jahren: DivX – das MP3 für Video entsteht

Um einen effizienteren Videocodec zu nutzen, tat ein Franzose 1998 Verbotenes – und legte damit den Grundstein für DivX.

In Pocket speichern vorlesen Druckansicht 165 Kommentare lesen
Digital,Contents,Concept.,Social,Networking,Service.,Streaming,Video.,Nft.,Non-fungible

(Bild: metamorworks / Shutterstock.com)

Lesezeit: 16 Min.
Von
  • Karl-Gerhard Haas
Inhaltsverzeichnis

Zu Analogtechnik-Zeiten hielten einmal definierte Standards Jahrzehnte – etwa das PAL-Farbfernsehen oder UKW-Stereo. Aber selbst digitale Technologien können uns lange begleiten: Die Compact Disc ist über 40 Jahre alt, das Audio-Datenreduktionsverfahren MP3 geht auf die 30 zu – und beide sind immer noch populär.

Bei digitalem Video gehen die Uhren anders. So bastelt die Moving Picture Experts Group (MPEG) schon seit Mitte der 1980er an Verfahren, die die ungeheure Datenflut digitaler TV-Bilder auf handhabbare Größen eindampfen. Denn ohne Kompression verlangt schon Video in der längst überholten Standardauflösung nach rund 270 Megabit pro Sekunde (mbps), für FullHD sind mindestens 1 gbps nötig (jeweils bei acht Bit Quantisierung, 4:2:2-Komponentensignal und einer Bildfrequenz von 60i). Nur mit mehreren 100.000 D-Mark (entspricht nach Kaufkraft praktisch dem Betrag in Euro) teuren Studiovideorekordern lässt sich anfangs diese Datenflut bändigen. Wirklich praktikabel sind diese Gerätschaften aber nicht – und schon gar nichts für Normalverbraucher.

MPEG verfolgt zwar von Beginn an die richtigen Prinzipien, um Digitalvideo verlustbehaftet zu komprimieren. Die erste praktische Umsetzung namens MPEG-1 erlangt aber ab Beginn der 1990er auf Video-CDs und CD-is eher zweifelhaften Ruhm. Die für die frühen Videoscheiben genutzten Parameter (CD-Datenrate, also 1,4 mbps für Bild und Ton, sowie 352x288 oder 352x240 Pixel Auflösung) versprechen nur auf dem Papier VHS-Qualität, also die des damals verbreiteten, analogen Heimvideosystems. In der Praxis strafen ruckelnde, von Blockartefakten durchzogene Matschbilder derlei Optimismus Lügen. Aber: Mit höherer Bitrate, voller Auflösung der damals verbreiteten Videoformate PAL und NTSC und der Fähigkeit, den üblichen Zeilensprung (Interlace) zu berücksichtigen, machen die Grundlagen von MPEG-1 als MPEG-2 ab Mitte der 1990er weltweit Karriere. Zunächst für Digital-TV, ab 1996 auch als Codec der Video-DVD, die weltweit ein Erfolg wurde. Statt der erwähnten 270 mbps genügen mit MPEG-2 für ein brauchbares Bild 5 bis 7 mbps.

Warum dieser historische Abriss? Mit ihrem Siegeszug im Massenmarkt um die Jahrtausendwende ist die technische Basis der DVD-Bildkodierung eine olle Kamelle. Längst stehen neue, effizientere Codecs zur Verfügung, die wahlweise auf Video-DVDs ein besseres Bild und/oder längere Spielzeiten der Discs ermöglicht hätten. Aber als die Arbeit an der Video-DVD und den entsprechenden Abspielgeräten beginnt, war es noch zu teuer und kompliziert, effizientere Codecs in Hardware zu realisieren. Die in Europa ab 1997 käuflichen DVD-Spieler mit MPEG-2-Video-Unterstützung kosten rund 1500 D-Mark – mit aufwendigerer Videoelektronik für einen effizienteren Codec hätten sie in Deutschland seinerzeit wohl die 2000-D-Mark-Latte gerissen. MPEG-2 scheint ein akzeptabler Kompromiss aus Qualität und Kosten.

Aber während Hersteller, Techniker und Programmanbieter jahrelang Zeit mit Details wie Kopierschutz, Regionalcode sowie dem idealen Tonformat für die neuartigen Filmscheiben vertändeln, werden die Videocodecs immer besser und PCs oder dedizierte Hardware immer schneller und günstiger. Nach MPEG-2 kommt – logisch – MPEG-4. Um die bei MPEG übliche Verwirrung zu komplettieren, verbergen sich hinter diesem Oberbegriff diverse Videocodecs, die zwar verwandt, aber nicht zwingend kompatibel sind. Während für MPEG-2 als Videocodec nur H.262 erlaubt ist, kennt MPEG-4 gleich drei – und die gibt es noch in verschiedenen Unterformaten: H.263, H.264 ("AVC", HDTV in Europa) und H. 265 (bei DVB-T2 HD sowie in diversen aktuellen Videokameras Standard).

Microsoft ist ab Mitte der 1990er auf dem Gebiet von Audio- und Videocodes unterwegs und erhofft sich mit seiner hauseigenen MPEG-4-Variante das große Geschäft. Den Nutzern kommt der mit H.263 verwandte Codec zunächst im Dateiformat ("Container") .asf unter, später dann als .wmv (Advandced Streaming Format; Windows Media Video).

Diese als MPEG-4 Version 3 bekannten Bibliotheken verteilt Microsoft als "Media Tools 4" – diese erzeugen kein ISO-konformes MPEG-4-Video. Und: Mit den Media Tools ändert Microsoft Details am Windows Media Player, der plötzlich Demo-Videos des französischen Computergrafikers Jérôme Rota (Spitzname: „Gej“, okzitanisch für verrückt) nicht mehr spielt. Das wurmt Rota und er und ein deutscher Hacker mit dem Alias Max Morice extrahieren den MS-Codec aus den Tools. Sie bringen ihm durch Hacken der Bibliothek höhere Bitraten bei und die Möglichkeit, den de-facto-Container für Video am Computer, AVI (Audio Video Interleave), zu nutzen – die Media Tools wollen ihre Filmchen nur in Microsofts proprietärem ASF ausgeben. Rota veröffentlicht den gehackten, entfesselten Codec als "DivX;-) 3.11 Alpha". Später gründet Rota mit drei weiteren Hackern das "Project Mayo". Laut Rota wählt man den Projektnamen, weil "DivX und Mayonnaise beide französisch und schwer herzustellen sind." Der Name DivX hinwiederum ist eine Anspielung auf ein nur in den USA eingeführtes und grandios gescheitertes Leih-DVD-System namens DIgital Video eXpress. Weshalb man beim Erstling bei 3 anfängt zu zählen, ist nicht überliefert.

25 Jahre DivX (11 Bilder)

DVD-Brenner

Mit DVD-Brennern war es möglich, DVDs leicht zu kopieren – Transkodieren in MPEG-4 wurde weniger wichtig. (Bild: Pioneer)

Wirklich universell einsetzbar ist dieser rohe Hack noch nicht: Rota und sein Mitstreiter sehen, dass sich Version 4.1.00.3290 des MS-Codecs besser zum Enkodieren langsamer Szenen eignet, für Sequenzen mit viel Bewegung ist die ältere Version 4.1.00.3917 besser. Entsprechend bauen sie eine "Low Motion"- (FourCC-Code "DIV3") sowie eine "DivX;-) Fast Motion"-Variante (FourCC "DIV4"). Dem Dekoder schmecken mit beiden Varianten erzeugte Videos, beim Enkodieren müssen die Nutzer aber entscheiden, welche Variante für ihr Quellmaterial geeigneter ist. Daran ändert sich auch mit der folgenden Version DivX;-) 3.22 (auch DivX;-) 3.11 VKI genannt) nichts. Einziger Unterschied zu den Alpha-Versionen: Der Enkoder erkennt nun Szenenwechsel und setzt an diesen Stellen automatisch ein Keyframe, also ein vollständiges Bild – eine der vielen Methoden zur Video-Datenreduktion ist, nur die Informationen weniger TV-Bilder vollständig zu speichern und sich für den Rest der Zeit mit Differenzbildern zu behelfen.

Zwei für SD-Video wichtige Details ignorieren die frühen am PC verwendeten Videocodecs durch die Bank: Am PC (und etwa digitalen Fotokameras) arbeitet man von Anfang an mit quadratischen Pixeln. Will man das althergebrachte 4:3-Bildseitenverhältnis (entspricht 1,33) mit Video bedienen, resultiert daraus beispielsweise eine Auflösung von 640 mal 480 Pixel.

Für digitales SD-TV orientiert man sich für PAL wie NTSC an deren aktivem Zeilenraster mit 486 (analoges NTSC) beziehungsweise 576 Pixel. In jeder dieser Zeilen sind 720 Pixel vorgesehen. Das ergäbe bei quadratischen Pixeln ein Seitenverhältnis von 1,48 oder 1,25 – nicht 1,33. Da aber auch die derart digitalisierten TV-Bilder mit dem gewünschten TV-Seitenverhältnis entstehen, ist die Schlussfolgerung: Digitales SD-Video arbeitet mit rechteckigen Pixeln. Will man ein solches Bild auf einem PC-Monitor im korrekten Seitenverhältnis betrachten, muss das Abspielprogramm das Bild auf die korrekte Breite strecken oder stauchen, also 640 oder 768 Pixel.

Um die Sache weiter zu verkomplizieren: Ab den 1990ern beginnt der Umstieg aufs etwas mehr dem Kino und dem menschlichen Blickfeld entsprechende 16:9-Format (=1:1,78). Für SD-Digitalvideo bleibt es aber bei 720 x 480 beziehungsweise 720 x 576 Pixel. Mit einem aus dem Kino stammenden Trick namens anamorphe Aufzeichnung staucht man das breite Bild einfach, weshalb mit dieser Technik aus einem Breitbild-Kreis auf einem 4:3-TV ein Ei wird. Der 16:9-TV hingegen zieht das Bild auf die korrekten Proportionen. Auch dieser Kniff ist den frühen Codecs und früher Player-Software unbekannt: Wer auf dem PC-Bildschirm breite Bilder will, muss mehr Pixel spendieren, also 854 x 480 beziehungsweise 1024 x 576.