Frontalangriff

Bisher war die Aufgabenteilung klar: Wer sich komprimierte Musik-Files im Internet lädt, stößt meist auf MP3-Dateien, wer sie sich im Streaming-Modus ohne Download anhört, nutzt das G2-Format (RealAudio). Videos kommen via QuickTime auf den heimischen Rechner oder streamen als RealVideo. Mit den Media Technologies 4.0 will Microsoft nun alle anderen Formate ersetzen. Das ebenfalls kostenlose neue QuickTime 4 will auch eine Universallösung sein. Hat für MP3 schon das letzte Stündlein geschlagen?

07.05.1999, 00:00 Uhr

Lesezeit: 25 Min.

c't Magazin

Von

Matthias Carstens
Alexander Oberdörster

Großes Aufsehen erregte Microsofts neues Kompressionsformat MSAudio, das mit den Media Technologies 4.0 eingeführt wird. Die Entwickler und Vermarkter der gängigen Audioverfahren hat das Produkt kalt erwischt - wenn künftig jeder Windows-User über MSAudio verfügt, warum sollte er sich dann noch um andere Formate scheren? Denn wie bei Microsoft üblich, startet zeitgleich mit der Vorstellung des neuen proprietären Standards eine eingespielte Werbe- und Vermarktungsmaschinerie, die alle bisherigen Standards für obsolet erklärt. Insbesondere die heftigen Angriffe gegen MP3 verlangen einen ausführlichen Test - klingt MSAudio wirklich besser als MP3, dessen Qualität ja fast die einer Audio-CD erreicht? Kodiert es die Musik schneller und liefert kleinere Dateien? Und wird QuickTime zu einem Nischendasein auf Mac-Rechnern verdammt, wenn Töne und bewegte Bilder nur noch im Microsoft-Takt aus dem Windows-PC kommen?

Wer sich mit dem Thema Datenreduktion und MP3 jemals intensiver beschäftigt hat, stellt noch weitere Fragen, deren Beantwortung Microsoft jedoch schuldig bleibt. Wann, wie und mit wem hat die Firma die unvermeidlichen langwierigen Hörversuche durchgeführt, die für das sogenannte Perceptual Audio Coding [1|#lit1] erforderlich sind? Woher hat Microsoft das Know-how, ein solches Datenreduktionsverfahren in kurzer Zeit auf die Beine zu stellen? Oder verletzt Microsoft gar irgendeines der zahlreichen an MP3 hängenden Patente?

Sammelsurium

Media Technologies 4.0 steht als neuer Sammelbegriff für zahlreiche im Windows-System enthaltene Audio- und Videoformate. Das bekannteste ist zweifellos Wave (*.wav), das von Microsoft ursprünglich nur für 16-Bit-Stereo und maximal 44,1 kHz Sample-Freqeunz gedacht war. Dies hielt die Audioindustrie jedoch nicht davon ab, dieses Format mit 32 Bit und 96 kHz zu nutzen. Windows enthält eine ganze Reihe älterer (miserabler und fast nie genutzter) sowie einige neuere Komprimierer: aLaw, µLaw, TrueSpeech und ADPCM, um nur einige zu nennen. Der gerade eingeführte Sprachkomprimierer Voxware Metasound ist schon wieder abgeschrieben; in Redmond setzt man nun auf ACELP von Sipro Lab Telecom. Bereits das letzte Update des Media Players, welches mit dem ersten (leider bis heute nicht erschienenen) Windows-98-Update auf allen Wintel-PCs landen sollte, befähigte diesen zum Streamen von MP3-Dateien aus dem Internet. Einen original MP3-Decoder des Fraunhofer-Instituts (also des MP3-Entwicklers) gibt es als Teil des Netshow-Player in Windows 98 schon länger. Der mitgelieferte Encoder ist jedoch auf 64 kBit/s beschränkt.

Mit MSAudio [2|#lit2] bringt Microsoft nun das neue Kombi-Dateiformat ASF für Audio- und Videodaten, Standbilder und Text ins Spiel, Indizierung und Rechteverwaltung inklusive. Es eignet sich sowohl zum Download und lokalen Abspielen als auch zum Streamen. Der Encoder wird derzeit allen Interessenten kostenlos zum Download angeboten und ermöglicht Bitstreams bis zu 160 kBit/s.

Apples QuickTime beherrscht in der Version 4 zunächst einmal alle schon früher enthaltenen Audio-Standards. Das Audio Interchange File Format AIFF/AIFC steht dabei für verschiedene Formate, namentlich unkomprimierte 8 bis 16 Bit, MACE 3:1 und 6:1 sowie IMA 4:1. Das Format AU kommt aus der Sun/NeXT Welt, und neben 8 bis 16 Bit unkomprimiert stehen auch die Kompressionsformate µLaw und aLaw zur Verfügung. Mit dem Wave-Format hält Microsoft auch Einzug auf dem Mac, enthalten sind unkomprimierte 8 und 16 Bit, ADPCM, DVI/IMA 4:1, µLaw und aLaw. Neu bei QuickTime 4 ist ein MP3-Decoder, der vollständig auf den Fraunhofer-Routinen basiert, sich also insofern nicht von dem in Windows 98 enthaltenen unterscheidet. Speziell der Sprachkompression dient Qualcomms PureVoice-Technologie, welche höchste Sprachverständlichkeit bei niedrigsten Bitraten garantieren soll.

Während es bei Microsoft für MP3 und MSAudio kostenlose Encoder gibt, kann Apple nichts Vergleichbares für QuickTime bieten. Zwar hat man mit dem Qdesign-Codec (Coder/Decoder) seit längerem eine hochwertige Datenreduktion an Bord, allerdings nur in einer BASIC-Version mit Bitraten von 8 bis 48 kBit/s. Erst in der Professional-Version gibt es zu einem nicht mehr zeitgemäßen Preis von 399 US-$ Bitraten bis 128 kBit/s und eine doppelte Enkodiergeschwindigkeit. Immerhin ist der Original-Fraunhofer-Encoder im Media Cleaner Pro 4 enthalten [3|#lit3], aber auch einzeln für 99 US-$ erhältlich. Er bringt dann auch gleich QuickTime 4 Pro mit, welches solo 29 US-$ kostet.

QuickTime braucht anders als Microsofts Media Technologies kein eigenes Streaming-Format; die dafür benötigten Informationen stecken einfach in einer zusätzlichen Spur. QuickTime kann allerdings keine MP3-Musik streamen - dafür ist andere Software nötig. MP3 arbeitet nicht nur mit der für die Musikkompression üblichen Datenrate von 128 Kbps, sondern auch mit niedrigeren, die etwa für Internet-Radiosendungen taugen. Die passende Software heißt ShoutCast [4|#lit4] und stammt von Nullsoft, dem Hersteller des populärsten MP3-Players Winamp.

Einiges zum Thema MSAudio läßt sich derzeit gar nicht oder nur vage beantworten. So hört man aus ansonsten gut unterrichteten Kreisen, Microsoft habe Entwickler extra eingekauft. Die Zeit für langwierige Forschung und Hörversuche hatte die Firma wohl nicht. Die dem Perceptual Audio Coding zugrundeliegenden Verfahren sind überall bestens dokumentiert und veröffentlicht - hier läßt sich fremdes Know-how wunderbar ausschlachten. Daß es sich bei MSAudio nicht um eine revolutionäre neue Technologie handelt, wird schon daran deutlich, daß Microsoft bisher keinerlei Patente angemeldet hat.

Tatsache ist: MSAudio enkodiert etwa dreimal schneller als der Fraunhofer-Encoder und liegt damit in der Geschwindigkeit etwa gleichauf mit Xing. Für den normalen Anwender ändert sich also zunächst gar nichts. Allerdings ist MSAudio bereits für den Pentium III optimiert und arbeitet multithreaded, was mit einem Zweiprozessorsystem unter NT insgesamt zu doppelter Geschwindigkeit führen soll. Für einige wenige Anwender ergäbe sich damit ein deutlicher Geschwindigkeitszuwachs.

Weiterhin behauptet Microsoft, der MSAudio-Codec besäße den größten Frequenzbereich aller am Markt befindlichen Codecs. Dies läßt sich durch Messungen sowohl bestätigen als auch widerlegen. Jeder Codec besitzt zur Verringerung der Datenmengen und des Rechenaufwandes eine Bandbegrenzung. Während Xing bei 16 kHz abschneidet, überträgt Fraunhofer bis 20 kHz und schränkt bei besonders schwierigem Material den Bereich dynamisch ein. Die Abschwächung oberhalb 20 kHz liegender Signale beträgt knapp 100 dB, bei MSAudio dagegen nur schlappe 30 dB, und nach unseren Messungen wird der Bereich auch nicht dynamisch verkleinert. Diese beiden Faktoren lassen sich allerdings nur dann als Vorteil werten, wenn sich das Ergebnis gleich gut anhört.

Verzerrte Ströme

Bei Datenraten im typischen Streaming-Bereich, also deutlich unter 64 kBit/s, kann man sich lange streiten, welcher Codec die besseren Ergebnisse liefert. Deutlich hörbare Artefakte und Klangveränderungen sind tatsächlich immer zu finden. MSAudio bietet jedoch einen deutlich besseren Klang als die alten Standard-Windows-Codecs und ist bei niedrigen Datenraten in der Praxis genauso brauchbar wie die derzeit beliebtesten Formate G2 (RealAudio) und MP3.

Zunächst prüften wir bei 128 kBit/s, ob MSAudio tatsächlich fast CD-Qualität bietet, also MP3 ernste Konkurrenz machen kann. Die bereits in [1|#lit1] verwendeten Testsignale wandelten wir mit der aktuellen Betaversion des Encoders [2|#lit2] in das MSAudio-Format, spielten sie vom aktuellen Media Player [2|#lit2] über eine Digitalkarte ab und nahmen sie im Full-Duplex-Betrieb sofort wieder im unkomprimierten Wave-Format auf. Damit kann das Material bequem mit dem Original sowie mit den Resultaten der Xing- und Fraunhofer-Encoder verglichen werden. Wie im letzten Test nutzten wir die Opticom-Software mit den Fraunhofer-Routinen sowie den Xing-basierten MpegDJ-Encoder von Xaudio.

Vergleich eines Signals aus drei Sinuskurven nach der Enkodierung/Dekodierung. Das bearbeitete Signal weist bei MS-Audio eine deutlich geringere Auflösung im Bereich der übertragenen Signale auf.

Die Messungen zeigen, daß Microsofts Tempo auf Kosten der Qualität geht. Die Verarbeitung von Sinuswellen hinterläßt einen deutlich höheren Rauschteppich in der Nähe der Signale als bei Xing und Fraunhofer. In dB ausgedrückt: Das 16-Bit-Original besitzt knapp über 90 dB effektive Auflösung, Fraunhofer reduziert auf knapp 80 dB, MSAudio sogar auf 73. Hörbar ist dies jedoch nicht; die Sinuswellen übertönen alles andere. Außerdem arbeiten alle drei Codecs dynamisch, passen also die Verringerung der Auflösung der Komplexität des verarbeiteten Signals und damit der zur Verfügung stehenden Bitrate an.

Eine Messung mit einem Gemisch aus 44 Sinuswellen zeigte überraschenderweise kaum einen Unterschied zu Xing und Fraunhofer, aber ein Testsignal aus einem lauten Sinus und mehreren leiseren offenbarte einen schweren Fehler im MSAudio Codec: Der rechte Kanal lieferte ein heftig gestörtes Signal in Form eines andauernden Knackgeräusches.

Bis hierhin muß man dem MSAudio-Codec eine recht gute Performance bescheinigen (oder eine brauchbare Imitation des MP3-Verhaltens). Verfahren auf Basis der psychoakustischen Datenkodierung lassen sich aber letztlich mit statischen Meßsignalen zwar grundlegend umschreiben, jedoch nicht abschließend beurteilen. So auch hier: Schon beim ersten Hörtest fällt ein deutlicher Unterschied zwischen Original (CD) und datenreduziertem Material (MSAudio) auf. Die in moderner Popmusik so beliebten Shaker, die links oder rechts im Sechzehnteltakt für durchgehenden Rhythmusbezug sorgen, verschmieren zu einem verzerrten Brei. Dieser Effekt ist auch ohne trainiertes Gehör leicht festzustellen. Nach einigen weiteren Tests läßt sich der Fehler klarer definieren: Impulsive Signale, egal welcher Tonlage, werden von einem Störgeräusch eingeleitet, das an ein schnelles Anschwellen erinnert. Eine Analyse der Dateien zeigt, daß MP3 vor und hinter die wenigen Sinusschwingungen des Originals ein Störgeräusch von circa 9 ms Länge setzt, MSAudio dagegen eines mit 50 ms. Damit hebelt die Microsoft-Lösung sämtliche Maskierungsprinzipien aus.

Darstellung des vor dem eigentlichen Signal hinzugefügten Störgeräusches. Das obere Signal zeigt nach der MP3-Wandlung einen 9 ms langen, das untere MS-Audio-Signal einen 50 ms langen Fehler.

Dieser Zusammenhang brachte schließlich ein exzellentes Beispiel zustande, welches auf dem c't-Server zum Download bereitliegt [5|#lit5]. Die Datei puls.wav (344 KB) enthält zwei Töne einer elektronischen Drum Machine, puls.mp3 (32 KB) ist das Ergebnis des MP3-Encoders, puls.asf (34 KB) das Microsoft-Pendant. Wer den neuen Media Player noch nicht installiert hat, kann sie sich als pulsasf.wav (394 KB) anhören. Während Xing und Fraunhofer das Signal hörtechnisch praktisch unverändert lassen, kann man bei MSAudio eigentlich nur noch von einer Zerstörung sprechen.

Voll gestört

Kein derzeit erhältlicher Encoder ist in der Lage, die Sample-Frequenz stufenlos anzupassen. Statt dessen sind abhängig von der Ausgangsfrequenz immer nur ganzzahlige Verhältnisse möglich, bei 48 kHz also 24 kHz und 12 kHz. Dies gilt prinzipiell auch für MSAudio, da Microsoft keine Konvertierung implementierte. Allerdings sind die eigentlich nicht erlaubten Modi derzeit nicht gesperrt, was zweifellos dazu führt, daß einige Anwender ihre 48-kHz-DAT-Bänder zwecks Archivierung auf CD in ASF-Dateien mit 44,1-kHz wandeln. Davon kann man jedoch nur abraten. Zwar sind die bei digitaler Fehlabtastung entstehenden Verzerrungen sehr gutmütig und in komplexem Material nicht immer leicht zu hören, doch eine Messung zeigt deutlich, welchen Schaden ein solches Vorgehen verursacht. Auch hiervon ist ein aussagekräftiges Demo-Sample auf dem c't-Server zu finden, unter 4844.wav (187 KB), 4844.asf (17 KB) sowie wiederum 4844asf.wav (162 KB).

Selbst wenn Microsoft die oben beschriebenen Störgeräusche noch in den Griff bekommt, reicht die erzielte Qualität insgesamt nicht an MP3 heran. Die Frage ist allerdings, ob dies die Masse der User interessiert, da die Encoder von Xing und Fraunhofer für Walkman- und Techno-geschädigte Ohren sowieso viel zu gut arbeiten. Immerhin verlautet von Fraunhofer, man arbeite seit längerem an einem deutlich schnelleren Algorithmus. Da man jedoch weiter den klanglich besten Encoder auf dem Markt bieten wolle, würde es keinen Schnellschuß geben, man stehe aber kurz vor der Veröffentlichung.

Im professionellen Markt hat MSAudio keinerlei Chance. Dort vertraut man dem in jahrelangen Hörversuchen ständig verbesserten MP3-Format, an dem schließlich die großen Firmen der Audiobranche maßgeblich beteiligt sind. Im Bereich des Streaming und der weltweiten Vernetzung allerdings könnte MSAudio eine ernste Gefahr für das RealAudio-Format darstellen, allein schon wegen der vollständigen Integration in das Betriebssystem. Letztlich bleibt abzuwarten, wie sich die Qualität des Encoders weiterentwickelt. Auch Hardware-ASF-Player als mobile Abspielstationen scheinen nicht abwegig.

Lange bewährt

Im Unterschied zu Microsofts unsteten Versuchen, in der Medienwelt Fuß zu fassen (Video for Windows, DirectShow, NetShow, jetzt Media Technologies), stellt QuickTime dort eine konstante Größe dar. Das Apple-Produkt dient nicht nur zum Betrachten und Verschicken von Medien aller Arten und Formate, sondern hilft auch vielen Programmpaketen beim Datenaustausch und ist generell eine wertvolle Hilfe bei der Entwicklung digitaler Medien - eine Bibliothek, auf die Programmierer gerne zurückgreifen. Seit Version 3 ist QuickTime in nahezu identischer Form auch für die Windows-Plattform verfügbar, für den Anwender wie für den Entwickler. Neben Codecs für nahezu alle Kompressionsverfahren und Formate für Video, Ton und Standbilder enthält QuickTime bereits fertige Routinen für Schnitt, Ebenen und Effekte. Kontinuierliche Bild- und Tonübertragungen über das Web waren mit Apples Format bisher allerdings nur eingeschränkt möglich - mit QuickTime 4 ist das anders.

Die Version 3 beherrschte nur das sogenannte HTTP-Streaming. Dabei wird einfach die QuickTime-Datei über eine HTTP-Verbindung übertragen. Sind ein paar Sekunden angekommen, legt der Player los. Stockt die Übertragung, muß er anhalten und warten, bis wieder etwas Vorlauf gesendet ist. Springen oder Vorspulen ist unmöglich, Live-Sendungen sind ausgeschlossen. Dafür muß ein neues Protokoll her: RTP (Real Time Protocol). Zusammen mit dem Kontrollprotokoll RTSP zerhackt es Bild- und Tonströme in kleine Pakete, schickt sie per UDP (User Datagram Protocol) über das Netz, sammelt und ordnet sie auf der Gegenseite und fügt sie wieder zu einem Datenstrom zusammen.

RTP ist ein offener, plattform- und herstellerunabhängiger Standard. Er kommt nicht nur in QuickTime zum Einsatz, sondern treibt neben zahllosen Videokonferenzpaketen auch das Konkurrenzprodukt G2 von RealNetworks an. Seltsam, daß Apple in der QuickTime-FAQ das Gegenteil behauptet. Für Microsofts Media Streaming trifft die Unabhängigkeit hingegen zu: Ihr Server sendet mit dem selbstgebauten Protokoll MMS.

Zu einer Streaming-Verbindung gehören Sender und Empfänger. Die Empfänger sind bei Microsoft und Apple gleichermaßen in einer öffentlichen Betaphase: Media Player 4 und QuickTime 4 lassen sich kostenlos aus dem Netz holen. Das wird sich auch nach Abschluß des Betatests nicht ändern. QuickTime 4 gibt es mit identischen Funktionen für Windows und MacOS, den Media Player in der aktuellen Fassung nur für Windows (eine veraltete Betaversion des Vorgängers 3.0 liegt auch für MacOS vor).

Der Sender, also der Streaming Server, trägt bei Apple die Version 1.0 - ein brandneues Produkt. Im Augenblick gibt es lediglich eine Ausgabe für MacOS X Server. Derzeit wird noch die Preview Release mitgeliefert; das Update auf die Version 1.0 verteilt Apple auf seinem Web-Server [6|#lit6].

Der komplette Sourcecode des Servers wurde unter der Apple Public License veröffentlicht und ist auf Apples Server öffentlich zugänglich [7|#lit7]. Anders als beim MacOS Server ist wirklich alles vorhanden, was zum Aufsetzen eines Stream-Servers nötig ist. Zu beachten ist aber, daß der Server keine Codecs enthält, sondern nur als Verteiler der RTP-Streams dient - Genaueres weiter unten.

Microsofts Streaming Services sind Bestandteil von Windows NT Server. Die neue Version der Services (4.0) ist allerdings noch im Betastadium, weshalb man sie derzeit kostenlos von Microsofts Website laden kann [8|#lit8]. Sie sollte auch auf Windows NT Workstation ihren Dienst tun, nicht aber auf Windows 95/98.

Beide Server verteilen nur den Datenstrom; die Kompression muß vorher an anderer Stelle erfolgen. Man kann fertige, bereits vorkomprimierte Dateien verschicken. Um dem Server so viel Arbeit wie möglich abzunehmen, werden die Dateien vorher analysiert und mit Hinweisen gespickt, wie sie in Pakete zu zerteilen sind (Hinting) - der Server muß später unter Umständen Tausende von Zuschauern gleichzeitig bedienen.

Für Microsofts Server übernimmt diese Aufgabe der Media Encoder oder der Media Author. Der Encoder ist für eine einfache Konvertierung in das Microsoft-eigene Streaming-Format ASF gedacht, der Media Author produziert Slideshows, die auch mit Ton unterlegt werden können. Beide Programme sind Bestandteil der Media Tools, die der Microsoft-Webserver in der aktuellen Betaversion bereitstellt. Sie sind nur in einer Win32-Version verfügbar.

Auf der Apple-Seite ist kein spezielles Tool nötig - die erforderlichen Funktionen bietet bereits der QuickTime-Player in der Profi-Version. Auch wird kein neues Dateiformat eingeführt, sondern nur eine zusätzliche Spur hinzugefügt, der `hint track´. Dieser Track kann in der gleichen QuickTime-Datei liegen oder von den Nutzdaten getrennt in einer eigenen .mov-Datei. Die läßt sich auch mit den Nutzdaten verzahnen, was Server-Performance spart, aber die Datei deutlich vergrößert.

In QuickTime kann nach Herzenslust überlagert, geschnitten und überblendet werden, wie das auch mit gewöhnlichen QuickTime-Dateien möglich ist. Auch unterschiedliche Medien können in einem Rutsch gestreamt werden: Video, Audio, MIDI und Text. MIDI und Text werden wegen der unsicheren Verbindung (UDP) mehrfach gesendet, Vektor- und 3D-Daten können aus dem gleichen Grund überhaupt nicht gestreamt werden. Microsofts Produkten ist eine solche Flexibilität fremd.

Soll der Stream-Server eine Live-Übertragung senden, braucht er einen Zulieferer, der in Echtzeit Video und Audio komprimiert, mit Hints versieht und an ihn schickt. Dazu soll bei Microsoft ein Pentium II ab 266 MHz reichen. Für Apples Streaming Server ist derzeit noch kein Echtzeit-Encoder verfügbar. Apple selbst bietet keinen an, von Drittherstellern gibt es bisher auch nur eine Ankündigung: Der Sorensen Broadcaster [9|#lit9] läuft unter MacOS, komprimiert Video- und Audiosignale mit einem beliebigen Codec und schickt sie zum Streaming-Server. Der Broadcaster ist derzeit in einer geschlossenen Beta-Phase; wann er veröffentlicht wird, ist noch unklar. Der Preis soll knapp 200 US-Dollar betragen.

Video gequetscht

Dem Zuschauer sind Details wie Streaming-Protokoll, Codec oder Hinting egal - er verlangt verständlicherweise ein gutes Bild, möglichst eines, das mit der analogen Flimmerkiste vergleichbar ist. Doch das können die meisten Netz-Kanäle nicht bieten: Sie sind auf Modemleitungen ausgelegt und haben daher Datenraten von 2 oder 4 KByte/s. In diese Bitraten müssen Bild und Ton gequetscht werden. Zum Vergleich: ein Standbild der Größe 160 x 120 in Echtfarben entspricht unkomprimiert 57,6 KByte, selbst nach heftiger JPEG-Kompression bleiben mindestens 2 KByte übrig. Apples Testserver bringen sechs dieser Bilder pro Sekunde im Datenstrom unter, ein Windows-Streaming-Server bis zu 14 im etwas größeren Format 176 x 132.

Microsoft bietet ein größeres Bild als QuickTime, aber auch ein weniger scharfes. Bei beiden reicht die Auflösung jedoch aus, um Untertitel zu entziffern.

Das geht nur mit vielen Tricks, unter anderem mit Deltakompression. Bei diesem Verfahren werden Bilder nicht komplett gesendet, sondern nur die Veränderungen zum vorhergehenden. Szenen mit geringen Veränderungen werden daher besser übertragen, etwa ein Nachrichtensprecher, der bei stehender Kamera vor einem unbewegten Hintergrund redet. Solche Situationen meistern beide Kandidaten auch mit Anstand - sogar Untertitel sind lesbar. Doch schon rasche Kopfbewegungen lassen das Gesicht des Sprechers verschwimmen. Selbst langsame Kamerafahrten oder großflächige Bewegungen - etwa durchs Bild fahrende Autos - machen das Zuschauen zum Rätselraten. Heftige Zooms und Fahrten versenken das BiId völlig in farbigen, verwaschenen Blöcken. Steht das Bild ein bis zwei Sekunden still, nimmt es wieder eine ordentliche Schärfe an.

Als Teststrecke für QuickTime bot sich nur Apples eigener Server an, denn andere Angebote existieren noch nicht. Dort senden zwei Fernsehkanäle (BBC World und Bloomberg TV) sechs Bilder pro Sekunde in einer Auflösung von 160 x 120. Außerdem stehen einige Musikvideos bereit, die kleinere Formate aufweisen, um etwas Bandbreite für geringfügig besseren Ton zu spendieren. Alle Videodaten sind mit Sorensen Video in der Version 2.0 komprimiert.

Der Verbindungsaufbau dauert etwa 5 Sekunden. Diese Wartezeit ist auch fällig, wenn man in einem Video an eine andere Stelle springt. Die Qualität der Live-Streams entspricht nicht dem, was man sonst vom Sorensen-Codec gewöhnt ist. Die Schärfe von ruhigen Bildern ist in Ordnung, aber schnelle Bewegungen schaden dem Bild deutlich mehr als bei offline komprimierten Videos mit der gleichen Datenrate. Die Synchronisation von Bild und Ton ist brauchbar, auch wenn dies bei der ruckelnden Wiedergabe nicht genau feststellbar ist. Die Tonqualität reicht für verständliche Sprache aus, mehr aber auch nicht. Die vorkomprimierten Musikvideos erreichen die bekannte Sorensen-Qualität. Das gilt aber nur bei einwandfreier Verbindung: Fehlende Datenpakete reduzieren die Schärfe. Dafür bleibt die Bildrate konstant. Die Datenrate beträgt immer knapp 4 KByte/s; für ISDN-Verbindungen ist also durchaus noch eine geringfügige Qualitätssteigerung drin.

Nicht immer scharf

Für den Windows Media Player ist das Angebot deutlich größer: Ein gutes Dutzend Fernsehkanäle listet Microsoft auf seiner Website. Hinzu kommen hunderte von Nachrichtenclips, Musikvideos, Trailern und sogar kompletten Kurzfilmen. Microsoft empfiehlt für Video-Streams MPEG4-Kompression. Daran halten sich auch alle getesteten Angebote. Das Bild ist generell etwas größer als bei QuickTime; die meisten Server halten sich an das QCIF-Format von 176 x 132 Pixeln. Ist die Verbindung gut, fließen pro Sekunde bis zu 14 Bilder über die Leitung - bei dieser Bildgröße entsteht eine nahezu flüssige Bewegung. Die Bildschärfe variiert von Server zu Server, doch auch die besten Angebote reichen nicht an QuickTime heran. Dafür hält MPEG4 die Schärfe auch bei raschen Bewegungen besser als sein Konkurrent. Statt dessen sinkt die Bildrate - im Extremfall stockt das Bild für eine halbe Sekunde. Fehlende Datenpakete verschärfen dieses Problem. Paketverluste treten über die gleiche Internet-Verbindung häufiger auf als auf Apples Test-Servern.

Der MS-Media-Player mit MPEG-4 meistert schnelle Bewegungen besser als QuickTimes Sorensen-Codec. Dafür sinkt allerdings die Bildrate.

Bei keinem Streaming-Verfahren ist es möglich, den eingehenden Datenstrom auf die lokale Festplatte zu sichern. Das kann kein technisches Problem sein - sind die Bilder erst einmal auf dem heimischen Rechner, gibt es kein Hindernis, die angezeigten Bilder einzeln zu sichern. Die auftretenden Datenraten sind für heutige Festplatten ein Witz. Es dürfte sich also eher um einen Kopierschutz handeln.

Will man nur komplette Videoclips übertragen, ob Nachrichtensendungen, Film-Trailer oder Musikvideos - zum Beispiel tief in der Nacht, wenn Telefonkosten und Serverbelastung niedrig sind - gibt es eine bessere Alternative: Den herkömmlichen HTTP-Transfer. Dabei gehen garantiert keine Pakete verloren, die Qualität ist also besser als bei RTP-Streaming.

Dennoch wäre es wünschenswert, mal schnell das laufende Fernsehprogramm mitzuschneiden, wie es mit Fernseher und Videorecorder ja auch möglich ist. Gerne schieben die Hersteller hier Copyright-Bestimmungen vor. Bei stockenden, verwaschenen Briefmarkenfilmchen von `verlustlosen digitalen Kopien´ zu sprechen, wirkt jedoch absurd. Während Music on Demand, der kommerzielle Bezug von Musikstücken übers Internet, bereits funktioniert [10|#lit10], ist es bis zum komfortablen Internet-Fernsehen und Video on Demand noch ein weiter Weg.

Sowohl bei Audio als auch bei Video ist jedoch noch lange nicht entschieden, welches Format das Rennen macht. Microsofts Media Technologies 4.0 bieten mit MSAudio ein einheitliches Format für Streaming und Download, das allerdings schlechter klingt als MP3. Und auch Apple ist der große Sprung nach vorne noch nicht geglückt - neu ist im wesentlichen nur das Streaming. `3.5´ wäre als Versionsnummer angemessener gewesen. (ts)