Tonangebend

Zu Anfang stand das Web still, inzwischen ist Bewegung drin. Damit nicht jeder nach seinem eigenen Takt tanzt, muss ein Standard her. SMIL bietet nicht nur Funktionen für die zeitliche Synchronisation von Multimedia-Präsentationen, sondern macht es auch möglich, dass diese besondere Gegebenheiten seitens des Systems oder der Benutzer berücksichtigen.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 15 Min.
Von
  • Lloyd Rutledge
Inhaltsverzeichnis

Klar, das World Wide Web ist ein Ort voller Aktivität - aber nur, weil die Benutzer sich so schnell hindurchbewegen. HTML-Seiten präsentieren eine enorme Menge von Informationen. Zwar können Websurfer durch Klicken und Scrollen innerhalb eines Browsers den dargestellen Teil schnell ändern, die Gesamtheit der Information bleibt dabei jedoch statisch (abgesehen von inzwischen erfolgten Änderungen und Ergänzungen seitens alter und neuer Webautoren sowie dynamisch generierter Seiten aufgrund von Datenbankabfragen). Der zeitliche Verlauf für sich genommen wirkt sich nicht aus. Bei der Synchronized Multimedia Integration Language (SMIL) dagegen entscheidet die Zeit als Faktor mit darüber, wie sich Information präsentiert. So ließe sich etwa festlegen, dass eine Audiodatei erst nach einer zeitlichen Verzögerung parallel zu einem Video ausgegeben wird, um eine bestimmte Sequenz zu untermalen. Da SMIL es ermöglicht, Dokumente an die Bedürfnisse einzelner Benutzer und die speziellen Gegebenheiten eines Displays anzupassen, werden die Rezipienten außerdem selbst zu Einfluss nehmenden Faktoren.

SMIL (ausgesprochen wie das englische Wort ‘smile’), ist das W3C-Format für Multimedia im Web. Die Version 1 hat das World Wide Web Consortium im Juni letzten Jahres verabschiedet [1], am 3. August dieses Jahres wurde die Recommendation des modularen Nachfolgers SMIL Boston vorgestellt, gefolgt von einer zweiten Version bereits am 20. August [2]. Die HTML-ähnliche Syntax kodiert Zeitpunkt, Bildschirmlayout, Interaktion und alternative Darstellungsmöglichkeiten von Multimedia-Präsentationen. Für die Wiedergabe stehen zurzeit zumindest drei Multimedia-Player zur Verfügung (GRiNS, SOJA, RealPlayer G2), und immer mehr entsprechende Präsentationen tauchen im Web auf. SMIL verspricht für interaktives Multimedia das zu leisten, was HTML für Hypertext getan hat: es in jedes Wohnzimmer zu bringen und zwar in einem Format, das sowohl einfach zu editieren als auch zu implementieren ist und für das es leicht zugängliche Player gibt.

Mehr Infos

GRiNS

GRiNS (GRaphical iNterface to SMIL), entwickelt von Oratrix Development in Amsterdam, ist gleichzeitig Autorenwerkzeug und Player. Der Browser ist kostenlos und wurde bereits mehrere tausend Mal heruntergeladen. Anders als vergleichbare Software setzt diese Anwendung den Fokus auf den SMIL-Standard selbst und hat fast alle Konstrukte implementiert - mehr als alle anderen Player. Den größten Beitrag leistet GRiNS allerdings mit dem Autorenwerkzeug, einer Umgebung für die Entwicklung umfangreicher SMIL-Präsentationen. Über eine grafische Schnittstelle lassen sich zeitliche Abläufe - auch das Fine-Tuning der Synchronisation -, das räumliche Layout und die Hyperlinks direkt manipulieren. Darüber hinaus gibt es erweiterte Funktionen, um Präsentationen zu erstellen, die sich den jeweiligen Gegebenheiten anpassen. Damit ist GRiNS prädestiniert dafür, zum Tool der Wahl zu werden, wenn es darum geht, den vollen Sprachumfang für große Präsentationen und SMIL-basierte Websites zu nutzen.

(Die künstlerische Gestaltung des Fiets-Projekts stammt von Maja Kuzmanovic. Im Rahmen des ESPRIT-Projekts Chameleon hat die Europäische Union Fiets finanziell unterstützt.)

Die SMIL-Präsentation Fiets im GRiNS-Browser: hier eine Führung durch historische Amsterdamer Bauten (Abb. 1).

Das GRiNS-Autorensystem bietet komfortable Funktionen für die Erstellung von SMIL-Präsentationen (Abb. 2).
Mehr Infos

SOJA

Auch der von der französischen Helio Organization entwickelte SMIL-Browser SOJA ist frei verfügbar und hatte mehrere tausend Downloads. Der Java-basierte Player arbeitet gut mit HTML-Präsentationen in üblichen Browsern. Die Anforderung eines typischen SMIL-Dokuments impliziert das gleichzeitige Laden des SOJA-Applets, das selbst relativ wenig Systemressourcen benötigt. Im Vergleich zu den anderen Playern legt SOJA den Fokus darauf, SMIL hinsichtlich Benutzerschnittstellen, Datenübertragung und Softwareverarbeitung in die generelle Browser-Umgebung zu integrieren. Allerdings implementiert SOJA nicht so viele SMIL-Funktionen wie die anderen Player.

Mehr Infos

RealPlayer G2

RealNetworks bietet RealPlayer G2 kostenlos und als kommerzielle Version Plus G2 an (siehe iX 10/99, S. 70 ff.). Ursprünglich hat der Hersteller diesen Player für die Wiedergabe hauseigener Formate wie RealAudio und RealVideo entwickelt und auch vorgesehen, dass er mit den eigenen Streaming-Servern einsetzbar ist. Nach der Freigabe von SMIL im letzten Jahr wurde die Software entsprechend erweitert. Da seitdem ein Download von zig Millionen G2 Player erfolgt ist, hat prinzipiell eine enorme Anzahl von SMIL-Browsern Zugang zum Web - auch wenn die meisten sicherlich nur für RealMedia-Dateien genutzt werden, ohne SMIL. G2 implementiert zwar noch nicht sämtliche SMIL-Konstrukte, jedoch ergänzt und erweitert RealNetworks die Software kontinuierlich um entsprechende Funktionen.

Für das Projekt PIVOT leistet die Mitsubishi Electric America Foundation (MEAF) finanzielle Unterstützung.

Der RealPlayer G2 Plus zeigt ein Video mit Untertiteln: Das PIVOT-Projekt unter der Leitung des amerikanischen NCAM will über SMIL multimediales Lehrmaterial einer breiten Öffentlichkeit mit unterschiedlichen Voraussetzungen zugänglich machen (Abb. 3).

In Bezug auf Multimedia spielt nicht in erster Linie die Nachricht selbst eine Rolle, sondern ihre Repräsentation. Den Großteil der Information, die Benutzer im Web suchen, liefert allein das Medium Text. Multimedia-Daten sind anders als Text und Bilder zurzeit über Links zugänglich, die beim Anklicken das Objekt meist isoliert darstellen. Das Medium Multimedia für sich genommen bringt im Web keinen zusätzlichen Informationsgehalt. Jedoch kann die Integration multimedialer Komponenten in eine in sich vereinheitlichte und gleichzeitig für jeden passende Präsentation die Rezeption deutlich verbessern und die Darstellung ansprechender gestalten. Darüber hinaus impliziert das richtige Timing einen zusätzlichen Informationsaspekt, beispielsweise indem die Beschreibung eines Ereignisses innerhalb eines Audio-Tracks zeitgleich zu der korrespondierenden Sequenz eines Video-Tacks erfolgt. Durch den Einsatz unterschiedlicher Medien schließlich lässt sich eine Präsentation auf diverse Voraussetzungen zuschneiden, die sowohl bei den Benutzern als auch hinsichtlich der Systeme bestehen können.

Diese Vorteile von Multimedia an sich sind nichts Neues. Mit Hilfe proprietärer Formate oder Java-Anwendungen nutzen Webautoren sie schon lange. Das Innovative ist, dass die Kodierung in einem standardisierten Format erfolgt, dessen Definition in der Extensible Markup Language (XML) vorliegt. Deswegen und weil sein Design so konzipiert wurde, dass es mit anderen XML-verwandten Standards des W3C zusammenarbeiten kann (speziell mit CSS, XPointer, XLink und Namespaces), siedelt SMIL Multimedia im Rahmen des sich entwickelnden Web-Frameworks auf einer höheren Ebene an, als das beispielsweise Java kann. Wichtiger noch ist, dass man kein Programmierer sein muss, um SMIL anzuwenden, da es ein einfaches, deskriptives Format und keine Programmiersprache ist - damit ist es viel mehr Leuten als vorher möglich, Multimedia ins Web zu bringen. (Eine einfache SMIL-Beispielanwendung ist über den iX-Listingservice erhältlich.)

Möglicherweise kann man die Medien selbst als den wichtigsten Teil einer Multimedia-Präsentation bezeichnen. SMIL allein definiert keinen medialen Inhalt, kodiert also weder grafische, akustische oder auch nur textuelle Information. Die Inhalte selbst befinden sich außerhalb des Dokuments. SMIL beschreibt, wie die einzelnen Komponenten innerhalb einer Präsentation zu integrieren sind und wo sie sich im Web befinden.

Für Auswahl und Wiedergabe der Daten nutzt SMIL viele der Mechanismen, die auch HTML verwendet. Beide Formate gebrauchen das gleiche Attribut für die Dateiauswahl: SRC. Dessen Wert ist die URL einer Multimedia-Komponente, beispielsweise einer Bild- oder einer Videodatei. Außerdem verfügen beide über das Type-Attribut, das mit Hilfe von Mime-Types festlegt, in welchem Format eine bestimmte Datei vorliegt. Browser, die beide Formate unterstützen, können den Mime-Type auch direkt von dem Server erfahren, auf dem sich die Datei befindet. Zudem sind die meisten SMIL- und HTML-Browser in der Lage, das Format über die Dateiendung zu bestimmen. Ist es bekannt, wird die entsprechende Anwendung für die Verarbeitung und Ausgabe der Multimedia-Daten aufgerufen. Schließlich können sowohl HTML als auch SMIL über Cascading Style Sheets (CSS) rechteckige Bildausschnitte in Webpräsentationen einbinden.

Zu den Unterschieden in der Art, wie SMIL und HTML Medien auswählen, gehört vor allem der zeitliche Aspekt. Das deklarative HTML kann zwar Bilder in den Fließtext integrieren, aber die Ausgaben temporärer Daten wie Audio und Video müssen explizit durch Benutzerinteraktion ausgelöst werden. Zudem läuft ein Video in einem Extrafenster. SMIL-Präsentationen binden die angegebenen Audio- und Videodaten auf die gleiche Art ein wie Bilder oder Text, und alle Ausgaben erfolgen innerhalb desselben Displays. Zwar können beide Webformate mit Hilfe von CSS festlegen, welcher Ausschnitt einer Datei zu sehen sein soll, für HTML allerdings gilt das nur in Bezug auf die räumliche Darstellung. SMIL dagegen kann zeitliche Ausschnitte sowohl aus Audio- als auch aus Videodateien wählen und so nur einen Teil des kompletten Files wiedergeben.

Hat ein Webautor die gewünschten Inhalte ausgewählt, muss er die visuellen Komponenten auf dem Bildschirm platzieren. Dafür definiert SMIL rechteckige Bereiche im Ausgabefenster und ordnet jeder dieser Regionen eine der Komponenten zu. Für das Basislayout, das auf CSS basiert und die gleiche Syntax wie die Style Sheets benutzt, definiert SMIL XML-Konstrukte. Alternativ lässt sich das Layout direkt über CSS festlegen. Die räumliche Anordnung ist ein gutes Beispiel dafür, wie sich SMIL in das generelle Web-Framework integriert, das aus vielen miteinander kooperierenden Formaten besteht.

Die meisten SMIL-Konstrukte beschreiben den zeitlichen Ablauf einer Präsentation, und auch der größte Teil einer in XML definierten Struktur der meisten SMIL-Dokumente ist dem Timing gewidmet. Das ist insofern angemessen, als der zeitliche Ablauf zu den Innovationen gehört, die SMIL Webautoren bietet.

Einfache Timelines sind schnell definiert. Meist muss der Autor dafür weder irgendeine Zahl angeben noch einen Zeitabschnitt spezifizieren. Die für die Multimedia-Präsentation benötigte numerische Information ermittelt SMIL implizit aus der Dauer der Komponenten - das heißt, aus der Zeit, die jede Audio- und Videodatei benötigt, wenn sie von Anfang bis Ende abläuft.

Diese impliziten Werte nutzt SMIL für den zeitlichen Aufbau einer Präsentation. Zu verstehen ist darunter ein einfacher Set von Konstrukten, der einen ziemlich komplexen zeitlichen Rahmen beschreiben kann. Mit Hilfe der Elemente par (parallel) und seq (sequence) lassen sich einzelne Komponenten so zusammenfassen, dass sie entweder zur gleichen Zeit oder direkt nacheinander spielen. Diese par- und seq-Elemente können sowohl andere par- und seq-Elemente als auch weitere Multimedia-Komponenten enthalten. Auf der Basis des zeitlichen Verlaufs kann der Autor die Präsentation in Subkomponenten unterteilen, eine, wie sich gezeigt hat, intuitive Weise für Autoren, Dokumente zu strukturieren. Diese Art der Zusammenstellung erweist sich außerdem als praktisch, wenn es darum geht, Synchronisierungsbeziehungen zwischen Multimedia-Komponenten festzulegen oder Verzögerungen beim Download und beim Abspielen zu berücksichtigen. Ohne Zahlen zu verwenden, können Autoren mit einigen einfachen Konstrukten viele einfache und komplexe Multimedia-Präsentationen definieren.

Natürlich bietet SMIL auch Mechanismen für komplexere Zeitabläufe. Mit deren Hilfe lässt sich auf Basis des eher allgemeinen Timings eines Dokuments ein Fine-Tuning vornehmen. Anhand von Zahlen haben Webautoren die Möglichkeit zu bestimmen, dass Komponenten zu bestimmten Zeitpunkten anfangen und aufhören, oder wie lange sie dauern (siehe Listing 1). Wenn Elemente direkt auf andere Elemente verweisen, lassen sich zeitliche Beziehungen festlegen, die über par und seq nicht möglich sind. Neben der Definition komplexer Zeitverläufe können Autoren das generelle Zeitverhalten des Dokuments ändern, ohne dass das Einfluss auf das Fine-Tuning hat.

Mehr Infos

LISTING 1

Damit das Video zunächst ohne Ton startet, beginnt die Audiodatei eine halbe Sekunde später (Listing 1).

<par>
<text src="Title.html" region="MainTitle" dur="5s"/>
<video id="Video1" src="news.mpg" region="MainVideo" begin="1.4s"/>
<audio src="news.aiff" begin="id(Video1)(0.5s)"/>
</par>

Hyperlinks definiert SMIL in den meisten Fällen auf die gleiche Weise wie HTML. Der Inhalt von Elementen des Typs a sind der Startpunkt von Hyperlinks, und das href-Attribut gibt an, wohin es geht, wenn der Benutzer eine solche URL aktiviert. Beide Auszeichnungssprachen akzeptieren rechteckige Bildausschnitte als Startpunkt für Hyperlinks.

Auch hier liegen die Unterschiede im zeitlichen Bereich. In HTML können href-Attribute auf Teile von Dokumenten verweisen, soweit es das räumliche Layout betrifft. Aktiviert man einen solchen Link, wird das HTML-Dokument soweit ‘gescrollt’, dass der entsprechende Abschnitt oben im Bild ist. Für SMILs href-Attribut gilt auch das Äquivalent in zeitlicher Hinsicht. Klickt man auf einen Link, der auf einen Abschnitt des SMIL-Dokuments verweist, wird zu dem Punkt ‘vorgespult’, an dem dieser beginnt, und dort setzt die Wiedergabe ein. Auch eine bestimmte Videosequenz kann der Anfangspunkt eines Links sein. Solche Verweise werden nur dann aktiviert, wenn der Benutzer während der entsprechenden Sequenz auf das Video klickt, nicht aber während einer anderen Zeitspanne.

In letzter Zeit wurde viel Augenmerk darauf gelegt, das Web zugänglicher zu machen. Nicht alle Benutzer verfügen über die gleichen Fähigkeiten oder haben dieselben Systemvoraussetzungen. Aber alle nutzen bei ihrer Informationssuche dasselbe Web. Die Frage ist, wie sich Information so kodieren lässt, dass sie gleichzeitig für Leute mit Sehbehinderungen oder Hörstörungen abrufbar ist, und unabhängig davon zur Verfügung steht, ob die Anwender Desktop-Computer, PDAs oder mobile Telefone benutzen.

Eine Antwort ist Multimedia, und SMIL liefert die Möglichkeiten, Multimedia für diesen Zweck einzusetzen. Genau darin besteht der zweite innovative Beitrag dieser W3C-Spezifikationen: ihre Anpassbarkeit. Realisiert wird diese vor allem über das switch-Element, das Alternativen für die Präsentation derselben Information definiert (siehe Listing 2). Die Testattribute spezifizieren, auf welcher Grundlage eine davon ausgewählt wird. Beispielsweise könnte ein switch-Element zwei Alternativen spezifizieren, und die Testattribute legen fest, dass die eine deutsch- und die andere englischsprachig ist. Für die Wiedergabe greift der Browser auf die zu, die der in den ‘Preferences’ angegebenen bevorzugten Sprache des Benutzers entspricht. Hörgeschädigte beispielsweise profitieren von diesem Vorgehen, indem bestimmte Texte als Untertitel dienen. Möglicherweise sind Alternativen auch abhängig von systembedingten Faktoren wie Band-breite und Bildschirmgröße. Mit Hilfe dieser Konstrukte kann die in einer einzigen SMIL-Präsentation enthaltene Information einer großen Anzahl unterschiedlicher Benutzer mit variierenden Voraussetzungen zugänglich gemacht werden.

Mehr Infos

LISTING 2

Mit Hilfe des switch-Elements ist die Auswahl zwischen hoher und niedriger Auflösung möglich (Listing 2).

<switch>
<audio system-bitrate="44000" src="hi-res.aiff" />
<audio system-bitrate="16000" src="low-res.aiff" />
</switch>

Für das Editieren und die Wiedergabe von SMIL-Dokumente stehen verschiedene Werkzeuge zur Verfügung. Die drei wichtigsten stellen die Kästen kurz vor.

Die aktuelle SMIL-Version 1.0 wurde freigegeben, um die wesentlichen Multimedia-Komponenten ins Web zu bringen und Rückmeldungen zu erhalten. Am 3. August hat das W3C als Antwort auf dieses Feedback einige vorgeschlagene Erweiterungen als Working Drafts unter der Sammelbezeichnung SMIL Boston publik gemacht, bereits am 20. August von einer zweiten Version gefolgt [2]. (Den Namen hat man gewählt, weil in der amerikanischen Stadt das Treffen stattgefunden hat, auf dem diese Release beschlossen wurde.) Diese Entwürfe können öffentlich kommentiert werden. Die Rückmeldungen werden schriftlich als zukünftiger Draft für SMIL festgehalten und dem W3C vorgelegt, das sie als Basis für eine offizielle Empfehlung (Recommendation) behandelt.

SMIL Boston ist nicht als einzelnes Format, sondern als Modul-Set definiert. Jedes Modul lässt sich in andere XML-Formate einbinden, sodass SMIL-Funktionen in unterschiedlichen Typen von Dokumenten und Präsentationen zur Verfügung stehen. Natürlich ist die neue SMIL-Version dennoch nach wie vor ein spezifisches Format, für das es Player und Editoren geben wird.

Der neue Draft enthält mächtigere Navigationsmöglichkeiten als bisher. Während in SMIL 1.0 jeder Klick seitens des Benutzers entweder das komplette Display ändert oder ein weiteres öffnet, lassen sich jetzt Navigationsfunktionen innerhalb eines einzigen SMIL-Dokuments so kodieren, dass ein Benutzerklick nur einen Teil des Displays modifiziert. Dies macht es beispielsweise möglich, ein Menü anzuzeigen, und erst die daraus getroffene Auswahl ändert den Rest der Präsentation. Darüber hinaus lassen sich optional zusätzliche Informationen ausgeben, während die Hauptpräsentation läuft.

Neu ist auch die Möglichkeit, eine Animation auf XML-Ebene zu definieren und sie in das SMIL- und beliebige andere dafür vorgesehene XML-Formate zu integrieren. In der Regel wird eine Animation nicht in der Präsentation selbst definiert, sondern stattdessen entweder in einem eingebundenen Multimedia-Format, beispielsweise animiertes GIF, oder in einem Java-Applet. Die Kodierung innerhalb von XML macht die Erstellung einer Animation sehr viel einfacher, da man nicht auf ein Autorenwerkzeug angewiesen ist, sondern einen gewöhnlichen Texteditor dafür nutzen kann und nicht über spezielle Programmierkenntnisse verfügen muss. Außerdem lässt sich die Animation so einer beliebigen Multimedia-Komponente zuordnen.

Möglicherweise sorgt die zukünftige Unterstützung von Broadcasting dafür, dass SMIL Boston nicht nur in jedem Haushalt, sondern auch in jedem Fernsehgerät zu finden sein wird. Das Design der neuen Release sieht vor, dass SMIL ergänzende Multimedia-Daten für Audio-/Videoübertragungen zur Verfügung stellt. Diese Daten werden auf der Empfängerseite in das Primärsignal integriert und so dem Benutzer zugänglich gemacht. Der hat beispielsweise die Möglichkeit, Zusatzinformationen auszuwählen, die dann auf seinem Videobildschirm zu sehen sind. Man könnte auch festlegen, dass die gewünschten Daten erst zu einer vorbestimmten Zeit oder beim Eintreffen eines speziellen Signals ins Bild kommen.

Was den Weg in die nächste offizielle SMIL-Recommendation finden wird, hängt größtenteils von jedem Einzelnen ab. Öffentliches Feedback für SMIL Boston sollte in erster Linie über die Mailing-Liste erfolgen, die unter http://lists.w3.org/Archives/Public/www-smil/ archiviert wird. Durch dieses Vorgehen hofft man, dass SMIL sich möglichst zügig weiterentwickelt und noch weiter an die Bedürfnisse der Multimedia-Gemeinde im Web angepasst wird.

LLOYD RUTLEDGE
arbeitet in der Forschung am CWI (Centrum voor Wiskunde en Informatica) in Amsterdam und ist Mitglied der W3C Working Group, die den SMIL-Standard entwickelt.

Literatur

[1] P. Hoschka (ed.); Synchronized Multimedia Integration Language; World Wide Web Consortium Recommendation; June 1998

[2] SMIL Boston Specification; W3C Working Draft, 3. August und 20. August 1999

[3] G. Freed, NCAM Web Access Project

[4] M. Kuzmanovic, Lloyd Rutledge, L. Fiets; A Tour of Historic Amsterdam Buildings

(Übersetzung aus dem Englischen: Kersten Auel)

Mehr Infos

iX-TRACT

  • SMIL 1.0 ist eine XML-Anwendung für die Präsentation von Multimedia im Web.
  • Als SMIL Boston hat das W3C einen öffentlichen Entwurf für die nächste Version des Standards zur Diskussion gestellt.
  • SMIL definiert nicht nur das Timing von Multimedia-Präsentationen, sondern auch deren Bildschirmlayout sowie Navigationsmöglichkeiten.
  • Um unterschiedlichen Voraussetzungen, die möglicherweise bei Benutzern und Systemen bestehen, begegnen zu können, lassen sich über das switch-Element und Testattribute Alternativen für die Präsentation definieren.

(ka)