"Beste Erfindung seit der Kreide"

Seite 2: "Beste Erfindung seit der Kreide"

Inhaltsverzeichnis

XML ist ein verbesserter Nachfolger der Sprache SGML, deren Spezialfall HTML (Hypertext Markup Language) zu einem der entscheidenden Erfolgsfaktoren des World Wide Web wurde. Aus einem einfachen Text wird ein Hypertext, indem man Überschriften, Abschnitte oder Verweise auf andere Texte mit speziellen HTML-Etiketten ("Tags") versieht. So markieren etwa die Ausdrücke in spitzen Klammern in

Vom Winde verweht

den Anfang und das Ende einer Überschrift.

Aber die Etiketten von HTML sind wenig mehr als Steuerzeichen zur Darstellung des Textes - der Inhalt der Dokumente bleibt dem Rechner verschlossen. Deshalb machte sich 1996 das World Wide Web Consortium W3C an die Spezifikation einer Meta-Auszeichnungssprache, welche die syntaktische Grundstruktur von SGML beibehält, aber deutlich vereinfacht und flexibilisiert. XML-Autoren können nach Belieben eigene Etiketten definieren und ineinander verschachteln. Vor einem Jahr gab das W3C die derzeit gültige Spezifikation von XML heraus: Version 1.1.

Natürlich weiß ein Computer noch nicht, was eine Allergie ist, nur weil er das Etikett liest. Aber immerhin bietet die Struktur von XML-Dokumenten genügend Ansatzpunkte für formale Regeln, um dem tumben Silizium zu einem Hauch von Verständigkeit zu verhelfen. So kann im obigen Beispiel der Rechner den Arzt von Erika Musterfrau vor einer falschen Verschreibung warnen.

XML wird HTML wohl niemals ganz ablösen, denn für dessen Kernaufgabe, die Erstellung einfacher Webseiten, ist die Anwendung eines so mächtigen Werkzeugs wie XML übertrieben. Wenn dagegen Molekularbiologen große Mengen genetischer Information in vernetzte Datenbanken einspeisen oder daraus auslesen wollen, dann können sie dies dank XML tun, ohne erst mit speziellen Software-Schnittstellen verschiedene Dateiformate ineinander übersetzen zu müssen. Wer sich etwa über Mutationen des Krebsgens p53 informieren will, sucht mit den Tags p53 und viel gezielter als mit den bloßen Zeichenfolgen "p53" und "Mutation". Ohne die Universalgrammatik XML wäre die Bioinformatik nicht jener dynamische Wissenschaftszweig, zu dem sie in den letzten Jahren herangewachsen ist.

Freilich hat die Flexibilität von XML auch ihren Preis. Die buchstabenreiche Syntax frisst Speicherplatz und kann den Stil der Autoren verderben. Für manche Zwecke machen daher Alternativen wie LMNL oder die Logiksprachen Lisp und Prolog eine elegantere Figur. Ihnen fehlt jedoch die Verwandtschaft zu HTML - und damit jede Chance auf eine ähnliche Verbreitung wie XML. Mag also sein, dass die Kompromisssprache XML nicht in jeder Hinsicht die bestmögliche Lösung ist. Aber allemal besser als ein Rückfall in die alte Sprachverwirrung.

(entnommen aus Technology Review Nr. 3/2005; das komplette Heft können Sie hier bestellen) (sma)