"Beste Erfindung seit der Kreide"

Ob ein Computer jemals wirklich verstehen wird, was zum Beispiel eine Allergie ist, ist fraglich. Aber die Struktur von XML-Dokumenten kann ihm zumindest dabei helfen.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 5 Min.
Von
  • Tobias Hürter
Inhaltsverzeichnis

Die Sprachbarriere zwischen Mensch und Computer hat einen einfachen Grund, der schwierig zu beheben ist: Elektronenhirne sind devote Befehlsempfänger, aber miserabel im Verstehen von Inhalten. Solange sie nur ihrer ursprünglichen Aufgabe nachgehen müssen, der Ausführung von Rechenanweisungen, stört diese Schwäche kaum. Aber inzwischen dienen sie zunehmend der Repräsentation und Bewegung von Information, und die besteht überwiegend aus Beschreibungen der wirklichen Welt, nicht aus Rechenbefehlen.

Damit wird die Begriffsstutzigkeit der Computer zunehmend lästig für ihre menschlichen Gebieter. Bis sich die Siliziumhelfer zu ebenbürtigen Gesprächspartnern entwickeln, muss der Mensch ihnen so weit wie möglich entgegenkommen. Der beste verfügbare Kompromiss zwischen menschlicher und maschineller Sprache heißt XML: Extensible Markup Language.

Als "beste Erfindung seit der Kreide" feierte ein Kommentator einmal XML, und dieser Vergleich trifft nicht schlecht: Beide Schreibwerkzeuge sind technisch unkompliziert, praktisch umsonst nutzbar, und beide helfen gerade dort, wo mehrere Parteien Information teilen wollen. Besonders dort, wo große Datenmengen aus verschiedenen Quellen zusammenfließen, etwa in Schnittbereichen mehrerer wissenschaftlicher Disziplinen oder in der Logistik zwischen Unternehmen und ihren Zulieferern, hat XML sich als mächtiges Werkzeug erwiesen. Inzwischen speichern auch viele Text- und Datenbankprogramme für Heimcomputer ihre Dateien in XML.

Trotz des "Language" im Namen ist XML keine Sprache, sondern ein Sprachgerüst, ähnlich der Grammatik natürlicher Sprachen: Die Regeln von XML legen fest, welche Struktur ein sinnvoller Ausdruck haben muss. Der Wortschatz dagegen bleibt bewusst offen. Er kann für jede Anwendung angepasst werden. Inzwischen sind XML-Dialekte für alle erdenklichen Gebiete entwickelt, vom Versicherungswesen über die biologische Bildgebung bis hin zu Schach.

Logisch betrachtet haben XML-Dokumente die Struktur von Bäumen - und dies verbindet sie ebenfalls mit der natürlichen Sprache. Linguisten betrachten auch deutsche Sätze als abstrakte Bäume: Die "Wurzel" bildet der Satz selbst, die ersten Äste bestehen aus Subjekt, Prädikat und Objekten. Das Prädikat verzweigt sich womöglich weiter in Adverb und Verb, ein Objekt in ein Substantiv nebst Artikel und einen Relativsatz.

Auch XML-Dokumente haben eine Baumstruktur. Eine XML-Telefonliste etwa verästelt sich zunächst in die einzelnen Einträge, die jeweils aus Namen, Adresse und Telefonnummer bestehen. Wie in einem Stammbaum sind die Verwandtschaftsbeziehungen der Elemente eines XML-Dokuments stets eindeutig: Sie sind gewissermaßen Vorfahren und Geschwister voneinander.