XML trifft Alt-Mongolisch -- und EBCDIC

Der jüngst vom WorldWide Web Committee (W3C) verabschiedete dritte Arbeitsentwurf für die Extensible Markup Language XML 1.1 erregt die Gemüter wegen der Art und Weise, wie er auf exotische Zeichensätze eingeht.

In Pocket speichern vorlesen Druckansicht 139 Kommentare lesen
Lesezeit: 2 Min.
Von
  • Hans-Peter Schüler

Der jüngst vom WorldWide Web Committee (W3C) verabschiedete dritte Arbeitsentwurf für die Extensible Markup Language XML 1.1 erregt die Gemüter wegen der Art und Weise, wie er auf exotische Zeichensätze eingeht.

Blueberry, der Codename für XML 1.1, soll in erster Linie dafür sorgen, dass die ursprünglich mit der Unicode-Version 2.0 abgestimmte Markierungssprache mit der neueren Version 3.1 sowie mit künftigen Formen dieser Zeichenpräsentation harmoniert.

Als Folge der Unicode-2.0-Ausrichtung lassen sich derzeit einige historische Zeichensätze nicht zur Formulierung von XML-Tags verwenden, etwa Alt-Mongolisch, Burmesisch oder einige kanadische Indianerschriften. Zwar gibt es für diese Zeichensätze typischerweise auch keine anderweitige Software-Lokalisierung, sehr wohl aber Konventionen, Texte in diesen Schriften mit lateinischen Zeichen darzustellen.

Aber eine andere, für Computer bedeutsamere Zeichenkonvention liegt den XML-Designern mindestens ebenso schwer im Magen: IBMs Mainframe-Zeichensatz EBCDIC. Der Extended Binary Coded Decimal Interchange Code, so der volle Name, kennt nämlich Kontrollzeichen auch an Positionen, an denen sie nach der inzwischen vorherrschenden ASCII-Konvention nicht zu erwarten wären. Insbesondere das EBCDIC-Zeichen NEL für Zeilenumbrüche macht "normalen" Systemen Schwierigkeiten, wenn ein XML-1.0-Dokument mit einem EBCDIC-orientierten Editor, etwa auf einem "Big Blue"-Mainframe, bearbeitet wurde. Diese sollen unter Unicode 3.1 -- und demnach in XML 1.1 -- verschwinden, aber nur zum Preis, dass man die Rückwärts-Kompatibilität zu XML 1.0 aufgibt. Demzufolge müssen zahlreiche Dokumente gemäß dem Standard XML 1.0 überarbeitet werden, um dem kommenden Standard XML 1.1 gerecht zu werden.

Kritiker beklagen, etwa im aktuellen Editorial des XML-Magazins Cafe con Leche, bei IBM "erwarte man, dass alle Welt ihre Software umstelle, bloß damit man im eigenen Hause darum herum käme, seine eigenen kaputten Mainframe-Editoren in Schuss zu bringen". IBMs Antwort lautet sinngemäß, dass die aktuellen Probleme nie entstanden wären, wenn man bereits früher -- bei der Definition von XML 1.0 -- angemessen mit IBM kooperiert hätte. Wie dem auch sei: Es sind handfeste Verstimmungen in der XML-Gemeinde aufgetaucht, und das W3C ist bis zum Februar darauf eingestellt, Kommentare für die endgültige Weichenstellung in Sachen Blueberry entgegen zu nehmen. (hps)