ß im erneuerten Standard für internationale Domainnamen

Voraussichtlich Anfang 2009 wird die Internet Engineering Task Force das Update für internationale Domains verabschieden, die nicht mit dem ASCII-Zeichensatz arbeiten. Die vollständige Umsetzung deutscher Besonderheiten ist dabei das geringste Problem.

In Pocket speichern vorlesen Druckansicht 173 Kommentare lesen
Lesezeit: 4 Min.
Von
  • Monika Ermert

Voraussichtlich Anfang 2009 wird die Internet Engineering Task Force (IETF) das seit Anfang dieses Jahres diskutierte Update für internationale Domainnamen ([IDN) verabschieden. Das zeichnete sich in den Diskussionen beim Treffen der Entwickler in Minneapolis in dieser Woche ab. Neu aufgenommen in die Liste möglicher Zeichen für Domains, die nicht mit dem ASCII-Zeichensatz arbeiten, wird dabei auch das in den bisherigen IDN-Standards (RFC3490, RFC3491, RFC3492) ausgeschlossene ß. Für Kunden de Länderdomain .de ändert sich vorerst aber nichts, es bleibt dabei, dass Domains mit ß auf die Variante auf ss abgebildet werden.

Vertreter der .de-Registry DeNIC hatten darauf bestanden, dass das neue Protokoll die Verwendung nicht automatisch erzwingt. Dann nämlich wären die bislang automatisch umgewandelten ß-Domainanfragen ins Leere oder zu "falschen" Adressen gegangen. Marcos Sanz, der für das DeNIC in den IDN-Arbeitsgruppen der IETF aktiv ist, sagte in Minneapolis, das DeNIC begrüße die zusätzliche Möglichkeit. Allerdings habe man innerhalb des DeNIC noch nicht entschieden, in welcher Form und wann man die neue Möglichkeit in der Registrierung nutzen wolle. Es gelte zu berücksichtigen, dass zahlreiche Nutzer sich auf das aktuell geltende Mapping verlassen und ihre Kontaktadressen entsprechend mit ß angegeben hätten.

Innerhalb der IETF hatte es bis zuletzt eine Diskussion darum gegeben, wie stark die Registries selbst im Rahmen ihrer Registrierpolitik über einzelsprachliche Besonderheiten und deren Nutzung entscheiden können. Die Autoren der voluminösen neuen Standardserie zu den internationalisierten Domains, die unter dem Label IDNA 2008 verabschiedet werden soll, hatten sich teilweise für striktere Regelungen in den Standarddokumenten selbst ausgesprochen.

"Wir sind angesichts der zahlreichen Spezialfragen viel stärker auf die Registries angewiesen", sagte allerdings Vinton Cerf. Dem Mitautor von IP hatte die IETF-Führung die Leitung der hitzköpfigen Arbeitsgruppe übertragen. Die Registries seien es, die die landessprachlichen Probleme am besten kennen würden, sagte Cerf. Er drängte in Minneapolis schließlich auf eine letzte Konsultation mit Vertretern aus arabisch-sprachigen Länder, neben deren Problemen sich das deutsche Eszett durchaus bescheiden ausnimmt. Ein eigenes Standarddokument namens BIDI sorgt so etwa für die Möglichkeit, Domains auch von rechts nach links zu schreiben. Die aktuelle "Rücksprache" betrifft das Problem der unterschiedlichen Zahlensysteme in der arabischen Sprachgemeinschaft.

Neben den westlichen Zahlen 1,2,3, ..., die von Indien über die arabischen Länder nach Europa gelangt sind, sind in den arabischen Ländern auch noch klassische arabische Zahlen gebräuchlich. Kompliziert wird das Ganze dadurch, dass die Zahlen vier, fünf und sechs in den östlichen und westlichen arabischen Ländern anders geschrieben werden. Die für die Inventarisierung und Code-Hinterlegung der Sprachen zuständige Organisation Unicode hat das Problem schließlich noch weiter verschärft. Statt nur die drei unterschiedlichen Zeichen eigens auszuzeichnen, erhielten beide Zahlensätze komplett getrennte Codepunkte. Für die arabische Eins gibt es also zwei Unicode-Codepunkte, abhängig davon, ob man den west-arabischen oder ost-arabischen Unicode-Zeichensatz verwendet.

Werden die Zeichensätze parallel zugelassen und auch genutzt, sorgt die Überschneidung im besten Fall für Verwirrung, im schlimmsten Fall wird sie von Phishern ausgenutzt. Nun sollen arabische Experten mit entscheiden, ob strikt geregelt werden soll, dass überhaupt nur ein Zeichensatz zugelassen wird, ob immer nur ein Zeichensatz pro Domain zur Anwendung kommen soll oder ob die Zahlen nur nicht direkt nebeneinander erscheinen sollten. Die gesetzte 14-Tage-Frist halten manche Beobachter dabei für viel zu kurz und mahnen, dass der gesamte Standardprozess zu stark von westlichen Experten getrieben sei. Dass Amerikaner und Europäer sich über die Feinheiten im Persisch, Urdu oder Dihvehi (die Sprache der Malediven) streiten, wirkt in der Tat manchmal etwas erstaunlich. (Monika Ermert) / (jk)