Mysterium Zeichenkodierung

Wenn ich mit Thunderbird eine E-Mail beantworte, erhalte ich beim Absenden der Antwort gelegentlich eine Fehlermeldung. Angeblich enthält meine Nachricht Buchstaben, die in der gewählten Zeichenkodierung nicht vorhanden sind. Ich habe aber keinerlei ungewöhnliche Buchstaben eingegeben. Was will mir Thunderbird also sagen?

vorlesen Druckansicht
Lesezeit: 2 Min.
Von
  • Dr. Harald Bögeholz

Wenn ich mit Thunderbird eine E-Mail beantworte, erhalte ich beim Absenden der Antwort gelegentlich eine Fehlermeldung. Angeblich enthält meine Nachricht Buchstaben, die in der gewählten Zeichenkodierung nicht vorhanden sind. Ich habe aber keinerlei ungewöhnliche Buchstaben eingegeben. Was will mir Thunderbird also sagen?

Wenn es Ihnen nur darum geht, Ihre E-Mail abzuschicken, können Sie ganz pragmatisch das Angebot von Thunderbird annehmen, die Nachricht UTF-8-kodiert zu senden. Denn in dieser Zeichenkodierung - einer Spielart von Unicode - lassen sich garantiert alle Zeichen darstellen, und die meisten Empfänger kommen heute mit Unicode-Mails klar.

Es ist aber in der Tat eine spannende Frage, wie überhaupt unerlaubte Zeichen in Ihre Mail geraten sind. Wenn Sie sie nicht eingegeben haben, stammen sie vielleicht aus der ursprünglichen Mail, die man beim Antworten ja üblicherweise zumindest in Teilen zitiert. Theoretisch sollte das nie ein Problem sein, denn Thunderbird verwendet für die Antwort standardmäßig dieselbe Zeichenkodierung wie die ursprüngliche Mail.

In den von uns beobachteten Fällen entpuppte sich der laxe Umgang von Microsoft mit den E-Mail-Standards als Ursache: Die ursprüngliche Mail war mit Outlook versendet worden und in den Headern als ISO-8859-1-kodiert ausgewiesen. Sie enthielt aber Zeichen aus dem Windows-Zeichensatz (Codepage 1252), beispielsweise das ’ aus c't, Code 0x92, oder den Gedankenstrich, Code 0x96. Weil Windows-1252 eine Obermenge von ISO 8859-1 ist, hat das gutmütige Thunderbird die Mail beim Lesen fehlerfrei dargestellt und sich erst bei dem Versuch, denselben Text als Antwort ISO-8859-1-kodiert zu verschicken, korrekterweise geweigert. (bo) (bo)