Buchstaben zählen

Die Größe einer Textdatei auf meinem Windows-Rechner weicht von der Zeichenzahl ab, und beim Hochladen auf den Webserver kommt wieder etwas anderes heraus. Ist es denn so schwer, Buchstaben zu zählen?

vorlesen Druckansicht
Lesezeit: 1 Min.
Von
  • Manfred Bertuch

Die Größe einer Textdatei auf meinem Windows-Rechner weicht von der Zeichenzahl ab, und beim Hochladen auf den Webserver kommt wieder etwas anderes heraus. Ist es denn so schwer, Buchstaben zu zählen?

Bei einer 8-Bit-Zeichenkodierung wie dem Windows-Standard Cp-1252 oder dem verbreiteten ISO 8859-1 entspricht ein Zeichen einem Byte. Allerdings bildet Windows den Zeilenumbruch in Textdateien mit einer Kombination der ASCII-Zeichen Carriage Return (CR, ASCII-Nr. 13) und Line Feed (LF, ASCII-Nr. 10) ab. Eine Textdatei belegt daher für jeden Absatz zwei Byte. Unix-Systemen genügt der Line Feed als Absatzzeichen – mit einem 8-Bit-Zeichensatz entspricht also die Dateigröße genau der Zeichenzahl. Bei der Übertragung von einem Windows-Rechner auf einen Unix-Webserver wird ein intelligentes FTP-Programm in Textdateien automatisch alle CR/LF-Paare zu LF konvertieren. (heb) ()