DOS-Texte konvertieren

Wenn ich versuche, eine Textdatei, die ich mit einem DOS-Programm angelegt habe, unter Linux zu bearbeiten, erscheinen alle Umlaute falsch. Woran liegt das, und was kann ich dagegen tun?

vorlesen Druckansicht
Lesezeit: 1 Min.

Wenn ich versuche, eine Textdatei, die ich mit einem DOS-Programm angelegt habe, unter Linux zu bearbeiten, erscheinen alle Umlaute falsch. Woran liegt das, und was kann ich dagegen tun?

Im ursprĂĽnglichen amerikanischen ASCII-Zeichensatz sind einige Sonderzeichen - wie zum Beispiel Umlaute - nicht vorgesehen. DOS verwendet fĂĽr diese Zeichen eine ASCII-Erweiterung, die nicht mit dem von Linux und auch Windows verwendeten ISO-8859-1-Standard ĂĽbereinstimmt. Dieser Standard heiĂźt in der Unix-Welt auch Latin1.

Des weiteren benutzt DOS eine andere Konvention für den Zeilenumbruch. Während unter Unix ein Newline-Zeichen das Ende der Zeile signalisiert, fügen DOS-Programme die Kombination Carriage Return (CR, Sprung zum Zeilenanfang) und Line Feed (LF, Sprung in die nächste Zeile) ein. Die Umwandlung zwischen den Formaten erledigt zum Beispiel das Programm `recode´. Mit dem Aufruf

recode ibmpc:latin1 datei.txt

ersetzt es neben den Umlauten auch die Zeilenenden durch die entsprechenden Zeichen. Außer den DOS- und ISO-Zeichensätzen unterstützt `recode´ noch etwa 150 andere Formate, unter anderem TeX, HTML und Apple. (ju) (ju)