DOS-Texte konvertieren
Wenn ich versuche, eine Textdatei, die ich mit einem DOS-Programm angelegt habe, unter Linux zu bearbeiten, erscheinen alle Umlaute falsch. Woran liegt das, und was kann ich dagegen tun?
Wenn ich versuche, eine Textdatei, die ich mit einem DOS-Programm angelegt habe, unter Linux zu bearbeiten, erscheinen alle Umlaute falsch. Woran liegt das, und was kann ich dagegen tun?
Im ursprĂĽnglichen amerikanischen ASCII-Zeichensatz sind einige Sonderzeichen - wie zum Beispiel Umlaute - nicht vorgesehen. DOS verwendet fĂĽr diese Zeichen eine ASCII-Erweiterung, die nicht mit dem von Linux und auch Windows verwendeten ISO-8859-1-Standard ĂĽbereinstimmt. Dieser Standard heiĂźt in der Unix-Welt auch Latin1.
Des weiteren benutzt DOS eine andere Konvention für den Zeilenumbruch. Während unter Unix ein Newline-Zeichen das Ende der Zeile signalisiert, fügen DOS-Programme die Kombination Carriage Return (CR, Sprung zum Zeilenanfang) und Line Feed (LF, Sprung in die nächste Zeile) ein. Die Umwandlung zwischen den Formaten erledigt zum Beispiel das Programm `recode´. Mit dem Aufruf
recode ibmpc:latin1 datei.txt
ersetzt es neben den Umlauten auch die Zeilenenden durch die entsprechenden Zeichen. Außer den DOS- und ISO-Zeichensätzen unterstützt `recode´ noch etwa 150 andere Formate, unter anderem TeX, HTML und Apple. (ju) (ju)