Neue Zürcher Zeitung digitalisiert alle Jahrgänge seit 1780

Das Fraunhofer-Institut für Medienkommunikation in Sankt Augustin erfasst im Auftrag der Schweizer Zeitung etwa zwei Millionen Seiten.

In Pocket speichern vorlesen Druckansicht 126 Kommentare lesen
Lesezeit: 2 Min.

Die Neue Zürcher Zeitung lässt alle 225 Jahrgänge, die seit ihrer Gründung im Jahr 1780 erschienen sind, digital erfassen. Dafür wurden vor einigen Monaten 1500 Mikrofilmrollen an das Fraunhofer-Institut für Medienkommunikation (IMK) in Sankt Augustin geliefert, schreibt die Schweizer Tageszeitung in ihrer Online-Ausgabe. Das Projekt soll im Sommer abgeschlossen sein.

Im Institut werden die Filme der etwa zwei Millionen Seiten zunächst eingescannt und in Bilddateien umgewandelt sowie die Titelseiten ausfindig gemacht, damit die Seiten zeitlich geordnet werden können. Die Bilder werden im Tiff-Format gespeichert, da es mit großer Wahrscheinlichkeit auch noch in ferner Zukunft gelesen werden könne. Auch erlaube es die Einbettung von Metadaten. Das von der russischen Software-Firma Abbyy entwickelte OCR-Programm Finereader wird für die Texterkennung eingesetzt. Es muss auch mit Frakturschriften zurechtkommen, die bei der NZZ bis 1946 verwendet wurden.

Für die Digitalisierung verwendet das IMK laut NZZ einen hybriden Cluster mit 20 Rechnern unter Windows und Linux. Die XML-Dateien, die am Ende des Digitalisierungsprozess herauskommen, können mit dem Text auch Metadaten über Inhalt und Gestaltung einer Seite abspeichern. Eine einzelne Seite benötigt 4 MByte, das vollständige elektronische Archiv werde 10 TByte umfassen. Dafür habe die NZZ große EMC-Speichersysteme angeschafft.

Die NZZ ist eine der ältesten Tageszeitungen der Welt. Sie ist nach eigenen Angaben auch die Zeitung mit den ältesten Findmitteln. Das sind Werkzeuge für die inhaltliche Erschließung von Information. Registerbände helfen bei der Suche nach Artikeln, die nach 1871 verfasst wurden. Später kamen Karteikarten hinzu, die Artikel zu bestimmten Stichworten auflisten. Seit 1993 sind alle in der NZZ erschienenen Texte elektronisch archiviert. (anw)