Google nimmt Bestände von Universitätsbibliotheken in Index auf

In einem auf mehrere Jahre angelegten Projekt scannt Google einige Millionen Bücher von fünf großen englischsprachigen Bibliotheken ein, um sie für die Volltextsuche im Internet zu erschließen.

In Pocket speichern vorlesen Druckansicht 51 Kommentare lesen
Lesezeit: 2 Min.
Von
  • Herbert Braun

Google arbeitet daran, die Bestände einiger großer Bibliotheken einzuscannen und die Texte der Bücher in seinen Suchmaschinenindex aufzunehmen. Im Sommer begannen die Arbeiten in der Universitätsbibliothek Michigan, deren 7 Millionen Bände in sechs Jahren archiviert sein sollen. Ab dem heutigen Dienstag sollen die ersten etwa 10.000 eingescannten Bände online verfügbar sein. Gleichzeitig wird an den Beständen der Uni-Bibliotheken von Stanford (8 Millionen Titel), Harvard (Auswahl von 40.000 Titeln) und Oxford (vor 1900 veröffentlichte Bücher) sowie der New York Public Library (ausgewählte ältere Titel) gearbeitet. Die Bibliotheken stellen Google ihre Bücher im Austausch für die Scandateien zur Verfügung.

Suchtreffer, die in digitalisierten Büchern gefunden wurden, stellt Google getrennt von den Internetressourcen als Link auf den jeweiligen Textauszug dar. Bücher, die von den Verlegern dazu freigegeben worden sind oder deren Urheberrecht abgelaufen ist -- nach amerikanischem Recht bei Publikation vor 1923 -- sollen vollständig inklusive Abbildungen verfügbar sein, bei den übrigen Titeln zeigt die Suchmaschine Textauszüge oder nur die bibliographischen Informationen.

Dieses Projekt ähnelt nicht nur der Amazon-Technik "Look Inside the Book", sondern auch dem in Betaphase befindlichen Dienst Google Print, der sich durch eingeblendete Werbung auf den Buchseiten finanzieren soll.

Die meisten großen Bibliotheken haben selbst sporadisch ihre Bücher eingescannt, ohne jedoch Lizenzfragen zu klären. Einige Bibliotheken unter Führung der Library of Congress haben jedoch ebenfalls ehrgeizige Digitalisierungspläne; andere Projekte dieser Art sind das Internet Archive und die Digital Library der Universität von San Francisco. Das Google-Programm soll bis zu 5.000 Titel pro Tag digitalisieren.

Google verhandelt derzeit mit den großen Verlagen wegen der online angezeigten Textauszüge. Viele Verlage stehen dem Projekt interessiert gegenüber, nicht zuletzt wegen der positiven Erfahrungen mit dem Amazon-Dienst. Beobachter schätzen, dass das Projekt Jahrzehnte dauern und einen dreistelligen Millionenbetrag verschlingen wird.

Zu den Universitäten von Michigan und Stanford hat Google eine enge Beziehung: Google-Gründer Larry Page studierte in Michigan und lernte seinen Kompagnon Sergey Brin wenige Kilometer von der heutigen Google-Unternehmenszentrale in Stanford kennen -- bei einem Projekt über digitale Bibliotheken. (heb)