Auf dem Weg zur allumfassenden Bibliothek

Googles Pläne, Millionen von Büchern zu digitalisieren, haben die Verlags- und Bibliothekswelt gehörig aufgewirbelt. Google-Konkurrent Yahoo steht nun an der Spitze eines alternativen Ansatzes zur Buch-Digitalisierung.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 9 Min.
Von
  • Wade Roush

Googles Pläne, Millionen von Büchern aus den bekanntesten Bibliotheken der Welt (darunter die Bodleian Library in Oxford und die New York Public Library) zu digitalisieren und sie dann per Web durchsuchbar zu machen, haben die Verlags- und Bibliothekswelt gehörig aufgewirbelt.

Viele Bibliothekare lobten Googles Vorhaben -- sie sehen den Plan als Möglichkeit, das menschliche Wissen endlich breit elektronisch verfügbar zu machen. Bei den Buchverlegern sahen die Reaktionen allerdings deutlich negativer aus -- auch deshalb, weil die Suchmaschine ankündigte, auch bei Büchern, die noch dem Urheberrecht unterliegen, vor Scan-Prozess und Katalogisierung nicht extra nachzufragen.

Der Google-Konkurrent Yahoo steht nun an der Spitze eines kollektiveren Ansatzes zur Digitalisierung -- als führendes Mitglied der so genannten "Open Content Alliance", die am 4. Oktober zusammen mit zehn Partnerorganisationen gegründet würde. Die Vereinigung plant ein freies, permanentes Online-Archiv mit breiten Print- und Multimedia-Inhalten. Ein Teil davon soll urheberrechtlich geschützt sein, der Rest lizenzfrei, also "public domain".

Die Partner von Yahoo sind Adobe, das Europäische Archiv, die Hewlett-Packard Labs, das Internet Archive, das Nationalarchiv des Vereinigten Königreiches, der Verlag O'Reilly, das Prelinger-Archiv und die Universitäten von Kalifornien und Toronto.

Im Gegensatz zum "Opt-Out"-Ansatz von Google, bei dem die Verlage explizit Einspruch gegen die Digitalisierung ihrer Werke erheben müssen, will die Open Content Alliance nur dann urheberrechtlich geschützte Werke aufnehmen, wenn die Verlage explizit zugestimmt haben, wie David Mandelbrot, Yahoos Vizepräsident für Suchtechnologie, sagt.

Mandelbrot betont, dass die Open Content Alliance auch für Konkurrenten wie Google offen steht, deren Bestände man zusätzlich aufnehmen könne. Die Organisation werde Standards für die Digitalisierung festsetzen. So soll es beispielsweise einfacher werden, die Ergebnisse verschiedener Digitalisierungsprojekte zusammenzubringen und sie mit Hilfe verschiedenster Suchmaschinen zugänglich zu machen. Im Interview mit Technology Review spricht Yahoo-Mann Mandelbrot über den Ansatz der Open Content Alliance.

Technology Review: Herr Mandelbrot, wie kam es zur Gründung der Open Content Alliance?

David Mandelbrot: Wir haben im März letzten Jahres damit begonnen, uns um Partnerschaften mit Rechteinhabern zu bemühen. Wir wollten mehr tun, als nur das Web zu crawlen und die Qualität der Yahoo-Suche verbessern. Wenig später traten wir mit den Leuten vom Internet Archive in Verbindung, die bereits heute schon im Bereich der Digitalisierung Großartiges leisten. In ihrem Archiv stecken schon jetzt viele großartige Werke, die wir gerne in unsere Suchmaschine integrieren würden.

In Laufe der Diskussion konzentrierte sich Internet-Archive-Gründer Brewster Kahle immer mehr darauf, was wir gemeinsam tun könnten, um selbst Inhalte zu digitalisieren. Das Internet Archive hat eine großartige Scanning-Methode entwickelt und kann Bücher gut digitalisieren. Was ihnen jedoch fehlte, waren Partner, die zu mehr Publicity führen und so mehr Spendengelder einwerben konnten. Aus diesen Diskussionen entstand dann die Idee für die Open Content Alliance.

TR: Welche Ziele hat die Allianz? Wie unterscheidet sich Ihr Ansatz von dem von Konkurrenten wie Google, große Mengen nichtdigitaler Inhalte ins Netz zu bringen?

Mandelbrot: Google startete sein Projekt, während wir noch über unseren Ansatz diskutierten. Wir haben uns also angeschaut, was Google macht und für uns herausgefunden, was wir anders machen können. Wir wollen beispielsweise urheberrechtlich geschützte Werke aufnehmen -- aber nur dann, wenn wir ein explizites Einverständnis der Rechteinhaber haben.

Zweitens soll sich bei der Open Content Alliance alles auf das Thema "Offenheit" konzentrieren. Andere Digitalisierungsprojekte setzen auf proprietäre Technologien, um die Inhalte vorzuhalten, so dass sie von Drittanbieter-Suchmaschinen nicht gecrawlt werden können. Deshalb setzen wir auf die Formate XML und PDF, damit die Inhalte auch von anderen Firmen durchsucht werden können. Diese Offenheit ist wichtig, damit die Organisationen, von denen die Inhalte kommen, wissen, dass das Projekt nicht nur einer Suchmaschine nützt.

TR: Konnte die Open Content Alliance also direkt von den Reaktionen lernen, die Googles Projekt in der Verlagswelt hervorrief?

Mandelbrot: Ehrlich gesagt dachten wir immer, dass man vor der Digitalisierung die Rechteinhaber um ihre Erlaubnis bitten muss. Uns hat überrascht, dass andere Programme das anders handhaben, also geschützte Werke ohne dieses Einverständnis anbieten wollten.

TR: Sobald man sich entscheidet, für jedes urheberrechtlich geschützte Werk erst einmal eine Genehmigung einzuholen, reduziert sich die Anzahl digitalisierbarer Inhalte jedoch drastisch. Hier geht es ja schließlich grundsätzlich um alles, was seit 1923 veröffentlicht wurde. Soviel muss man Google schon zugestehen.

Mandelbaum: Wir kommen aber bereits sehr gut voran, wenn wir nur die lizenzfreien Werke digitalisieren. Werke von Edgar Allan Poe oder Henry James können beispielsweise vollständig verfügbar gemacht werden. Außerdem sind wir über die ersten Rückmeldungen, die wir von den großen Verlegervereinigungen und den Verlagen selbst bekommen haben, äußerst erfreut. Viele sind interessiert daran, mit uns an diesem Vorhaben zu arbeiten. Natürlich müssen erst Verträge geschlossen werden, aber wir denken, dass wir viele urheberrechtlich geschützte Werke online bringen können.

TR: Das wäre auch meine nächste Frage gewesen - glauben Sie, dass die Open Content Alliance für die Verlage genießbarer ist als Googles Vorhaben?

Mandelbaum: Wenn es um Digitalisierungsprojekte geht, sprechen die Verlage derzeit vor allem über die Verlegerorganisationen mit den Suchmaschinen, weil sie fürchten, dass sich die Suchmaschinen sonst individuell an ihnen "rächen" könnten, sollten sie sich kritisch gegenüber bestimmten Projekten zeigen.

Nachdem, was wir bislang von den Verlegervereinigungen gehört haben, sind diese jedoch sehr erfreut über unseren Ansatz. Die Association of Learned Professional Society Publishers reagierte beispielsweise sehr positiv auf unser Programm, weil wir vorab mit den Rechteinhabern zusammenarbeiten wollen.

TR: All diese Digitailisierungsprojekte, Ihres, das von Google sowie weitere an den Universitäten und bei der Library of Congress, bringen den alten Traum des Internet Archive-Gründers Brewster Kahle voran, eine allumfassende Online-Bibliothek zu schaffen. Das Grundproblem wird dabei allerdings jeweils anders angegangen. Fürchten Sie, dass die Weltliteratur letztlich fragmentiert werden könnte, Web-Benutzer also zwischen den jeweils "allumfassenden" Bibliotheken der Open Content Alliance und der von Google wählen müssen?

Mandelbaum: Wir ermuntern andere Organisationen, die sich um die Digitalisierung bemühen, bei der Open Content Alliance mitzumachen. Es gibt bereits Vorgespräche mit Google über eine Teilnahme und wir fordern andere Suchmaschinen auf, ihre Bestände mit uns zu teilen. Wir sehen uns nicht als konkurrierenden Anbieter, sondern wollen gemeinsame Standards etablieren, über die man Inhalte teilen kann.

TR: Das zeugt von Bürgersinn. Aber was hat Yahoo selbst davon?

Mandelbaum: Unser Ziel bei Yahoo ist es, den Leuten zu helfen, alles menschliche Wissen zu finden, zu nutzen, zu teilen und zu erweitern. Die Open Content Alliance ist Teil dieser Bemühungen. In unserem Mediengeschäft machen wir im Grunde das gleiche. Dazu gehören Projekte, den Menschen Inhalte direkt anzubieten, etwa mit Yahoo Music. Die Erweiterung menschlichen Wissens im Netz nutzt Yahoo und anderen Suchmaschinen schließlich, weil es das Bedürfnis gibt, diese Inhalte zu finden.

Daneben wird Yahoo die Suchtechnologie stellen, die man verwendet, um die Inhalte auf der Open Content Alliance-Website zu durchsuchen. All diese Inhalte wird man auch von Yahoo aus durchsuchen können.

TR: Was begeistert Sie persönlich an dem Projekt? Sind Sie insgeheim ein Bücherwurm?

Mandelbaum: Das bin ich. Als ich ein Kind war, musste ich auf meinem Nachhauseweg von der Schule immer an der örtlichen Bücherei in einen anderen Bus umsteigen, der erst eine Dreiviertelstunde später abfuhr. Ich verbrachte also jeden Tag 45 Minuten in der Bücherei und schaute mir an, was es dort gab. Aus diesen 45 Minuten wurden oft eine Stunde und 45 Minuten, manchmal auch zwei Stunden und 45 Minuten.

Besonders spannend an dieser neuen Mission finde ich, dass wir hier die Möglichkeit haben, all diese großartigen Werke in ein digitalisiertes Format zu bringen. Liegen sie so erst einmal vor, lassen sich alle Vorteile digitaler Inhalte nutzen -- sie sind 24 Stunden am Tag und überall auf dem Planeten nutzbar. Wir können wesentlich mehr Inhalte unterbringen als dies in einer physischen Bibliothek möglich wäre. Wir können außerdem mehr als nur Literatur online stellen, wie das auch bei immer mehr Bibliotheken der Fall ist, die ebenfalls Audio- und Video-Inhalte vorhalten. Es macht mir viel Freude, an einer Allianz teilzuhaben, die eine derart großartige Bibliothek ins Internet bringen wird.

Die Fragen stellte Wade Roush; Übersetzung: Ben Schwan. (wst)