Buchhandelsprojekt "Volltextsuche online" erlaubte versehentlich Einblicke

Eine neuerliche Fehlkonfiguration des Testservers erlaubte für kurze Zeit Einblick in den aktuellen Stand: 926 Titel waren einseh- und durchsuchbar. Auch der komplette Download ganzer Titel war weiterhin möglich.

In Pocket speichern vorlesen Druckansicht 22 Kommentare lesen
Lesezeit: 5 Min.
Von
  • Mathias Schindler

Im Jahr drei nach dem Start der Buch-Digitalisierungsprojekte von Amazon und von Google arbeitet der Börsenverein des Deutschen Buchhandels weiterhin mit "Volltextsuche Online" (VTO) an dem Aufbau einer eigenen Lösung für die Recherche in gedruckten Werken. Technischer Partner ist hier die Holtzbrinck-Tochter hvg und die von MPS Technologies in Delhi lizenzierte Software BookStore. Im Gegensatz zu den Angeboten aus Mountain View und Seattle sind es bei VTO die Verlage, die für die Einstellung der Titel und den Betrieb der Plattform zahlen sollen, eine kostenpflichtige Lizenzierung an Buchhändler ist im Gespräch.

Nachdem bereits im Februar 2007 die Veröffentlichung der Zugangsdaten zu VTO einen frühen Einblick erlaubte, nähert sich das Projekt mit langsamen Schritten dem Normalbetrieb. Unter beta.volltextsuche-online.de finden teilnehmende Verlage derzeit das Frontend, das später für Buchinteressierte die Suchergebnisse darstellen soll. Normalerweise benötigte man ein Kennwort für diese Seite. Unter bestimmten Voraussetzungen erfolgte jedoch eine automatische Anmeldung ohne Passwortabfrage. Einmal im Besitz einer gültigen Session-ID in Cookie-Form, blieben die Tore für den interessierten Leser offen; neue Session-IDs ohne Passwordabfrage lieferte der Aufruf von http://beta.volltextsuche-online.de/BookStore/signInHome.do;jsessionid=(Beliebiger-Text).node8. Nach einem Hinweis von heise online schloss der Betreiber den Server wieder.

926 Titel von 60 Verlagen waren zum Freitag im System recherchierbar, weitere 20 Verlage ohne eigene freigegebene Titel listete die Suchfunktion auf. Größter Datenlieferant war bislang der Campus Verlag mit 103 Titeln sowie der auf Rechts- und Wirtschaftsthemen spezialisierte Verlag Erich Schmidt mit 100 Titeln. Der mit Abstand auflagenstärkste Titel stammt aus dem Herder-Verlag, zu dessen Autoren Papst Benedikt XVI. mit "Jesus von Nazareth" gehört.

Wie schon im Februar ist in VTO die rechte Maustaste durch eine JavaScript-Anweisung deaktiviert. Über der eigentlichen Bilddatei der Seite liegt ein transparentes Pixel. Handelsübliche Browser wie beispielsweise der Mozilla Firefox sind problemlos in der Lage, die Bilddateien einzeln in einer vergleichsweise hohen Auflösung von knapp 900 × 1350 Pixeln abzuspeichern, eine Weiterbearbeitung in OCR-Programmen ist damit möglich. Begrenzender Faktor beim Kopieren ganzer Bücher ist daher nur die vergleichsweise schleppende Performance des Testservers.

Eine Bestätigung dieser Funde beim Börsenverein war nicht vollständig möglich. VTO-Pressesprecherin Andrea Gerster hält die Anzahl der auffindbaren Titel im Beta-Frontend für nicht aussagekräftig, sie variiere ständig. Auch an der Zahl von 210 teilnehmenden Verlage halte man fest, sie beziehe sich auf die unterschriebenen Nutzungsverträge. Ein Großteil dieser Verlage habe bereits Buchdaten zur Konvertierung eingereicht. Derzeit seien mehr als 7000 Titel hochgeladen beziehungsweise in der Konvertierung oder in den vorgesehen Schritten zur Freigabe. Gottfried Honnefelder, Vorsteher des Börsenvereins, griff hingegen in seiner Eröffnungsrede zu den Buchhändlertagen im Juni angesichts des schleppenden Aufbaus von VTO auf ein Jesus Christus zugeschriebenes Gleichnis zurück, in der ein König zur Hochzeit seines Sohnes rufen lässt, die Eingeladenen jedoch weiter ihrer Arbeit nachgehen.

Nicht bereit sind derzeit sowohl der Scandienst, um Verlegern ohne digitale Vorlage und eigene Möglichkeiten der Digitalisierung eine Teilnahme an VTO zu ermöglichen, als auch das größte angepriesene Alleinstellungsmerkmal gegenüber der Konkurrenz von Google und Amazon: Der sogenannte "privilegierte Zugang" soll Buchhändlern umfassendere Möglichkeiten der Recherche und geringere Restriktionen bei der Anzeige von Buchseiten erlauben. Nach Auskunft von Ronald Schild, Geschäftsführer der VTO-Betreibergesellschaft und Börsenvereins-Tochter MVB, sind bisher zentrale Fragen der Authentifizierung ungeklärt. Es werde auch keine Voreinstellungen geben, nach denen Buchhändler Zugriff auf alle Inhalte bekämen, sollte der jeweilige Verleger keine dezidierten Angaben gemacht haben. Am Montagnachmittag bestätigte Schild im VTO-Blog die Probleme bei der Rechnerkonfiguration.

Ende Juli hatte die MVB, die ebenfalls das für den Buchhandel zentrale Verzeichnis lieferbarer Bücher (VLB) verwaltet, eine Zusammenlegung von VLB und VTO angekündigt. Statt 1,30 Euro jährlich für die Listung eines Titels hat ein Verlag in Zukunft 3 Euro zu zahlen. Darin enthalten ist die ehemals auf 17 Euro festgesetzte Jahresgebühr für VTO. Das VLB enthält derzeit nach MVB-Angaben über eine Million Datensätze. Bis Ende 2007 will die MVB kostenlos Konvertierungen von Buchtiteln von PDF in das VTO-interne Dateiformat übernehmen, Preise für die Konvertierung ab 2008 sind noch nicht bekannt. Auswirkungen dieser Änderung im Tarifmodell auf die Akzeptanz von VTO sind noch nicht zu spüren: "200 teilnehmenden Verlagen mit mehr als 7000" Titeln Anfang Juli stehen "rund 210 Verlage mit mehr als 7000 Titeln" Anfang September gegenüber. Kurt Hammes, Leiter der Abteilung Elektronisches Publizieren bei der MVB, nannte im Juni 2006 laut Süddeutscher Zeitung die Zahl von mindestens 100.000 Titeln, damit sich das Projekt "aus kaufmännischer Sicht lohne". (Mathias Schindler) / (anw)