"Volltextsuche Online" mit Startproblemen

Ein Student hat Wege gefunden, wie sich die noch nicht öffentliche Suchmaschine des Digitalisierungsprojekts "Volltextsuche Online" zum Auslesen und Kopieren ganzer Bücher nutzen lässt. Die Projektverantwortlichen versprechen Nachbesserungen.

In Pocket speichern vorlesen Druckansicht 47 Kommentare lesen
Lesezeit: 3 Min.
Von
  • Torsten Kleinz

Eigentlich sollte das Projekt "Volltextsuche Online" des deutschen Buchhandels am heutigen Donnerstag in die nächste Phase gehen, doch nun wird das Projekt von einer Panne überschattet. Das Fachmagazin Buchreport berichtet, Bücher würden sich mit Hilfe der Suchmaschine komplett auslesen und kopieren lassen. Der Börsenverein des Buchhandels will von Sicherheitslücken allerdings nichts wissen: "Volltextsuche Online bietet maximale Sicherheit für die Verlage", sagt Ronald Schild, Geschäftsführer des Marketing- und Verlagsservice des Buchhandels (MVB).

Da die Suchmaschine noch im Beta-Betrieb ist, sollte sie noch nicht der Öffentlichkeit präsentiert werden. Der Frankfurter Student Mathias Schindler stieß jedoch auf der Webseite des Projekts auf die Zugangsdaten und dokumentierte seine Erkenntnisse in einem Blogbeitrag. Mit dem vom MVB gewählten System namens BookStore ist es den Nutzern möglich, nach bestimmten Wörtern zu suchen. Die Software zeigt als Ergebnis die komplette Buchseite in Form einer PNG-Datei an. Zwar bemühten sich die Programmierer das Abspeichern der Buchseite zu unterbinden, indem sie die Grafiken durch eine Dummy-Datei abdeckten – aber für moderne Browser sind solche Spielereien kein Hindernis: Bei Firefox kann man über die Seiteneigenschaften einfach die angezeigte Grafik abspeichern und sie mit einer Texterkennungssoftware wieder digitalisieren.

Auch ein zweiter Sicherheitsmechanismus erweist sich als offenbar wenig durchdacht. Hat sich der Nutzer fünf Seiten angesehen, kann er nicht weiterblättern, sondern wird zum Kaufen des Buchs aufgefordert. Doch wenn man von einem Suchergebnis auf der nächsten Seite ausgeht, kann man ohne Problem weiterlesen. Viel Schaden konnten die Lücken indes nicht anrichten: Noch war lediglich ein gutes Dutzend Bücher in die Online-Plattform importiert.

Auf Anfrage von heise online bedauerte der Börsenverein des Buchhandels die Panne: "Durch einen bedauerlichen Fehler sind die interne Nutzerkennung und das Passwort als berechtigter Zugriff kurzzeitig öffentlich geworden", hieß es in Frankfurt. Inzwischen seien personelle Konsequenzen gezogen, der Projektverantwortliche von seinen Aufgaben entbunden worden. Zudem soll nachgebessert werden. "Ein derartiger Zugang zu Texten ist im Normalbetrieb von VTO nicht möglich." Normalerweise werde der Verlag einen Text nur in begrenztem Umfang zugänglich machen und nicht in voller Länge wie in der Testphase. In der jetzigen Probephase soll die Sicherheit der Plattform mit Hilfe von Penetrationstests überprüft werden.

Die Zugangsdaten haben die Betreiber ebenfalls geändert, sodass sie nicht mehr für die Öffentlichkeit einsehbar sind. Die verwendete Software wird aber zum Beispiel auch auf den Webseiten des englischen MacMillan Publishing verwendet. Auch hier lassen sich mit Hilfe der Suchfunktion komplette Bücher auslesen und abspeichern.

Schon seit zwei Jahren arbeitet der Börsenverein des Deutschen Buchhandels an dem Projekt Volltextsuche Online, das in Konkurrenz zu Digitalisierungsprojekten von Amazon oder Google treten soll. Wann das Projekt für die Öffentlichkeit verfügbar sein wird, ist noch völlig unklar. In der Beta-Phase sollen zunächst Verlage Gelegenheit haben, das Projekt zu erkunden und eigene Inhalte einzureichen. In der nächsten Projektphase sollen dann Buchhändler Zugriff auf die Suchmaschine erhalten, um die Ergebnisse bei der Kundenberatung zu verwenden. (Torsten Kleinz) / (pmz)