Schöner lesen mit Google

Googles neues Suchfilter-Kriterium "Reading Level" trennt im Web nicht nur die Spreu vom Weizen. Es fördert auch jede Menge unterhaltsame Überraschungen zutage.

vorlesen Druckansicht 8 Kommentare lesen
Lesezeit: 3 Min.
Von
  • Niels Boeing

Für Sprachästheten ist das Web nicht selten ein Angriff auf die Geschmacksnerven. Grammatik ist nur noch eine Option, Satzbau der Phantasie überlassen, vom Vermächtnis der Literaturklassiker wenig zu spüren. Doch nun erscheint ein Licht am Ende des Tunnels: Die unermüdliche Innovationsmaschine Google hat in der "advanced search" der englischen Suchseite ein neues Filterkriterium "reading level" hinzugefügt, das Suchtreffer nach ihrem sprachlichen Niveau in "basic", "intermediate" und "advanced" einteilt.

Wie genau die Analyse funktioniert, verrät der Datenkonzern nicht. Google-Mitarbeiter Nundu erklärte im Hilfe-Forum "Web Search" nur, dass man zunächst Lehrer gebeten habe, verschiedene Texte im Web zu klassifizieren. Daraus wurde dann ein statistisches Modell erstellt. Damit "können wir die Wörter auf einer beliebigen Webseite mit den Wörtern im Modell vergleichen", so Nundu. Zusätzlich seien noch Analysen von Artikeln in Google Scholar hinzugenommen worden.

Eine besondere Gaudi ist der Vergleich einzelner Domains hinsichtlich ihrer Anteile von schlichten, mittleren und anspruchsvollen Inhalten. Für US-Medien hat dies z.B. Adrian Chen auf Gawker.com gemacht. Auch wenn Google den Leseniveau-Filter noch nicht explizit in der deutschen "erweiterten Suche" anbietet, kann die zugrundeliegende statistische Analyse doch hiesige Medienangebote verarbeiten. Das Ergebnis deckt sich etwa für www.bild.de, www.spiegel.de und www.faz.net mit den gängigen Klischees:

Drei deutsche Leitmedien im Vergleich.

Sucht man wie gewöhnlich nach einem bestimmten Begriff, unterscheiden sich die Treffer ganz ohne Filter sowie auf den drei Leseniveaus erheblich. Hier ist das Beispiel "Al Qaida":

Suchtreffer für "Al Qaida" ohne Leseniveau-Filter (links) und mit Leseniveau "basic" (rechts): Plötzlich ist da ganz viel Youtube.

Suchtreffer fĂĽr "Al Qaida" mit Filterniveau "intermediate" (links) und "advanced" (rechts).

Hübsch ist auch ein (vorläufiger) Sprachvergleich: Wie verteilen sich die Leseniveaus der Einträge zum Stichwort "Demokratie" auf deutschen, englischen und französischen Seiten? Sagen wir es so: Die deutschen Inhalte zielen stärker auf die "Mitte":

Deutsche, französische und englische Webinhalte zu "Demokratie" im Vergleich.

Mich interessierte auch, wie verschiedene Wikipedia-Ausgaben abschneiden – zunächst allgemein:

Leseniveau-Verteilung deutscher und englischer Wikipedia-Einträge im Vergleich.

Und hier für die Stichwörter "Computer" bzw. "Physik":

Das Leseniveau bei Wikipedia-Einträgen, die "Computer" oder "Politik" betreffen, steigt deutlich gegenüber dem allgemeinen Textniveau beider Wikipedia-Ausgaben an.

Dass diese beiden Themenauswertungen ein Übergewicht an anspruchsvollen Einträge zeigen, bestätigt mein Gefühl, dass in der Wikipedia manche Texte – gerade bei wissenschaftlichen oder technischen Themen – längst übers Ziel hinausgeschossen sind. Ohne Vorbildung sind diese Einträge beim ersten Lesen eigentlich kaum verständlich. Da kann man schon fast wieder ein Meyers Lexikon zurhand nehmen – und das war ja kaum Sinn der Sache.

Mit dem Reading-Level-Filter hat uns Google eine tolle Adventsüberraschung beschert. Er ist nicht nur ein unterhaltsames Werkzeug, sondern wirft auch so manche Frage auf: Wer definiert eigentlich wie verschiedene Leseniveaus? Wie anspruchsvoll sollten Texte in Online-Medien sein? Ist die Wikipedia am Ende elitär? Kann Youtube Al Qaida besser erklären als ein Fachaufsatz? Und sind Webseiten blöde, nur weil sie sich einfacher ausdrücken? Ich bin jedenfalls gespannt, was für Analysen hier in nächster Zeit noch zutage gefördert werden. (nbo)