Kachelmann 2.0

Schottische Wissenschaftler haben eine Software geschaffen, die aus numerischen Daten eine umganssprachlich formulierte Wettervorhersage macht.

vorlesen Druckansicht
Lesezeit: 3 Min.

Wer hat Angst vor Schmetterlingen? Die Chaostheorie -- der sprichwörtliche Flügelschlag des Schmetterlings, der einen Wirbelsturm auslöst -- hat in den achtziger Jahren die Grenzen der Wettervorhersage auf maximal fünf Tage vorhergesagt. Die Vorhersage hat sich als falsch erwiesen. Mittlerweile rechnen die Experten locker Vorhersagen von acht Tagen und mehr.

Dabei nutzen sie die Statistik verschiedener numerischer Wettervorhersage-Modelle, wobei beispielsweise in der "Model Output Statistics" (MOS) der statistische Zusammenhang zwischen Prognose und Modell analysiert wird. Für heutige MOS ist es Standard, die Lufttemperatur 36 Stunden im Voraus auf weniger als ein Grad Celsius genau zu treffen. Mit Hilfe der Statistik spezieller Ensemblesimulationen -- dabei rechnet man in jedem Lauf mit leicht veränderten Ausgangswerten -- lässt sich der wahrscheinlichste Wetterverlauf über Monate hinweg berechnen.

Bei jeder Wettervorhersage ist jedoch neben allem technischen Fortschritt auch immer noch ein gutes StĂĽck Expertenwissen und Erfahrung im Spiel. Die Meteorologen kombinieren und extrapolieren die Werte verschiedener numerischer Modelle, um schlieĂźlich eine Vorhersage zu generieren. Und die Kunst liegt nicht allein in der richtigen Interpretation der Daten. Ehud Reiter und seine Kollegen von der University of Aberdeen haben mit SUM-TIME MOUSAM jetzt eine Software geschaffen, die aus dem Wust der Daten eine brauchbare Wettervorhersage im Textformat macht. Zwar gab es schon frĂĽhere Versuche dazu, diese jedoch hatten die Vieldeutigkeit der menschlichen Sprache nicht berĂĽcksichtigt.

Reiter und Kollegen analysierten den Sprachgebrauch in Wettervorhersagen und leiteten daraus Regeln ab, um die vieldeutigen Begriffe, die menschliche Sprecher normalerweise verwenden, durch eindeutige Begrifflichkeiten zu ersetzen. Die Wissenschaftler berschreiben die Software in einem Aufsatz fĂĽr die Fachzeitschrift Artificial Intelligence (Preprint-PDF, Choosing Words in Computer-Generated Weather Forecasts).

Wie viele NLG-Systeme (Natural Language Generation) arbeitet auch dieses in drei Stufen: Document Planning entscheidet, welche Daten so relevant sind, dass sie im Text vorkommen sollten und legt ein Schema des zu generierenden Textes an. Microplanning berechnet, wie die Information über die Sätze zu verteilen ist und welche sprachlichen Ausdrücke lexikalisch angemessen sind. Die Surface Generation generiert daraus einen Text in der Grammatik der Zielsprache. Die Software wird laut Reiter mittlerweile tatsächlich im Produktionsbetrieb von einer Firma benutzt, die zweimal täglich Wettervorhersagen für Ölförderungs-Plattformen in der Nordsee erstellt. In einer User-Studie konnten die Wissenschaftler zeigen, dass die von der Software generierten Vorhersagen wegen ihrer größeren Konsistenz menschlichen Texten sogar vorgezogen wurden.

Von Wolfgang Stieler (wst)