Wikidata: Wikipedia bekommt Faktendatenbank

Wikimedia Deutschland will innerhalb eines Jahres eine Datenbank schaffen, die der Online-Enzyklopädie eine semantische Komponente verleiht.

In Pocket speichern vorlesen Druckansicht 134 Kommentare lesen
Lesezeit: 4 Min.
Von
  • Torsten Kleinz

Der Verein Wikimedia Deutschland hat mit dem Projekt Wikidata "die Zukunft der Wikipedia" eingeläutet. Innerhalb eines Jahres will der Verein eine Faktendatenbank schaffen, die der Online-Enzyklopädie eine semantische Komponente verleiht. "Wikidata ist das größte technische Projekt, das jemals eine der 40 Länderorganisationen der Wikimedia-Bewegung in Angriff genommen hat", erklärte Wikimedia Deutschland-Vorstand Pavel Richter in Berlin.

Pläne für eine semantische Erweiterung der Wikipedia gibt es schon seit Jahren, die Umsetzung in der Wikipedia ist jedoch sehr komplex. Der Verein hat deshalb zehn Mitarbeiter eingestellt, die das Projekt bis März 2013 vollenden sollen.

Mit der Datenbank soll es zum Beispiel möglich werden, eindeutige Fakten wie die Einwohnerzahl von Berlin oder Geodaten zentral zu verwalten. So sollen die über 200 verschiedenen Sprachversionen der Online-Enzyklopädie auf dem gleichen Stand gehalten werden. Die weniger aktiven Wikipedia-Versionen bekommen ein Faktengerüst, das den Autoren beim Aufbau der Enzyklopädie-Ausgaben hilft.

Wikidata soll aber nicht alleine die Wikipedia erweitern, sondern auch als eigenständiges Projekt entwickelt werden. So könnten die Fakten einerseits in Artikel eingebaut werden, andererseits aber auch in andere Projekte einfließen. Die Inhalte der Datenbank sollen unter einer freien Creative-Commons-Lizenz veröffentlicht werden.

Wikidata-Team will sich zunächst darauf konzentrieren, die Artikel zu gleichen Themen in den verschiedenen Sprachversionen zu verknüpfen. Bisher nutzen die Wikipedianer dazu Bots, die ständig den Datenbestand der Wikipedia-Ausgaben nach fehlenden Verknüpfungen durchsuchen und gegebenenfalls nachtragen. Mit Wikidata soll die kontrollintensive Arbeit der Vergangenheit angehören. Dann sollen die Autoren eigenständig weitere Verknüpfungen von Daten in Wikidata eingepflegen können. In einer dritten Phase soll Wikidata es mölgich machen, Listen und Grafiken automatisch zu erstellen – so könnte Wikidata die deutschen Städte nach Größe sortieren oder alle Bundestagsabgeordneten nach Parteigehörigkeit zuordnen.

Bisher werden solche Informationen allesamt manuell gesammelt. Auch die vielen Infokästen in den Artikeln werden von Autoren gepflegt. "Ein groß angelegter Import von Daten ist gar nicht unser Ziel. Stattdessen hoffen wir, organisch mit der Community zu wachsen", erklärt Projektleiter Denny Vrandečić gegenüber heise online. Alles Wissen der Wikipedia kann Wikidata aber nicht aufnehmen – zu vielfältig sind die Beziehungen, die in den 21 Millionen Artikeln weltweit festgehalten sind.

Wikipedia experimentiert schon lange mit der Verknüpfung der eigenen Datenbestände mit externen Datenquellen. So sind in der deutschen Ausgabe Links zu der Personennamendatei der Deutschen Nationalbibliothek enthalten. Daneben gibt es zum Beispiel eine Kooperation mit dem Projekt OpenStreetMap, um die Geoinformationen in der Wikipedia angemessen darstellen zu können. Mit Wikidata sollen solche Datenquellen einfacher verknüpft werden können.

Die Kosten von 1,3 Millionen Euro werden von privaten Sponsoren getragen. Die Hälfte des Geldes stammt vom Allen Institute for Artificial Intelligence. Das Institut wurde 2010 von Paul G. Allen, Mitgründer von Microsoft, ins Leben gerufen, um den Fortschritt auf dem Gebiet der Künstlichen Intelligenz zu beschleunigen. Je ein Viertel stammen von der Gordon and Betty Moore Foundation und von Google.

Das Projekt ist auch ein besonderer Erfolg für Wikimedia Deutschland. Auf der heute beginnenden Wikimedia Conference in Berlin debattieren Wikipedia-Aktivisten auf 40 Ländern die zukünftige Struktur der Wikimedia-Organisationen weltweit. Besonders in den vergangenen Monaten war es zu Spannungen zwischen verschiedenen Länderorganisationen und der Zentrale der Wikimedia Foundation in San Francisco gekommen. So gibt es Unstimmigkeiten, wie die Spendengelder verteilt werden sollen. In Berlin soll nun die Gründung eines Chapters Council auf den Weg gebracht werden, das die Interessen der Länderorganisationen auch gegenüber der Wikimedia Foundation vertreten soll. (anw)