Wikimedia baut Wikipedia-Datenbank

Der deutsche Trägerverein möchte die Speicherung von Daten in den verschiedenen Wikipedia-Sprachversionen zentralisieren. Das Projekt stößt bei der Community nicht nur auf Gegenliebe.

In Pocket speichern vorlesen Druckansicht 32 Kommentare lesen
Lesezeit: 3 Min.
Von
  • Torsten Kleinz

Die Online-Enzyklopädie Wikipedia soll einen zentralen Datenspeicher erhalten, der wesentliche enzyklopädische Fakten für alle Sprachversionen bereitstellt. Die Umsetzung von Wikidata hat der Verein Wikimedia Deutschland übernommen. Bisher ist das Erstellen von Artikeln in der Wikipedia noch überwiegend Handarbeit. Links auf andere Sprachversionen eines Artikels werden weitgehend manuell gesetzt. Auch die Einbindung von automatisch auswertbaren Personendaten müssen die freiwilligen Autoren in der für die Software MediaWiki geschaffenen Syntax einstellen – dabei bleiben diese Metadaten dem normalen Leser verborgen.

Es gibt schon seit Jahren Bemühungen, die Wikipedia-Software um semantische Bezüge zu erweitern und so Synergien zu schaffen. Bereits vor fünf Jahren wurde das Projekt Semantic MediaWiki gegründet, das Beziehungen zwischen verschiedenen Fakten maschinenlesbar dokumentieren und auswerten kann und in über 200 Wikis weltweit genutzt wird. Auch WikiData soll auf der Erweiterung beruhen. Daten wie die Einwohnerzahl von Berlin müssen bisher manuell in jede der über 200 Sprachversionen von Wikipedia eingetragen werden. Mit einer semantischen Komponente könnten solche Daten an einer zentralen Stelle eingetragen und aktualisiert werden, so dass sie nicht nur in verschiedenen Sprachversionen, sondern auch in verschiedenen Zusammenhängen eingebaut werden können.

WikiData würde ähnlich wie das Projekt Wikimedia Commons fungieren, das als zentrale Quelle für Multimedia-Dateien der Wikimedia-Projekte dient. Wikimedia Deutschland hat nun mit der Stellenausschreibung für das Projekt begonnen. Bis Ende 2012 sollen 100.000 Wikidata-Datensätze zumindest in einem Wikimedia-Projekt eingebunden sein. Im Wirtschaftsplan 2012 von Wikimedia Deutschland sind für das Projekt Mittel in Höhe von 870.000 Euro vorgesehen. Das Geld soll aber nicht aus Spendengeldern stammen, sondern von externen Partnern von Wikimedia getragen werden. So hatte die Wikimedia Foundation in der Vergangenheit mehrmals projektbezogene Großspenden erhalten. Gleichzeitig ist Wikimedia Partner bei dem europäischen Forschungsprojekt RENDER.

Neben der Synergien innerhalb der Plattform zielt das Projekt auch auf neue Formen der Weiternutzung der frei lizenzierten Inhalte von Wikipedia und seiner Schwesterprojekte. Verschiedene Initiativen experimentieren bereits mit der Einbindung verschiedener Datenquellen wie freigegebenen Bibliothekskatalogen. Über solche Mashups hoffen Aktivisten die freien Daten auch außerhalb von Wikimedia-Projekten nutzen zu können. Schon heute werden die in Wikipedia-Artikel integrierten Geodaten in Projekten wie OpenSeaMap benutzt, um Zusatzinformationen und Fotos in das Kartenmaterial zu integrieren.

Der Umbau der Wikipedia ist nicht unumstritten. So befürchten manche Autoren, dass durch die zentrale Datenressource auch der Einbau von Falschinformationen einerseits leichter werde, andererseits breite Teile der Autorenschaft ausgeschlossen werden, die sich nicht mit der Komplexität des neuen Systems befassen wollen. Automatisierte oder maschinelle Übersetzungen von Artikeltexten sind in der Wikipedia-Community wegen ihrer meist mangelhaften Qualität verpönt. (jh)