Semantischer Sinn für den Schreibtisch

Neue Web-Suchtechnologien sollen künftig dabei helfen, auch auf dem lokalen PC schnell an bislang schwer auffindbare Daten zu gelangen.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 4 Min.
Von
  • Erica Naone

Menschen gruppieren Informationen normalerweise nach Themen und merken sich dann Beziehungen zwischen Objekten – etwa den Zusammenhang zwischen einer Person und der Firma, für die sie arbeitet. Computern dieses Konzept ebenfalls beizubringen ist seit Jahren Gegenstand intensiver wissenschaftlicher Arbeit. In letzter Zeit konzentriert sich die Forschung dabei vor allem auf die Idee des "Semantic Web", der semantischen Aufbereitung von Internet-Angeboten, um beispielsweise Suchmaschinen zu verbessern. Ein europäisches Forschungsvorhaben versucht nun, diese Technologie auf den PC-Schreibtisch zu holen: Das so genannte Nepomuk-Projekt arbeitet am "Semantic Desktop".

Die Koordination hat das deutsche Forschungszentrum für künstliche Intelligenz (DFKI) übernommen. Die Projektteilnehmer arbeiten bereits seit drei Jahren an einer Software, die sinnvolle Verbindungen zwischen Dateien auf einem einzelnen Rechner aufspüren soll. Die dabei entstandene Technologie liegt inzwischen für verschiedene Plattformen vor und ist seit kurzem standardmäßig als Komponente in der Linux-Benutzeroberfläche KDE enthalten.

Die Semantic Desktop-Idee ist nicht neu. Die Nonprofit-Organisationen Open Source Applications Foundation sowie SRI arbeiteten bereits an ähnlichen Projekten. Viel kam dabei bislang allerdings nicht heraus. Das Problem: Es ist nach wie vor sehr schwer, gute semantische Informationen automatisch zu generieren. Damit die Technik funktioniert, müssen Nutzer Dateien und Dokumente häufig selbst entsprechend markieren. Fehlt es jedoch an praktischen Anwendungen für dieses "Tagging", sind Nutzer auch nur schlecht zu motivieren, die notwendigen Metadaten zu erstellen.

Nepomuk unterscheidet sich von früheren Ansätzen durch eine praxisnähere Vision, meint Ansgar Bernardi, stellvertretender Leiter des Forschungsbereiches Wissensmanagement am DFKI. Die Software ergänzt viele semantische Informationen bereits selbst und ermutigt den Nutzer, weitere Inhalte beizutragen, weil ihm das hilft, Dateien später wieder aufzufinden. Außerdem enthält das Werkzeug eine einfache Methode, bereits angelegte Informationen mit anderen Nutzern auszutauschen.

Die Software generiert semantische Informationen mit Hilfe eines Crawler-Programms, das den Rechner durchkämmt und dabei so viele Dateien wie möglich mit Zusatzinformationen versieht. Diese auch von Suchmaschinen bekannten Werkzeuge gehen beispielsweise das Adressbuch eines Nutzers durch und suchen nach Dateien, die mit den darin gefundenen Personen zusammenhängen könnten. Nepomuk kann dann eine Datei, die von einer bestimmten Person abgeschickt wurde, mit einer Firma korrelieren, für die sie arbeitet. Das mache aus Nepomuk ein besonders praktisches lokales Suchwerkzeug, meint Bernardi.

Die meisten Betriebssysteme lassen Nutzer ihren Rechner nur nach einfachen Schlüsselbegriffen durchsuchen. Nepomuk kann hingegen deutlich nützlichere Informationen aufdecken, in dem es sich auf die Verbindungen zwischen Daten konzentriert. Die Software lokalisiert also auch relevante Dateien, die die Schlüsselbegriffe, die für die Suche verwendet wurden, nicht enthalten. Eingebaut ist außerdem ein Peer-to-Peer-Datenaustauschsystem zum leichten Teilen von Dateien samt ihrer semantischen Anhängsel zwischen mehreren Nutzern.

"Das könnte der semantische Desktop sein, der tatsächlich überlebt", meint Nova Spivack, Chef und Gründer von Radar Networks, der mit Twine einen eigenen semantischen Lesezeichen- und Social-Networking-Dienst betreibt. Er sieht viel Potenzial in dem, was das Projekt bislang geleistet hat. "Darauf kann man aufbauen."

Andere Projekte, semantische Technologien auf den Desktop zu holen, hätten bislang beim Endanwender keinen Erfolg gehabt. "Nepomuk ist für echte Nutzer und Endwickler gedacht." Besonders der direkte Einbau in KDE sei wichtig, glaubt Spivack. "Die Oberfläche ist weit verbreitet und lässt sich von Programmierern leicht erweitern und modifizieren."

Obwohl die offizielle Förderung für Nepomuk Ende Dezember auslief, erwartet Bernardi weitere Entwicklungsschritte – dann als Open-Source-Software-Projekt. Eine Spinoff-Firma ist ebenfalls angedacht. Außerdem wurde mit der Open Semantic Collaboration Architecture Foundation eine Plattform geschaffen, die die zukünftige Arbeit an Nepomuk-Technologien koordinieren soll.

Die Software ist nicht nur für KDE erhältlich. Nutzer können die grundlegenden Werkzeuge auch für Windows, Macintosh und andere Linux-Oberflächen kostenlos herunterladen. Nepomuk lässt sich außerdem auch nur für bestimmte Daten einsetzen – beispielsweise nur für Web-Seiten, die man im Browser Firefox betrachtet hat. (bsc)