Datenberge
Ordnung im Chaos: Was die Mathematiker schon lange argwöhnen, hilft das Internet, in die Tat umzusetzen. Jede Menge Werkzeuge bieten Unterstützung beim systematischen Speichern und Abrufen von Daten.
- Torsten Beyer
- Kersten Auel
Da kommt der Kollege zur Tür reingeschneit und fragt: Sag mal, kennst Du dieses neue Produkt MegaFooBar? Na klar kenne ich das. Erst kürzlich stand irgendwo ein Artikel dazu. Bloß wo? War es in comp.infosystems.MegaFooBar? In der iX? In der Mehlbox um die Ecke? Mist, vergessen. Irgendwo hatte ich doch auch die Adresse von dem verfl... System gespeichert. Irgendwo in den 42 Verzeichnissen, die die oberste Ebene meines Home Directory ausmachen. Beim Suchen fällt mir auch wieder der griesgrämige Blick unseres Systemadministrators ein, der letztens beim Mittagessen in meine Richtung noch etwas von Jäger und Sammler und 4 GByte Home-Verzeichnissen gemurmelt hat.
Wem das bekannt vorkommt, der ist reif für Ordnung oder genauer: Archivieren mit PD-Tools. Die einfachste Methode, unter Unix eine Datenbank (Datenbankexperten, bitte nicht schlagen.) aufzubauen, ist DBM beziehungsweise NDBM. Die DBM-Bibliothek ist bei fast allen UNIXen mit dabei und bietet die Möglichkeit, über eine Indexdatei sequentiell auf in einer zweiten Datei gespeicherte Datensätze zuzugreifen. Eine sehr gute PD-Version bieten die GNUler mit GDBM (ftp://ftp.Germany.EU.Net/pub/packages/gnu/gdbm-1.7.3.tar.gz - nicht mehr erreichbar, 29.05.01). In Deutschland gibt es die zum Beispiel bei EUnet (http://www.Germany.EU.Net). Wer sich das Leben erleichtern will, dem sei DBE (ftp://ftp.Germany.EU.Net/pub/comp/applications/database/dbe) empfohlen. Damit kann man NDBM-Datenbanken anlegen, ändern oder einfach nur in ihnen suchen. Verfügbar ebenfalls bei obigem FTP- Server.
Will man noch mehr, ist vielleicht /pub/unix/databases/relational/:Postgres die richtige Antwort. Von dieser relationalen Datenbank gibt es gleich zwei Varianten. Die letzte offizielle Version der Uni Berkeley trägt den Namen postgres-4r, die neue Version heißt postgres95. Für die alte Ausgabe gibt es eine Unzahl von Applikationen, unter anderem ein 4GL Frontend, das auf den Namen Onyx hört. Das alles und noch viel mehr ist zu haben im Netzwerk der schwedischen Universitäten.
Leichtgewichtiges SQL-Subset
Ursprünglich entwickelt als Backend für das Minerva Network Management Environment, das Postgres als Datenbasis nutzt, ist Mini SQL (mSQL) mittlerweile ein eigenständiges Produkt, das mit wenig Speicheranforderungen einen schnellen Zugriff auf gespeicherte Daten gestattet. Die aktuelle Version 1. 0.7 findet sich in Australien auf dem FTP-Server der Bond University.
Das eingangs geschilderte Problem läßt sich zwar mit den genannten Programmen ganz gut in den Griff bekommen. Einfacher geht's jedoch mit einer Literaturdatenbank wie refdbms. Meine Version trägt den Namen '15th revision of the alpha release of Refdbms version 3'. Für eine Alpha-Version lä uft die Software ganz ordentlich - unter anderem auf Suns und HPs. refdbms erlaubt die Verteilung von Literaturdaten auf beliebig viele Datenbanken im Netz. Dabei unterscheidet dieses Werkzeug mehrere Ansätze. Man kann eine Referenzdatenbank auf mehrere Systeme verteilen, Updates werden jeweils auf alle beteiligten Rechner propagiert. Alternativ kann man mehrere unterschiedliche Datenbanken benutzen - etwa eine institutsweite, eine abteilungsweite, eine private und so weiter. Für die Suche kann refdbms mitgeteilt werden, in welcher Reihenfolge die unterschiedlichen DBs zu durchsuchen sind.
Wer schon mit bibtex oder refer Literaturdatenbanken aufgebaut hat, wird sich darüber freuen, daß diese Daten in refdbms importierbar sind. Neben dieser fantastischen Funktionsfülle glänzt refdbms durch unterschiedliche - auch grafische - Frontends sowie einen experimentellen Gateway zum World Wide Web. Das Original gibt es bei der University of California in Santa Cruz.
Für einfachere Ansprüche sind vielleicht Adreßbücher das richtige. Diese kleinen Helfer gibt es in Hülle und Fülle. Die sicher bekanntesten entstammen der Familie der Rolodexe. Rolodex ist der Name eines physikalisch real existierenden Adreßbuches in Form einer drehbaren Achse (vermutlich sind alle Achsen drehbar, aber so ist es denn doch deutlicher) und einer patentierten Halterung für Visitenkarten beziehungsweise leere, vom Anwender mit Inhalt zu füllende Kärtchen. Das ganze ist alphabetisch sortiert. Die elektronischen Pendants hören auf so ungewöhnliche Namen wie rolodex, xrolodex oder xmrolodex (neuerdings XmAdressBook - nicht mehr erreichbar, 29.05.01 Beziehbar beispielsweise vom Dortmunder Server des EUnet (http://www.Germany.EU.Net). Viel Spaß beim Ordnen ... (ka)