IBM-Ansatz für verteilte Datenbanken
Mit der heute vorgestellten Softwaretechnik pureScale will IBM Grids aus mittelgroßen DB2-Datenbanken auf die Performance und Robustheit von Mainframe-Engines aufrüsten.
Just vor dem Start der Oracle-Hausmesse Oracle World in San Francisco hat IBM mit pureScale eine neue Softwaretechnik vorgestellt, die DB2-Datenbankcluster zu Grids mit stark verbesserter Arbeitsgeschwindigkeit und geringeren Performance-Einbrüchen bei Hardware-Ausfällen zusammenfügt.
Der Trick bei der neuen Technik liegt im Einsatz verteilter Cache Facilities (CF), die jeweils einen eigenen Pool von Datenbank-Engines mit Locking-Informationen für deren Datenbestände versorgen. Dadurch will IBM aktuell bearbeitete Daten sperren oder bei Bedarf als unsauber markieren können, ohne die kompletten Inhalte erst mit hohem Zeitaufwand mehrfach übers Netzwerk transportieren zu müssen. Im Extremfall soll sich die Latenzzeit für so einen Vorgang von 80 Millisekunden auf 5 Mikrosekunden reduzieren.
Intelligente Load-Balancer sorgen laut Hersteller außerdem dafür, dass sich zusätzliche Datenbankknoten kurzfristig in das System eingliedern lassen und dass andererseits, wenn etwa ein Knoten planmäßig oder überraschend ausfällt, nur wenige Daten bis zur Ersatzmaßnahme blockiert bleiben. IBM proklamiert damit eine entscheidend verbesserte "Continuous Availability" und will diese in eigenen Versuchen mit bis zu 100 Engines auch schon dokumentiert haben.
Vorerst gibt es die pureScale-Datenbanksoftware allerdings nur mit maximal 2 CFs und zum Betrieb auf Rechnern von IBMs Power Series unter dem Betriebssystem AIX. Hinter vorgehaltener Hand war jedoch zu erfahren, die spezifischen Hardware-Anforderungen, etwa zur schnellen Anbindung der CFs, seien keine große Klippe. Damit dürfte auch einem Einsatz mit anderen Rechnern unter anderen Betriebssystemen wie etwa Linux wenig im Wege stehen. (hps)