Admin-Alltag: Lernen aus einem Beinahe-Desaster mit Ceph

Gut, wenn man größere Ausfälle ohne Datenverlust und Geschäftsunterbrechung übersteht. Es gilt: Je besser die Vorbereitung, desto kleiner das Desaster.

Artikel verschenken

7

(Bild: AdobeStock, Valentino Sani)

23.09.2021, 06:45 Uhr

Lesezeit: 17 Min.

iX Magazin

Von

Michael Prokop

Admin-Alltag: Lernen aus einem Beinahe-Desaster mit Ceph
Wiederherstellung
Der Ursache auf den Grund gehen
Workarounds für den XFS-Bug
Gewonnene Erkenntnisse
Vorbereitung ist das halbe Desaster-Handling

Artikel in iX 10/2021 lesen

An einem Freitagabend, im Wartungsfenster für die IT-Infrastruktur eines Kunden, stand das Upgrade eines Ceph-Clusters nach vorliegender Checkliste auf dem Plan. Das Test-Upgrade ebenso wie vergleichbare Upgrades bei anderen Kunden waren bereits mehrfach erfolgreich durchgelaufen. Aber an diesem Abend, auf diesem System lief nichts nach Plan: Von 36 Platten im Ceph-Cluster fielen 33 aus.

Das betroffene System ist ein hyperkonvergenter Cluster mit Proxmox Virtual Environment und Ceph, es kombiniert also Hypervisor und Software-defined Storage auf einem Cluster. Er besteht aus drei Debian-Servern, genannt server1, server2 und server3, die auf Proxmox VE v5 mit Debian 9 und Ceph Luminous v12.2.13 laufen. Jeder Knoten verfügt über 12 Festplatten für den Einsatz als Ceph-OSDs mit insgesamt 65 TByte.

Die Aktualisierung des Systems begann mit dem Upgrade von Proxmox VE v5/Debian 9 auf Proxmox VE v6/Debian 10. Dazu gehörte es, das für die Clusterkommunikation zuständige corosync von Version 2 auf 3 zu aktualisieren. Dieses Upgrade erforderte einige Konfigurationsänderungen, unter anderem die corosync-Konfiguration von ring0 und ring1 sowie die mon_host-Konfiguration von Ceph.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Bonusprogramme: So zahlt die Krankenkasse Ihre neue Apple Watch

Krankenkassen bezuschussen den neuen Fitnesstracker dank Bonusprogrammen. Was Versicherungen bieten – und welche Daten sie dafür von Ihnen wollen.

Commodore 64 Ultimate: Das Multitalent mit Hardware-Emulation im Test

Mit dem Commodore 64 Ultimate kehrt ein Klassiker zurück. Wir prüfen, ob die originalgetreue Hardware-Emulation des C64 mit modernen Extras überzeugen kann.

Smarte Thermostate mit Home Assistant ausreizen

Der kostenlose Home Assistant bringt smarten Thermostaten Dinge wie Heizpläne oder Abwesenheitserkennung bei, die sie nicht können oder die extra kosten.

Warum Microsoft Office für Anwender eigentlich nicht mehr tragbar ist

Gründe, Microsoft Office den Rücken zu kehren, gibt es mehr als genug. Der Schritt ist für manche größer als für andere, aber fast immer möglich.

Linux-Apps auf Android: So läuft Googles Linux-Terminal

Android 16 erlaubt es, Linux-Anwendungen zu starten. Dabei läuft nicht nur die Kommandozeile, auch grafische Anwendungen sind neuerdings möglich. So geht’s.

Boox Palma 2 Pro: E-Reader im Smartphone-Format im Test

Der Boox Palma 2 Pro ist ein E-Reader mit Smartphonequalitäten: Mit dem Stylus schreibt man auf farbigem E-Ink, er funkt im 5G-Netz und läuft mit Android.