RAID
Was ist RAID?
RAID: Mehr als nur eine Festplatte
Stell dir vor, du hast eine große Bibliothek mit wertvollen Büchern. Anstatt alle Bücher in einem einzigen Regal zu lagern, verteilst du sie auf mehrere Regale. Wenn ein Regal zusammenbricht, bleiben die anderen Bücher sicher. RAID (Redundant Array of Independent Disks) funktioniert ähnlich und kombiniert mehrere Festplatten zu einem einzigen logischen Laufwerk, um die Leistung zu erhöhen und/oder die Ausfallsicherheit zu verbessern.
Hardware vs. Software RAID
RAID kann auf zwei grundlegende Arten umgesetzt werden: hardwarebasiert oder softwarebasiert. Ein Hardware-RAID wird von einem speziellen RAID-Controller verwaltet, der oft als Steckkarte oder direkt auf dem Mainboard integriert ist. Diese Variante entlastet die CPU und bietet in der Regel hohe Zuverlässigkeit sowie Leistung – beispielsweise für Datenbankserver oder andere Systeme mit hohem Durchsatzbedarf. Ein Software-RAID wird hingegen vom Betriebssystem verwaltet und benötigt keine zusätzliche Hardware. Diese Lösung ist flexibler und meist kostengünstiger, erfordert aber mehr CPU-Ressourcen.
Wie funktioniert RAID?
Striping: Daten aufteilen (RAID 0)
RAID 0 verwendet sogenanntes Striping, bei dem die zu speichernden Daten in gleich große Blöcke (typischerweise 64 KB bis 256 KB) aufgeteilt werden. Diese Blöcke werden abwechselnd auf mehrere Festplatten geschrieben, sodass jeder Lese- und Schreibzugriff auf mehrere Laufwerke verteilt ist. Eine hundert Megabyte große Videodatei wird beispielsweise in 64-KB-Blöcke zerlegt. Der erste Block wird auf die erste Festplatte geschrieben, der zweite auf die zweite Festplatte und so weiter. Das erhöht den Datendurchsatz, weil die Festplatten parallel arbeiten können. Stell dir das wie ein Buch vor, bei dem jedes Kapitel auf einen anderen Schreibtisch gelegt wird: Mehrere Personen könnten die verschiedenen Kapitel gleichzeitig durchlesen oder bearbeiten, was die Geschwindigkeit deutlich steigert. Der Ausfall einer einzelnen Festplatte führt jedoch zum Verlust von Daten, da keinerlei Redundanz vorhanden ist. RAID 0 eignet sich daher vor allem für temporäre Daten wie bei Videoschnitt-Projekten, bei denen Geschwindigkeit wichtiger ist als Datensicherheit.
Mirroring: Daten spiegeln (RAID 1)
RAID 1 erstellt exakte Kopien der Daten auf mindestens zwei Festplatten („Mirroring“). Man kann sich das wie einen Kopierer vorstellen: Alle Informationen werden parallel auf jede Festplatte geschrieben. Stell dir vor, du machst von jedem deiner Bücher eine Kopie und legst sie in ein anderes Regal. Wenn ein Regal zusammenbricht (Festplatte ausfällt), hast du immer noch mindestens eine vollständige Kopie. RAID 1 bietet somit hohe Ausfallsicherheit, da die Daten stets doppelt (oder sogar mehrfach) vorhanden sind. Der Preis dafür ist ein höherer Platzbedarf, da jede Festplatte nur Kopien der gleichen Daten enthält. RAID 1 wird häufig in Systemen eingesetzt, bei denen Verfügbarkeit und Datensicherheit sehr wichtig sind (z. B. bei Datenbanken).
Parität: Daten wiederherstellen (RAID 5 und 6)
RAID 5 und RAID 6 speichern zusätzliche Informationen (Paritätsbits), damit Daten bei Ausfall einer (RAID 5) bzw. zweier (RAID 6) Festplatten rekonstruieren werden können. Stell dir vor, du hast drei Zahlen: 3, 5 und 7. Die Parität ist hier z. B. 15. Sollte eine Zahl verloren gehen, kann sie durch die verbleibenden Zahlen und die Parität rekonstruiert werden. Die Paritätsinformationen sind auf alle Festplatten verteilt. So lässt sich bei einer ausgefallenen Platte die fehlende Information aus den verbliebenen Daten rekonstruieren. Das Schreiben ist etwas langsamer, da die Paritätsdaten jeweils berechnet und gespeichert werden müssen. RAID 5 und 6 eignen sich für Anwendungen, die neben Ausfallsicherheit und Leistung auch eine effiziente Speichernutzung erfordern, etwa bei File- oder Webservern.
Wie sichert man RAID zusätzlich ab?
Hot-Spare: Die Reservefestplatte
Ein Hot-Spare ist eine zusätzliche Festplatte, die inaktiv bleibt und bei Ausfall einer aktiven Festplatte automatisch deren Rolle übernimmt. Das System beginnt sofort mit der Rekonstruktion der Daten. Dieser Prozess dauert je nach Festplattengröße mehrere Stunden, während denen das System aber voll funktionsfähig bleibt. Die ausgefallene Festplatte kann später während des laufenden Betriebs ausgetauscht werden. Hot-Spares verursachen zusätzliche Kosten und Stromverbrauch, minimieren aber die Zeit, in der das RAID-System ohne Redundanz läuft.
RAID 10: Striping + Mirroring
RAID 10 (auch RAID 1+0) kombiniert die Konzepte von RAID 1 (Mirroring) und RAID 0 (Striping) in einer hierarchischen Struktur. Man teilt die Festplatten in Paare auf, die jeweils gespiegelt sind (RAID 1), und verteilt die Daten zusätzlich im Verbund über Striping (RAID 0). Beispiel: Ein System mit vier Festplatten wird zunächst in zwei RAID-1-Paare aufgeteilt. Diese gespiegelten Paare werden dann per Striping (RAID 0) verbunden. Innerhalb jeder RAID-1-Gruppe können Festplatten nacheinander ausfallen, solange mindestens eine funktionsfähig bleibt. Parallel verteilt das RAID-0-Verfahren alle Lese- und Schreibprozesse gleichmäßig auf die Spiegelgruppen. Diese Kombination ermöglicht hohe Leistung und robusten Schutz vor Ausfällen, erfordert jedoch eine vergleichsweise große Anzahl an Festplatten.
RAID 50 und RAID 60: Mehrstufige Parität
RAID 50 fasst mehrere RAID-5-Gruppen zu einem RAID-0-Verbund zusammen. Bei RAID 60 wird dasselbe Prinzip mit RAID-6-Gruppen angewendet. Auf diese Weise entsteht eine Kombination aus Parität und Striping. Fällt in einer Untergruppe eine (RAID 50) oder sogar zwei Festplatten (RAID 60) aus, können die Daten trotzdem rekonstruiert werden. Dieser Ansatz wird meist in großen Speichersystemen eingesetzt, in denen hohe Ausfallsicherheit und Speichereffizienz gefragt sind, zum Beispiel in Rechenzentren.
Lernziele
- die Implementierung von RAID veranschaulichen, indem die Unterschiede zwischen hardwarebasierten und softwarebasierten RAID-Lösungen sowie deren Vor- und Nachteile in Bezug auf Leistung, Kosten und Flexibilität anhand praxisnaher Einsatzszenarien (z. B. Webserver vs. Datenbankserver) dargestellt werden.
- die typischen RAID-Level (0, 1, 5, 6, 10, 50, 60) erklären, indem ihre Funktionsweisen (Striping, Mirroring, Parität), Auswirkungen auf Nettospeicherkapazität, Ausfallsicherheit (Worst-Case, Best-Case) und Performanz sowie typische Anwendungsszenarien beschrieben werden.
- das Konzept von RAID (Redundant Array of Independent Disks) zusammenzufassen, indem die grundlegende Idee der Kombination mehrerer physischer Festplatten zu einem logischen Laufwerk zum Erhöhen von Leistung und/oder Ausfallsicherheit beschrieben wird.
- die Verwendung von Hot-Spare-Laufwerken veranschaulichen, indem die Funktionsweise und die Vorteile eines Hot-Spare-Laufwerks für die automatische Wiederherstellung der Redundanz im Falle eines Laufwerksausfalls anhand konkreter Beispiele dargestellt werden.