Was ist RAID und wie wird es umgesetzt?
Das Konzept: Aus vielen physischen Laufwerken wird ein logisches
Stell dir vor, du betreibst einen wichtigen Server für dein Unternehmen. Wenn die einzige Festplatte ausfällt, steht das gesamte System still. Um dieses Risiko zu minimieren, nutzt die IT RAID (Redundant Array of Independent Disks). Bei diesem Verfahren werden mehrere physische Festplatten zu einem einzigen logischen Laufwerk zusammengefasst. Das Betriebssystem sieht also beispielsweise nur noch ein einziges "Laufwerk D:", obwohl im Hintergrund vier physische Festplatten zusammenarbeiten.
Das Ziel von RAID ist es, die Leistung (Performanz) durch parallele Zugriffe zu steigern, die Ausfallsicherheit (Redundanz) zu erhöhen oder beide Vorteile intelligent zu kombinieren.
RAID vs. Backup: Zwei völlig unterschiedliche Schutzziele
Aus deinem Vorwissen kennst du bereits das Konzept der Datensicherung. Ein eiserner Grundsatz der IT lautet: Ein RAID ersetzt niemals ein Backup!
Beide Konzepte decken unterschiedliche Schadensszenarien ab:
- RAID (Hochverfügbarkeit): Schützt ausschließlich vor Hardwaredefekten. Fällt eine Festplatte aus, läuft das System ohne Unterbrechung weiter.
- Backup (Datensicherheit): Schützt vor logischen Fehlern und Datenverlust. Wenn Anwender:innen versehentlich eine wichtige Datei löschen oder ein Ransomware-Angriff alle Daten verschlüsselt, führt das RAID diese Löschung oder Verschlüsselung sofort und fehlerfrei auf allen gespiegelten Platten aus. Nur ein physisch getrenntes Backup (z. B. nach der 3-2-1-Regel) kann diese Daten wiederherstellen.
Hardware-RAID: Maximale Leistung für Server
Bei einem Hardware-RAID übernimmt ein dedizierter Chip – der RAID-Controller – die gesamte Verwaltung der Festplatten. Dieser Controller sitzt oft als eigene PCIe-Steckkarte im Server und verfügt über einen eigenen Prozessor sowie einen Zwischenspeicher (Cache).
- Vorteile: Die CPU des Servers wird komplett entlastet. Das System bietet höchste Leistung und Zuverlässigkeit.
- Nachteile: Höhere Kosten durch die Zusatzhardware. Fällt der Controller selbst aus, benötigst du oft ein baugleiches Modell, um wieder an die Daten zu gelangen.
- Einsatzszenario: Enterprise-Datenbankserver mit extrem hohen Anforderungen an den Datendurchsatz.
Software-RAID: Flexibel und kostengünstig
Ein Software-RAID kommt ganz ohne speziellen Controller aus. Hier übernimmt das Betriebssystem (z. B. über Linux mdadm oder Windows Storage Spaces) die Verteilung der Daten auf die Festplatten.
- Vorteile: Sehr kostengünstig, da keine Spezialhardware nötig ist. Es ist extrem flexibel – du kannst die Festplatten einfach in einen anderen PC einbauen und das RAID dort per Software wieder einbinden.
- Nachteile: Die Berechnungen (besonders bei Parität) belasten die CPU des Servers, was bei sehr rechenintensiven Aufgaben die Gesamtleistung leicht mindern kann.
- Einsatzszenario: NAS-Systeme (Network Attached Storage) für kleine bis mittlere Unternehmen oder Budget-Server.
Welche Basis-RAID-Level gibt es?
RAID 0 (Striping): Volles Tempo, kein Netz
Bei RAID 0 werden die Daten in gleich große Blöcke zerlegt und abwechselnd auf mindestens zwei Festplatten verteilt. Dieser Vorgang nennt sich Striping.
- Speichereffizienz: 100 % (Die Speicherkapazität aller Platten wird vollständig addiert).
- Leistung: Sehr hoch, da Lese- und Schreibvorgänge parallel auf mehreren Platten stattfinden.
- Fehlertoleranz: Keine. Fällt nur eine einzige Festplatte aus, sind alle Daten des gesamten RAIDs unwiederbringlich zerstört, da jeder Datei ein Teil fehlt.
- Einsatzszenario: Temporäre Arbeitslaufwerke, bei denen Geschwindigkeit das Wichtigste ist (z. B. Cache-Laufwerke für den 4K-Videoschnitt).
RAID 1 (Mirroring): Der exakte Zwilling
RAID 1 setzt auf Mirroring (Spiegelung). Jede Datei, die auf das logische Laufwerk geschrieben wird, wird zeitgleich und identisch auf mindestens zwei physische Festplatten geschrieben.
- Speichereffizienz: 50 % (Bei zwei 4-TB-Platten hast du nur 4 TB nutzbaren Speicher).
- Leistung: Hohe Lesegeschwindigkeit (Daten können von beiden Platten parallel gelesen werden), normale Schreibgeschwindigkeit.
- Fehlertoleranz: Hoch. Eine Festplatte kann komplett ausfallen, das System läuft nahtlos mit der exakten Kopie weiter.
- Einsatzszenario: Laufwerke für das Betriebssystem (OS) oder kleine, kritische Datenbanken.
RAID 5: Der Allrounder mit Parität
RAID 5 benötigt mindestens drei Festplatten. Es nutzt Striping zur Beschleunigung, speichert aber zusätzlich mathematische Paritätsinformationen. Diese Paritätsblöcke werden gleichmäßig über alle Festplatten verteilt.
- Speichereffizienz: Gesamtspeicher minus eine Festplatte ($n-1$). Bei drei 4-TB-Platten hast du 8 TB nutzbar.
- Leistung: Sehr schnelles Lesen. Das Schreiben ist etwas langsamer, da die Parität bei jedem Schreibvorgang live berechnet werden muss.
- Fehlertoleranz: Genau eine Festplatte darf ausfallen. Die fehlenden Daten werden aus den verbleibenden Daten und der Parität "on-the-fly" rekonstruiert.
- Einsatzszenario: Klassische Dateiserver (File-Server) und Webserver.
RAID 6: Doppelte Sicherheit
RAID 6 funktioniert wie RAID 5, berechnet die Paritätsinformationen jedoch doppelt und verteilt sie über die Laufwerke. Dafür sind mindestens vier Festplatten nötig.
- Speichereffizienz: Gesamtspeicher minus zwei Festplatten ($n-2$).
- Leistung: Schnelles Lesen, aber langsameres Schreiben als RAID 5 (wegen der doppelten Paritätsberechnung).
- Fehlertoleranz: Sehr hoch. Es dürfen zwei Festplatten gleichzeitig ausfallen, ohne dass Daten verloren gehen.
- Einsatzszenario: Große Archiv-Server oder NAS-Systeme mit sehr großen Festplatten, bei denen die Wiederherstellung (Rebuild) nach einem Ausfall lange dauert und das Risiko eines zweiten Ausfalls hoch ist.
Wie werden RAID-Systeme für Enterprise-Anforderungen skaliert?
Hot-Spare: Der automatische Ersatzspieler
Stell dir vor, an einem Freitagabend fällt in einem Serverraum eine Festplatte in einem RAID 5 aus. Das System ist nun im kritischen Zustand (degraded) – fällt noch eine Platte aus, sind die Daten weg. Hier kommt das Hot-Spare-Laufwerk ins Spiel.
Ein Hot-Spare ist eine ungenutzte, aber bereits im Server verbaute und mit Strom versorgte Reservefestplatte. Sobald der RAID-Controller einen Defekt erkennt, schaltet er die defekte Platte ab und bindet vollautomatisch das Hot-Spare-Laufwerk ein. Der Rebuild-Prozess (die Wiederherstellung der Redundanz) startet sofort, ohne dass administrativ eingegriffen werden muss. Der defekte Datenträger kann dann in Ruhe am Montag im laufenden Betrieb (Hot-Swap) ausgetauscht werden und wird zur neuen Hot-Spare.
RAID 10 (1+0): Das Beste aus zwei Welten
RAID 10 kombiniert die Vorteile von Mirroring (RAID 1) und Striping (RAID 0) und benötigt mindestens vier Festplatten. Zuerst werden die Festplatten in Paare aufgeteilt und gespiegelt (RAID 1). Anschließend werden diese gespiegelten Paare durch ein übergeordnetes RAID 0 zusammengefasst.
- Vorteil: Du erhältst die extrem hohe Lese- und Schreibgeschwindigkeit von RAID 0 (da keine aufwendige Parität berechnet werden muss) gepaart mit der hohen Ausfallsicherheit von RAID 1. In jedem gespiegelten Paar darf eine Festplatte ausfallen.
- Nachteil: Die Speichereffizienz beträgt nur 50 % des physischen Speichers.
- Einsatzszenario: Hochperformante SQL-Datenbanken oder Virtualisierungsserver, die extrem viele Schreibzugriffe (IOPS) bewältigen müssen.
RAID 50 und RAID 60: Mehrstufige Parität für Rechenzentren
Wenn Unternehmen Dutzende Festplatten in einem Storage-System betreiben, reicht ein einzelnes RAID 5 oder 6 oft nicht mehr aus. Ein Rebuild würde bei riesigen Arrays Wochen dauern und das Ausfallrisiko erhöhen. Die Lösung sind Nested RAIDs (verschachtelte RAIDs) wie RAID 50 oder 60.
- Bei RAID 50 werden mehrere kleine RAID-5-Gruppen erstellt, die dann per Striping (RAID 0) zu einem großen logischen Laufwerk verbunden werden.
- RAID 60 macht dasselbe mit RAID-6-Gruppen.
Diese Architektur bietet deutlich schnellere Schreibgeschwindigkeiten als ein gigantisches RAID 5, verkürzt die Rebuild-Zeiten bei einem Ausfall drastisch und erhöht die Gesamtausfallsicherheit. Sie ist der Standard für massive Speichersysteme (SAN) in großen Rechenzentren.
Teste dein Wissen
Du richtest einen neuen Server mit vier physischen Festplatten ein und konfigurierst ein RAID. Wie stellt sich dieser Speicher für das Betriebssystem dar?