Hochverfügbarkeit / Datensicherheit (Cluster vs. RAID vs. Backup)
Allgemein
Datensicherheit ist denke ich mal für jeden ein Thema, für Unternehmen und Freelancer vielleicht etwas mehr als für jemanden, der den PC nur in zu Hobbyzwecken nutzt. Aber auch bei letzterem können durch einen Festplattenschaden oder einen Systemcrash unwiederbringliche Erinnerungen (wie etwa Urlaubsfotos, Urlaubsvideos etc.) verloren gehen.
Hier sollten in jedem Fall Vorsichtsmaßnahmen vorgenommen werden, damit es nicht zum Daten-Super-GAU kommt.
Als Mittel hierzu stehen folgende Lösungsansätze zur Verfügung:
- Backup (Dateibackup)
- Backup (Systemimage)
- Non-Stop Backup
- RAID
- Cluster/Hochverfügbarkeitslösung
Auf die genauen Unterschiede, Vor- und Nachteile werde ich im Folgenden noch eingehen.
RAID
Ein durchaus probates Mittel zur Hochverfügbarkeit / Sicherung von Daten stellt auch ein RAID dar. Jedoch gibt es hier einige Einschränkungen ein RAID (kurz für: Redundant Aray of Independent Disks => redundanter Verbund unabhängiger Platten) ersetzt keine Datensicherung in Form eines Backups mit Versionierung, da bei einem RAID wichtige Daten binnen weniger Sekundenbruchteile auch bei einem Festplattenausfall identisch sind.
Zudem muss man hier auch “echte” RAID Level wie RAID-1, RAID-5 & RAID-6 und den darauf basierenden RAID Leveln RAID-10, RAID-50 usw. von Volume/JBOD (Just a bounch of Disks => Nur eine Ansammlung von Disks), RAID-0 abgrenzen, schlicht und ergreifend deswegen weil die 3 letztgenannten weder Hochverfügbarkeit noch Redundanz bieten, im Gegensatz dazu wächst im Falle von RAID-0 die Geschwindigkeit.
Dieser Geschwindigkeitszuwachs steht jedoch in keinem Verhältnis zur höheren Ausfallwahrscheinlichkeit des Systems (bei RAID-0 und RAID-DP gilt dies im besonderen da hier die Schreib-/Lesezugriffe über mehrere Festplatten koordiniert werden.
Hardware RAID vs. Software RAID:
In jedem Falle ist ein Hardware RAID einem Software RAID in Sachen Performance und Datensicherheit vorzuziehen, zumal auch bei einem Controller Schaden,
oft mithilfe eines neuen Controller des gleichen Hersteller das RAID wieder in Betrieb zunehmen ist (Daten bleiben erhalten..).
Apropos Controler, insbesondere bei den Rechen intensiveren RAID Leveln (wie etwa RAID-5, RAID 10 und RAID-50), sollte es ein dedizierter (richtiger) Controller in Form einer Erweiterungskarte sein, mit einem Pufferspeicher und eigener System on Chip CPU, da die Parität so besser zu erhalten ist, und auch die Rechen aufwendigeren RAID Level so problemlos und ohne unnötige Performance Einbußen einsetzbar sind.
mindestens Erforderliche Platten / Raid-Level:
RAID-1 (2 Festplatten => Aber nur gerade Zahlen d.h 2, 4,6 ,8,10,12 usw.) (Auch als Mirroring/Spiegelung bekannt)
RAID-5 (3 Festplatten) (Performance & Parity)
RAID-10 (4 Festplatten =>4, 8,12, 16, 20 usw. da eine Kombination aus RAID-0 und RAID-1)
RAID-15 (6 Festplatten => Kombination von einem RAID 5, das auf mehreren RAID-1 als Parität basiert.)
RAID- 50 (6 Festplatten) Performance und eingeschränkte Hochverfügbarkeit, da die Parität auf RAID-0 Basis existiert)
Cluster
Je nachdem wie die Anforderungen an die Hochverfügbarkeit sind, kann es auch erforderlich sein, eine Cluster Lösung einzusetzen.
Diese Art der Hochverfügbarkeits-Lösung stellt ein Höchstmaß an Verfügbarkeit sicher, zumal diese Lösung auch eine räumliche Trennung von mehreren Servern vorsieht.
Hier sieht man allerdings auch das Hauptproblem von Cluster-Server Lösungen, nämlich das Problem das hierbei eine Lösung mit mehreren möglichst identisch konfigurierten PCs/Servern erforderlich ist.
Anschaffungskosten, welche bei Servern hier ohnehin schon unter Umständen mehrere tausend Euro betragen können, steigen mit einem Cluster in für Normalanwender und Anwender in kleineren Firmen ins unermessliche bzw. ins unrentable.
Damit lohnt sich eine Cluster Lösung nicht so recht als Lösungsansatz zur Datensicherung für Heimanwender und normale Anwender,
wohl aber als Absicherungin größeren Firmen oder bei Anwendern bei denen von den Daten sprichwörtlich die Existenz abhängen.
Hierbei sollte jedoch das Selbe bedacht werden, was ich bereits bei RAID erwähnt habe, nämlich dass ein RAID, wie auch ein Cluster kein Backup ersetzt,
so wird die Verfügbarkeit der Daten sichergestellt, nicht jedoch die Sicherheit der Daten.
Backup (Allgemein)
Nicht ganz zum Thema Hochverfügbarkeit passt das Thema Backup (hierbei spielt es ersteinaml keine Rolle ob Non-Stop, Datei oder Image basierte Backup Lösung), jedoch habe ich mehrfach erwähnt das Hochverfügbarkeitslösungen welche auf Reduanz-Systemen wie RAID oder großen und teuren Clusterlösungen basieren,in keinem Fall eine richtige Datensicherung ersetzen können.
Redundanz <=> Backup
Im Algemeinen ist für ein Backup mindestens eine 2. Partition auf der physikalischen Festplatte, im Idealfall jedoch eine zusätzliche Festplatte (intern, extern oder netzwerkbasiert) erforderlich.
Das Backup (nur) auf einer 2. Partition auszulagern empfiehlt sich im Algemeinen nicht, da bei einem physikalischen Schaden oder einem Festplattenfehler (habe hier schon fast alles erlebt) auch die Backup Daten nicht mehr zu gebrauchen sind. Deshalb würde ich erst einmal empfehlen:
a) in den eigenen Computer eine zusätzliche Festplatte einzubauen (möglichst mit S-ATAI/II/III, ansonsten mit IDE/P-ATA)
b) an den eigenen Computer eine externe Festplatte anzuschliessen (hier kann man ruhig zum günstigsten Modell mit USB 2.0 greifen, wenn man will ist aber auch E-SATA, USB 3.0, Thunderbolt oder Firewire 800 möglich, sofern entsprechende Schnittstellen am eigenen Computer vorhanden sind).
c) Das Backup auf einen dedizierten Homeserver (hierzu ist auch eine Tutorial Serie, Homeserver mit x Linux selberbauen in Arbeit) oder auf einen richtigen kleinen NAS-Server (Vorteil der Abgrenzung zum eigenen System) auszulagern.
Letztere Lösung bietet sich im besonderen Maße dann an, wenn mehrere PCs gesichert werden sollen, da damit nur eine Festplatte/NAS Lösung angeschafft werden muss (Heimnetzwerk => Kosteneffizienz), und die Backups/Datensicherungen damit zentralisiert gespeichert werden können.
Backup (Image)
Eine Image basierte Backup Lösung hat den Vorteil, dass ein Backup des gesamten Systems erstellt wird, welches,
wenn es denn regelmäßig durchgeführt wird, eine ideale Lösung ist.
Weil m Falle eines Systemcrashs zeitnah ein Backup des Systems (als lauffähiges Vollsystem mit allen Programmen die installiert gewesen sind) zurückspielbar ist.
Im Umkehrschluss bedeutet dies aber auch, dass das Image und damit auch der benötigte Speicherplatz mit jedem neuen Programm ansteigt (hierzu sollte man zusätzlich Bedenken das insbesondere Vollbackups und Differentielle Backups viel Speicherplatz verbrauchen.).
Deswegen lohnt sich ein Image basiertes Backup für Anwender bei denen Daten nicht die Hauptmasse der Kapazität von Festplatten belegen, nur als Sicherung des Systemausgangszustandes, für die danach anfallenden Daten sollte man auf eine Datei-basierte Lösung setzen.
Backup (Datei)
Ein Datei-basiertes Backup basiert im Gegensatz zu einem Image auf dem direkten sichern der Datei und eignet sich vorallem für alle Anwenderdaten (also Musik, Word/Excel/Powerpoint/PDF/OpenOffice/LibreOffice usw. Dokumente, Bilder, Fotos und andere wichtige Daten des Anwenders).
Ein Backup auf Datei-Ebene stellt im Prinzip eine Versionierung der Daten dar, bei welcher alte Versionen einer Datei bestehen bleiben.
Etwa in einem Unterordner mit dem Datum, aus diesem Ordner können die letzten Versionen einer Datei ohne zusätzliches Programm, und einzeln wiederhergestellt werden (etwa im Falle eines unabsichtlichen Überschreibens).
Eine Dateibasierte Lösung stellt eine einfache Form der Sicherung dar, welche sich durch einen vergleichsweise geringeren Speicherplatzbedarf und dem vorhin erwähnten Vorteil der einfachen Wiederherstellung auszeichnet.

