Immer wieder kommt die Frage bei der Archivierung von Daten nach Datensicherheit. Was geschieht, wenn Daten aus Versehen gelöscht werden? Was passiert, wenn die Software Daten falsch ablegt? Oder was passiert am Ende, wenn ein Rechner komplett ausfällt? Viele kommen natürlich sofort mit der Standardantwort. Aber da gibt es doch sicher ein Backup, oder? Nur, wie alt ist dieses Backup? Wird der PC einmal im Monat, einmal in der Woche oder sogar jeden Tag gesichert? Sind die gesicherten Daten nicht vielleicht schon viel zu alt? Für die Ausfälle durch Userverschulden oder durch Fehler in der Software ist dies wohl sicherlich auch die sinnvollste Lösung. Aber was geschieht bei einem Hardwareausfall?
Muss dann erst neue Hardware beschafft werden und dann das Backup zurückgespielt werden? Unter anderem für diesen Fall wurde das RAID-Verfahren entwickelt. Dabei unterscheidet man zwischen verschiedenen RAID-Leveln. RAID 1 beispielsweise spiegelt einfach jede Festplatte auf eine zweite. Hier ist der Nachteil aber, daß man eine Menge Festplattenkapazität verliert. Es müssen immerhin doppelt so viele Festplatten vorhanden sein, wie eigentlich gewünscht. Die Sicherheit der Daten allerdings ist gewährleistet.
Es wurden noch einige weitere RAID-Level entwickelt, so auch das RAID 4. Dieses Raid benötigt trotz Sicherheit nicht so viele Platten. Alle Daten, die auf die Festplatten geschrieben werden, werden in kleine Segmente aufgeteilt. Diese werden auf verschiedene Platten aufgeteilt und zusätzlich wird auf einer separaten Platte die Information gespeichert um im Notfall einen Ausfall einer Datenplatte kompensieren zu können. Dies geschieht, wie auch beim RAID 3, welches lediglich mit kleineren Segmenten arbeitet, mit einer XOR Verknüpfung. Fällt also eine Platte aus und wird durch eine leere ersetzt, so kann mit Hilfe der Informationsplatte die Daten rekonstruiert werden. Fällt dagegen die Informationsplatte aus, so können die Informationen erneut mit der genannten Verknüpfung erzeugt werden.
Es gibt aber noch einen weiteren Grund, warum das RAID System entwickelt wurde. Zwar wurden die Festplatten mit der Zeit immer schneller, aber dies war dennoch nicht genug. Auch heute noch bilden sie in vielen Systemen den Flaschenhals, der für langsame Datenübertragungen verantwortlich ist. Das RAID sollte also auch für schnellere Datenübertragungen und kürzere Zugriffszeiten sorgen. Zu diesem Zweck wurden RAID-Level wie Raid 0 entwickelt. Dieses teilt die Daten ebenfalls in Segmente und verteilt sie auf verschiedene Platten. Durch die Aufteilung wird bei der Anforderung einer bestimmten Datei gleich von mehreren Festplatten gelesen. Durch diese Technik ensteht eine höhere Lesegeschwindigkeit. Die Datensicherheit wird durch dieses RAID allerdings nicht beeinflusst.
Genau hier aber liegt ein Schwachpunkt von Raid 4. Für jeden Schreib und jeden Lesezugriff wird auf die Informationsplatte, die man auch Paritätsplatte nennt, zugegriffen. Somit wird diese Platte nicht nur übermäßig stark beansprucht, sondern bildet auch bei jeder Datenübertragung den entscheidenden Faktor. Dieser Effekt wurde erst durch RAID 5 aufgehoben. Hier werden die Informationen nicht auf eine fest definierte Platte geschrieben, sondern auf alle Platten -ebenso wie die Daten- verteilt.
Dennoch ist Raid 4 selbst heute noch nicht vollständig verschwunden. Verwendet man bei Schreibzugriffen einen Puffer, wie zum Beispiel einen NVRAM, so bleiben die Vorteile dieses RAID-Levels erhalten. Die Nachteile dagegen kann man fast vollständig eliminieren.
Auch verschiedene NAS – Systeme laufen noch auf RAID 4. Hier wird der Schreibzugriff ebenfalls über einen Puffer geführt und erhält damit eine durchaus akzeptable Schreibgeschwindigkeit. Beim Lesen allerdings kommt es auch hier zu Fehlern, die hauptsächlich durch die Fragmentierung entstehen. Somit wird die Lesegeschwindigkeit bei derartigen Systemen stark verringert. Wie man es auch dreht und wendet, aus RAID wird man auch in Zukunft nicht die optimale Sicherungsmethode machen. Zumal Systeme wie RAID 5 oder gar RAID 6 inzwischen wesentlich schneller und leistungsfähiger sind. RAID 6 ist sogar in der Lage gleich den Ausfall von zwei Festplatten zu verkraften. Durch die hohe Beanspruchung bei RAID 4 ist die Paritätsplatte sehr häufig von Ausfällen betroffen und versagt ihren Dienst.
Auch gibt es Mischsysteme, die verschiedene RAID-Level mit einander kombinieren. So ist zum Beispiel das RAID 10 eine Mischung aus Raid 1 und Raid 0. Hier werden die Daten erst gespiegelt und dann die einzelnen Segmente unterschiedlich platziert. Man bekommt somit nicht nur eine erhöhte Sicherheit, sondern auch zusätzlich eine bessere Schreib- und Leserate. Aber selbst in diesen Mischvarianten kommt das RAID 4 nicht zum Einsatz. Hier greift man auf das inzwischen verbreitetere RAID 5 zurück.
Um ein RAID System generell einsetzen zu können, benötigt man einen Controller, der das zu verwendende System beherrscht. Hier gibt es den Unterschied zwischen Hardware- und Software Controllern. Während es die Softwarecontroller meist noch für alle erdenklichen RAID- Level und Mischvarianten gibt, sind auf den Hardwarecontroller je nach Preis nur noch die gängigsten Varianten vorhanden. Nicht zuletzt aus diesem Grund werden Systeme wie RAID 2, 3 und eben auch 4 immer weniger eingesetzt werden. Die Möglichkeit einen Softwarecontroller zu verwenden macht gerade bei großen Datenmengen keinen Sinn, da diese auch wieder zusätzliche Rechenleistung benötigt.
RAID 4 wird also nur noch in seltenen Ausnahmefällen in professionellen Umfeldern zum Einsatz kommen.
2 Antworten auf „Raid 4 – Für die Ausfälle durch Userverschulden oder durch Fehler in der Software ist dies wohl sicherlich auch die sinnvollste Lösung“
„RAID 4 wird also nur noch in seltenen Ausnahmefällen in professionellen Umfeldern zum Einsatz kommen.“
Ja, der zweitgrößte Speicheranbieter nutzt genau diese Technik.
„Raid 4 – Für die Ausfälle durch Userverschulden oder durch Fehler in der Software ist dies wohl sicherlich auch die sinnvollste Lösung“
Ich habe mit der Überschrift ein Problem. RAID 4 wird denke ich nur noch von Netapp genutzt. Ich vermute du wolltest „Ausfälle und Userverschulden“ auf die Wiederherstellung von Dateien beziehen, dies ist aber Teil von Netapp WAFL, also dem Dateisystem von Netapp über dem RAID 4 welches Snapshots unterstützt.
Mit dem letzten Abschitt „Fehler in der Software“ komme ich ebenso nicht ganz zurecht. Vermutlich spielst du auf eine Datenintegrität an. An dieser Stelle gibt es gleich zwei Probleme, sicherlich nutzt WAFL Host Bus Adapter (HBA), um auf die Platten im RAID 4 Verbund zuzugreifen. Meines Wissens nach verlässt sich aber Netapp nur auf die CRC’s der Platten und die RAID 4 Plattenabsicherung. Diese sind meiner Meinung nach aber bei Terabyte Platten nicht mehr ausreichend, um Daten auf Dauer abzusichern. Sowohl im Web vorhandene Auswertungen mit Netapp Bezug und auch die Cern Studie zeigen dies deutlich. RAID 4 dann als sinnvoll zu bezeichnen, naja. Mittlerweile schwenken diese Speicherhersteller zu Dynamik Disk Pools um, aber auch hier ist wieder recht wenig von durchgängiger Datenintegrität zu lesen.