Backupkonzepte

Diese Seite kann keine Lösung für ein konkretes Problem lösen, sondern ihnen die verschiedenen Alternativen für eine Datensicherung aufzeigen. Im Laufe meiner langen Tätigkeit habe ich mit sehr vielen Umgebungen unterschiedlichster Größe gearbeitet und geplant. Die wesentlichen Faktoren und Probleme waren dabei immer:

  • Datenmenge
    Die Sicherung aller Daten wird regelmäßig erfordert. Dazu brauchen Sie ein Sicherungsmedium, auf dem alle Daten als Kopie landen.
  • Datendurchsatz
    Server sind schnell aber Bandlaufwerke benötigen kontinuierliche Daten in ausreichender Menge. Ansonsten müssen die Laufwerke stoppen und wieder anlaufen. Das kostet Zeit, Performance aber verschleißt das Material.
  • Zeitfenster für die Sicherung
    Viele Daten können problemlos auch im Betrieb gesichert werden. Einige Quellen erfordern jedoch eine "Downtime", so dass die Sicherung zu in bestimmten Zeitslots erfolgen kann.
  • Datenquelle
    Nicht alle Daten können einfach "kopiert" werden. Exchange, SQL, SystemState und andere Quelle müssen adäquat gesichert werden.
  • Generationen
    Interessant ist auch, wie lange wie viele Versionen einer Information gesichert werden müssen. Ansätze wie "Großvater - Vater - Sohn" sind nach heutigen Maßstäben kaum mehr ausreichend, da dies faktisch drei Generationen darstellen. Viele Daten müssen über Monate wieder wieder herstellbar sein. Eine Kombination von Vollsicherungen und Differenzsicherungen auf verschiedene Bänder unter Berücksichtigung der unterschiedlichen Ansprüche eines Dateiservers und z.B.: eine Buchhaltung ist ein größerer Planungsaufwand. Interessant sind hier Festplatten als Medium für relativ kurzfristige Daten statt teurer Bänder.
  • Zeit für ein Restore
    Der wichtigste, weil aus Kostensicht interessanteste  Aspekt ist die erlaubte Zeit für ein komplettes Restore eines Server. Dieser Faktor bestimmt, wie effektiv die Kette der Komponenten arbeiten muss und auch die Kosten. Selbst eine Restorezeit von 8h ist niedrig und entsprechend teuer, denn Ersatzhardware über Wartungsverträge ist meist mit minimal 4h zu erhalten, so dass netto weniger als 4h für die Installation des Betriebssystems und das eigentliche Restore der Daten übrig bleiben. Ein DLT8000 kann im optimalen Fall jedoch nur 20GB/h zurücksichern, so dass große Server schon anders betrachtet werden müssen.

Zum Glück gibt es aber auch hier Möglichkeiten zu optimieren, z.B. mit Imagebackups des Betriebssystems, getrennten Festplatte um bei einem Teildefekt nicht alles restaurieren zu müssen. Doch eines nach dem anderen. Die Details zur Sicherung und Wiederherstellung von Exchange finden Sie auf Exchange Backup und Restore. Aber sichern müssen Sie immer. Darauf weisen auch schon verschiedene urteile immer wieder hin:

  • http://www.Microsoft.com/germany/kleinunternehmen/aufgaben/unternehmen-leiten/recht/datensicherung.mspx
    "Das OLG Hamm stellte klar, dass es „heute zu den vorauszusetzenden Selbstverständlichkeiten gehört, dass eine zuverlässige, zeitnahe und umfassende Datenroutine die Sicherung gewährleistet“. Dazu sei es erforderlich, täglich Teilsicherungen und mindestens einmal in der Woche eine vollständige Sicherung durchzuführen. Im entschiedenen Fall konnte man jedoch davon ausgehen, dass nicht einmal eine monatliche Komplettsicherung durchgeführt worden war. So blieb das unternehmen auf seinem Schaden sitzen"

Ein Server

Früher gab es meist einen Server, der hoffentlich auch ein Bandlaufwerk hatte und die ganzen Daten lokal sichert. Die Kapazität und Geschwindigkeit der Bandlaufwerke war meist vergleichbar, so dass die Sicherung funktionieren konnte.

Die Daten werden von der lokalen Sicherungssoftware direkt auf das lokal angeschlossene Bandlaufwerk gesichert. Programme, die dies leisten sind z.B.: NTBACKUP, aber auch Veritas BackupExec, ArcServe, Tapeware und viele andere.

Viele einzelne Server

Wenn Sie aber mehr Server betreiben, dann können Sie nur bis zu einem bestimmten Wachstum mit mehreren Bandlaufwerken agieren.

Nachteilig ist auf jeden Fall, dass Sie auf jedem Server eine Backupsoftware installieren, lizenzieren und konfigurieren müssen, sondern auch sehr viele Bänder wechseln. Daher werden Sie über kurz oder lang auf einen Bandwechsler investieren, um den Wechselprozess zu optimieren. Allerdings sind die Kosten für einen Wechsler höher, so dass sie nicht jedem Server einen Wechsler spendieren werden. Sehr oft wurden hierbei die Server auch immer mit einem Vollbackup gesichert.

Der erste Wechsler mit LAN Sicherung

So stellt sich daher die Frage, wo der Wechsler angeschlossen werden. In der ersten Ausbaustufe wird ein Wechsler z.B. an dem Server angeschlossen, der die größten Festplatten hat. Damit können zumindest diese Daten schnell "lokal" gesichert werden. Die anderen Server werden über das LAN gesichert.

Durch den Wechsler ist es jetzt auch interessant, vielleicht mit differenziellen oder inkrementellen Sicherungen zu arbeiten. Spätestens dann sollten Sie aber eine kommerzielle Sicherungslösung mit Wechsler-Verwaltung, Bandkatalog und voneinander abhängigen Zeitplänen. NTBackup, AT und der Windows Wechselmediendienst kommen bei solch einer Konstellation doch schnell an die Grenzen.

Bei  einer Sicherung  über das LAN gibt es aber drei wesentliche Probleme zu bedenken:

  • Bandlaufwerkbelastung durch langsame Daten
    Auch das schnellste 100MBit-Netzwerk kann LTO oder SDLT-Laufwerke (1GByte/Min = 160MBit/Sek) nicht mehr ausreichend schnell bedienen. Selbst wenn Sie mehrere Netzwerkkarten kombinieren oder Gigabit einsetzen, so müssen die Server auch die Daten über das Netzwerk zuliefern können.
  • Lange Laufzeit durch Sequentielles Backup
    Hinzu kommt, dass mit Ausnahme einiger weniger Produkte (TapeWare, IBM TSM, Legato ?) die meisten Backuplösungen (ArcServe, Veritas, NTBackup etc.) immer nur einen Server zugleich auf ein Band sichern können. So können Sie nie die Funktion nutzen, von mehreren Servern gleichzeitig Daten anzufordern. Wobei dann immer noch die Frage des Netzwerks und des Durchsatzes des Backupservers selbst in Frage gestellt wird
  • Langsame Wiederherstellung
    Die Probleme des LANs werden auch bei der Wiederherstellung sichtbar. Sichert ihre Software aber mehrere Server parallel, dann müssen beim Restore eines Servers viele Daten übersprungen werden. Beide male kostet dies wertvolle Zeit bei der Zurückholung von Daten.

Alle drei Faktoren können so schwerwiegend sein, dass die Sicherung über LAN nur für kleine Server genutzt werden kann. Also stellt sich die Frage, welche Alternativen zur Wahl stehen.

Server und Datenkonsolidierung

Vielleicht reicht es schon einmal, die Server genauer anzuschauen und vielleicht einfach die Daten zusammen zu fassen. Meist sammeln sich im laufenden Betrieb einige Server an. Alte schon lange abgeschriebene Server werden einfach nicht wirklich deinstalliert, auch wenn Sie ewig alt sind. Manchmal kann ein neuer schneller Server sogar die bessere Wahl sein.

Bandlaufwerk im SAN

Ein Weg, einen Wechsler an mehrere Server anzuschließen läuft über ein SAN. Ein Verbund von entsprechenden Controllern und aktiven Komponenten macht es möglich, ein Bandlaufwerke bzw. Wechsler an mehreren Servern zu betreiben. Jeder Server siehst dabei das Laufwerk, als wäre es lokal angeschlossen. Allerdings muss die Sicherungssoftware auf den Servern dafür sorgen, dass keine gleichzeitigen Zugriff erfolgen. Die Technik würde dies aus elektrischer Sicht sogar möglich machen. Leider ist diese Lösung nicht ganz billig, aber oft günstiger als viele Einzellaufwerke und die Arbeit damit. Häufig ist der Wechsler dabei mit mehreren Laufwerken und viele Schächten ausgestattet, damit sich der Aufwand lohnt.

Festplatten im SAN

Mehrere Server mit großen Festplatten benötigen aber mehr als nur ein schnelle Backup, denn auch mit den schnellsten Bandlaufwerken sind Datenmengen von mehreren 100 Gigabyte nicht immer in akzeptablen Zeiten zurückzuholen. Solche Datenmengen sind aber nicht mehr in einzelnen Servern abgelegt, sondern bei solchen Dimensionen werden die Festplatten in externe Systeme ausgelagert, die z.B.: per Software einfach eine Spiegelung einer kompletten Datenfestplatte erlauben. Mehrere Server können dabei auf eigene Datenbereiche zugreifen ohne sich gegenseitig zu stören. Bei einem SAN glaubt der Server, dass er eine lokale Festplatte hat, ob wohl diese außerhalb steht. Einige Systeme erlauben die redundante Anbindung und geografische Verteilung der müssenspeicher.

Für das Backup bedeutet dies aber nun, dass das Backup überhaupt nicht mehr über den eigentlichen Server ablaufen muss, sondern dass das Bandlaufwerk z.B. direkt die Festplatten sichern kann (quasi als Image). Hierzu ist meist ein System zur Steuerung (SAN-Controller) erforderlich. Teilweise ist diese Funktion auch Teil des SAN-Speichersystems. Zudem nutzen viele Firmen diese großen Datenspeicher, um über Snapshots (Kopien einer Partition auf eine andere Festplatte, EMC nennt dies BCV, IBM nennt dies FlashCopy) eine Kopie der Daten zu erstellen. Diese Kopie kann kann dann an einem anderen Server wieder angebunden und dort gesichert werden. Natürlich ist auch hier auch eine klassische Sicherung mit einer Backupsoftware auf dem Server selbst möglich.

Backup to Disk to Tape

Da die SAN-Lösung mit zentralen Speichersystemen aber nicht im Budget vieler Firmen ist, ein SAN für einen gemeinsamen Wechsler aber auch nicht gerade ein Schäppchen ist, suchen viele Firmen nach Alternativen, um mehrere Server effektiv auf einen kleinen oder mittleren Wechsler zu sichern, ohne gleich ein SAN einzusetzen. Trotzdem sind die Datenmengen heute so groß, dass oftmals ein Einzellaufwerk nicht ausreicht. Glücklicherweise sind kleine Wechsler nicht mehr allzu teuer aber damit bleiben immer noch die Fragen zur Geschwindigkeit bei einer Sicherung über das LAN, die effektive Auslastung des Bandlaufwerks (Vermeidung des schädlichen Start/Stop-Betrieb mangels ausreichender Datenzulieferung) und die die effektive Nutzung der wenigen Bänder in einem kleinen Wechsler. Warum sollte eine Differenzsicherung am Wochentag auf ein kostbares Band erfolgen, wenn dieses ein oder zwei Wochen später eh wieder überschrieben wird. So könnte man diese  Zwischensicherungen vielleicht auf eine Festplatte in einem anderen Server schreiben. Alle LAN-Server könnten ebenfalls ihre Daten auf diese Festplatte des Backupservers sichern. Dieser kann dann z.B. tagsüber oder zumindest ohne Rücksicht auf die Server selbst die Daten auf ein Band übertragen. Backup to Disk wird von vielen  Backupprodukten aber auch NTBACKUP ab Windows 2000 unterstützt.

Damit können die Bänder für mehrere Generationen einer Vollsicherung genutzt werden. Und alle LAN-Server können parallel ihre Daten "auf Disk" sichern ohne um sich ein Bandlaufwerk zu streiten. Aber auch für die Rücksicherung ergeben sich bedeutende  Vorteile. Werden die Tapedateien nicht sofort gelöscht, dann können die Daten auch sehr schnell ohne Wartezeiten auf ein Bandlaufwerk zurückgeholt werden. Und der Preis für eine große flotte IDE-Festplatte ist nicht wirklich ein Thema. Theoretisch muss diese Festplatte nicht mit einem RAID abgesichert werden, denn selbst bei einem Ausfall gehen maximal Differenzbackups verloren und die eigentlichen Server funktionieren weiter. Elegant ist auch die Nutzung einer externen Festplatte (z.B. FireWire, USB 2.0)

Folgender Sicherungsplan könnte sich daher ergeben

Tag Quelle Sicherungsart Ziel
Montag \\SRV1\C$
\\SRV1\SystemState
\\SRV2\C$
\\SRV2\SystemState
\\SRV3\C$
\\SRV3\SystemState
Differenz D:\DIFF
Dienstag Differenz D:\DIFF
Mittwoch Differenz D:\DIFF
Donnerstag Differenz D:\DIFF
Freitag Vollsicherung D:\FULL
Samstag D:\FULL Teilsicherung Tape

Zwei "Backup2Disk"-Ordner werden dazu mit unterschiedlichen Haltezeiten definiert und unter der Woche werden nur noch Differenzsicherungen auf D:\DIFF geschrieben. Dies erlaubt eine schnelle Rücksicherung, erspart Bänder und Tapelaufzeit. Warum sollten Sie Daten auf teure langfristige Bänder sichern, wenn diese nach 14 Tagen sowieso nicht mehr vorgehalten werden müssen.

Nur am Freitag werden alle Server in ein eigenes Verzeichnis komplett gesichert. Diese Sicherung wird ihrerseits dann z.B.: 7 Tage vorgehalten. Samstags wird diese Dateisicherung auf ein Band zur langfristigen Ablage geschrieben. In den meisten Fällen ist nur für die letzte Sicherung wichtig, schnell wieder restauriert zu werden (Desasterfall) Hier ist ein Restore von Disk auf Disk natürlich sehr schnell. Dies erkauft man sich aber, dadurch, dass ein Restore einer sehr alten Version erst eine Wiederherstellung vom Band auf Disk erfordert, ehe man dann von dieser Disk die eigentlichen Daten erhalten kann. Die kann jedoch abgemildert werden, indem nicht alle Server in einer großen Diskdatei abgelegt werden.

Allerdings sieht solche eine Lösung auf den ersten Blick einfacher aus, als Sie zu installieren und korrekt zu verwalten ist. Sie benötigen eine geeignete Software, eine gute Zeitsteuerung. Über solch eine Lösung können Sie aber auch Notebooks und Desktops sichern. In Verbindung mit einer Imagebackup-Software ist damit auch ein sehr schnelles Restore denkbar.

Generell ist ein Backup nur so gut, wie die Planung, die Dokumentation und regelmäßiger Kontrollen. Wenn Sie  erst bei der Rücksicherung erkennen, dass Sie wichtige Daten gar nicht oder nur unvollständig gesichert haben, ist es zu spät.

Weitere Links