Verfügbarkeit

Inhaltsverzeichnis

Warum Cluster oder sind 99,9% möglich ?
Durchschnittliche Verfügbarkeit und erlaubte Ausfallzeit im Jahr

Statt Hochverfügbarkeit geht es zuerst einmal um die Verfügbarkeit. Und hier hier gibt es schon mehrere Fälle zu unterscheiden. für eine saubere Planung muss sich die Geschäftsführung hier festlegen oder Sie müssen für die verschiedenen Verfügbarkeitszeiten entsprechende Kosten gegenübersetzen:

Szenario	Ausfallzeit	Kosten
Pausenzeit durch geplante Servicearbeiten Immer wieder sind Servicepacks oder Security Updates erforderlich, die je nach System die Exchange Dienste stoppen oder den kompletten Server booten. Diese Seite möchten oder müssen einige Firmen reduzieren.
Zeit bis zur Hardwarereparatur/Austausch Oft es sowohl die Datenbank als auch die Softwareinstallation in Ordnung und es hat nur den Switch oder das Netzteil erwischt. Es passiert oft genug, dass die Fehler hier zu finden sind.
Maximale Ausfallszeit bis zum Mailverkehr Nach einen Totalausfall mit Datenbankverlust sollten Sie prüfen wie weit eine schnelle Wiederherstellung gehen muss. Oft reicht es ja, einen Exchange Server so bereit zu stellen, dass neue Nachrichten empfangen und beantwortet werden können, solange die Bestandsdaten später nachgereicht werden
Maximale Ausfallszeit bis zur vollständigen Bereitstellung der Bestands In diese Zeit geht die Geschwindigkeit für die Datenbankwiederherstellung ein. Diese kann man durch Replikate, Schattenkopien und natürlich schnelle Sicherungsmedien
Maximal tolerierter Datenverlust Ausfälle, die den Massenspeicher betreffen, bedeuten immer auch "Verlust" von Daten. Ein Restore bildet immer einen Stand der Vergangenheit nach aber meist nicht den zuletzt aktuellen Stand. Hier helfen aber Transaktionsprotokolle auf anderen müssenspeichern, Replikation der Datenbank, Archivlösungen, Transport Dumpster, und inkrementelle Backups unter Tage.

Die ganzen Zeiten müssen aber noch nach Rollen gestaffelt werden. Ein Mailbox Server ist natürlich eine kritische Ressource. Aber das Mailrouting (Hub/Transport/SMTP) oder der Zugriff (Frontend/CAS/ISA/POP3/IMAP4 etc.) kann auch über mehrere Server besser verfügbar gemacht werden. Und an all die Geschäftsführer, die eine Wiederherstellung in Minuten oder sogar wenigen Stunden fordern, seit gesagt, dass die dazu zumindest Ersatzhardware vor Ort vorhalten müssen, da kein Lieferant in weniger als 4h ein Ersatzteil vor Ort garantiert. Sie sehen, dass Verfügbarkeit mehr ist, als mal schnell einen Cluster zu installieren und die Hände in die Taschen zu stecken.

Warum Cluster oder sind 99,9% möglich ?

Exchange und der Inhalt und die Erreichbarkeit der Inhalte wird immer wichtiger. Erst wenn der Exchange Server einige Stunden nicht verfügbar ist, und die Anwender an die Tür trommeln, wird dies jedem Administrator so recht deutlich. Daher ist eines der Ziele die Erhöhung der Erreichbarkeit.

Wenn Sie eine Hochverfügbarkeit fordern, dann geht es um die Betrachtung aller Aspekte. Es reicht nicht, einen Exchange Cluster zu installieren, aber Netzwerk, Domain Controller, Namensauflösung, IP Adressvergabe, Internetanbindung und so weiter zu vergessen.

Die 99,9% sollten sich nicht auf einen SERVER beziehen, sondern auf die Funktionen.

Hier einige Aspekte beim Betrieb und wie diese gesichert werden könnten:

Szenario	Verhinderung
Ausfall einer Festplatte	Hardware RAID mit Hot Standby
Probleme der Stromversorgung	USV und Überspannungsschutz Mehrere Netzteile im Server an mehreren Phasen und mehreren uSV
Netzwerkprobleme	Doppelte Anbindung an mehrere Switches. Adapter Teaming
Serverprobleme RAM Defekt, eine CPU-Defekt	Qualitätshardware mit Defekterkennung. Ausblenden des Moduls und Neustart.
Datenbank korrupt	KEINE LöSUNG !!!!
Internet Mail	mehrere Connector Server, Firewall, doppelte Anbindung, Backup-Wählverbindungen
Netzwerkinfrastruktur	mehrere eigene DCs, GCs, DNS-Server, WINS-Server, DHCP-Server

Alle diese Faktoren können ohne Cluster ebenso in der Verfügbarkeit preiswerter erhöht werden. Es gibt nur sehr wenige Gründe "FÜR einen Cluster. z.B.

Automatischer Failover beim Ausfall eines kompletten Serverknoten
geringere Downtime bei Updates und Service Packs

Die geringere Downtime erklärt sich, dass ein Rolling Update möglich ist und eine Kernfunktion des Clusters ist der Failover beim Ausfall eines Knotens in relativ kurzer Zeit. Insofern müssen Sie sich überlegen, ob Sie nicht einfach mit einem "gut gepflegten" System letztlich preiswerter eine bessere Verfügbarkeit erhalten.

Cluster Server ohne Monitoring ist eigentlich ein unding, da der Cluster nicht alles retten kann, sondern eine Komponente in der Kette hoch verfügbar macht. Aber für die Gesamtfunktion sind alle Bestandteile wichtig. Wenn Sie kein Geld für Monitoring ausgeben können, dann dürfen Sie erst recht kein Geld für Cluster übrig haben.

Durchschnittliche Verfügbarkeit und erlaubte Ausfallzeit im Jahr

Schauen Sie mal auf diese Tabelle, wie viele Stunden und Tage ein System ausfallen darf, um bestimmte Verfügbarkeiten zu erreichen:

Verfügbarkeit	24-Stunden Tag	8- Stunden Tag
90%	876 Stunden (36,5 Tage)	291,2 Stunden (12,13 Tage)
95%	438 Stunden (18,25 Tage)	145,6 Stunden (6,07 Tage)
99%	87,6 Stunden (3,65 Tage)	29,12 Stunden (1,21 Tage)
99,9%	8,76 Stunden	2,91 Stunden
99,99%	52,56 Minuten	17,47 Minuten
99,999%	5,256 Minuten	1,747 Minuten
99,9999%	31,536 Sekunden	10,483 Sekunden

Schon das erreichen von 99,9% ist ein stattliches Ziel, da Sie ihren Server im Jahr mindestens einige Male aufgrund von erforderlichen Patches, Updates aber auch geplanten Erweiterungen neu starten müssen. Cluster kann hierbei helfen, da ein Failover schneller ist, als ein Neustart. Aber eine kurze Unterbrechung bleibt bestehen. Auf der anderen Seite ist es bei einem Failover von 20 Sekunden bis 1 Minute schon sehr schwer, die 99,999 zu erreichen.

Auf der anderen Seite ist diese Tabelle aber auch sehr hilfreich, um bei Vorgesetzten und Inhabern deutlich zu machen, was vielleicht eine geforderte Verfügbarkeit real bedeutet und welch hoher Aufwand dafür entsteht.