Archivieren mit Exchange - Aufgabenstellungen

Exchange zeichnet sich als Server gegenüber anderen Systemen dadurch aus, dass bei Nutzung von Outlook und passender Konfiguration alle Nachrichten auf dem Exchange Server verbleiben. Die Folge davon ist aber auch, dass die Datenbank wächst und wächst. So können Anwender natürlich problemlos auch alte Informationen suchen und nutzen, aber als Administrator habe ich schon ein Interesse, dass die Datenbank nicht ins unermessliche steigt. Zum einen nimmt der Ressourcenbedarf für Backup und Restore immer weiter zu. Auch die Kapazität der Festplatten ist immer noch endlich. Im Fehlerfall werden die Ausfallzeiten wegen ISINTEG und ESEUTIL immer länger.

Aufgabe 0: Rechtliche Anforderungen erfüllen

Auch wenn diese Argument speziell vom Vertrieb gerne angeführt wird, so sollten Sie dies zwar berücksichtigen, aber auf dieser und den folgenden Seiten steht der rechtliche Aspekt nicht im Vordergrund. Details finden Sie auf Recht und Gesetz.

Aufgabe 1: Echtzeit Archiv

Eine wesentliche Aufgabe eines Archivsystems ist die Sicherstellung, dass ein Objekt immer wieder nachvollziehbar bleibt. Dies kann eine empfangene oder gesendete Mails sein, aber auch ein Journaleintrag oder Termin. Selbst wenn der Anwender die Mail löscht, muss das Objekt weiterhin im Archiv entsprechend der Richtlinien vorliegen. Ein Archivsystem muss daher sehr schnell jede Mail quasi kopieren. Dazu gibt es mehrere Möglichkeiten mit Exchange:

  • Archivmailbox
    Exchange 2000/2003 bietet die Funktion, dass pro Postfachdatenbank eine Archivmailbox definiert werden kann. Jede an diesen Informationsspeicher zugestellt Nachricht wird in diese Archivbox als Kopie abgelegt. Selbst wenn der Anwender die Mail in seinem Postfach wieder löscht, bleibt Sie im Archivpostfach.
    Eine Archivlösung muss hierzu dann nur dieses Postfach immer wieder auslesen und in das Archivsystem übernehmen. Archivierte Mails sollte das System aber auch löschen, damit der Speicherplatz wieder frei gegeben wird.
    Allerdings kann über den Weg nicht erkannt werden, wenn ein Anwender z.B.: einen Termin im Postfach anlegt. Muss die Archivfunktion auch solche Änderungen in Echtzeit erfassen, müssen andere Wege greifen
  • MAPI Monitor
    Daher nutzen einige Programme den Weg, alle Mailboxen per MAPI zu öffnen. Diesen Weg haben früher schon viele Virenscanner (vor der Verfügbarkeit von ESE und VSAPI) nutzt. Allerdings bleibt hier eine kleine Lücke, da der Anwender und die Archivsoftware ein neues Element "gleichzeitig" sehen. Wenn der Archivserver beschäftigt oder gerade herunter gefahren ist, dann kann der Anwender die Mails gelöscht haben, ehe eine Kopie davon im Archiv gelandet ist.
  • Store Sink
    Daher gibt es seit Exchange 2000/2003 auch die Option, in den Informationsspeicher selbst eigenen Code einzubinden, der beim Ablegen eines Element in den Store aufgerufen wird (siehe Exchange 2000/2003 Event Sinks). Eine Archivsoftware könnte den gleichen Weg gehen und so jede Veränderung im Informationsspeicher erkennen und die betroffenen Elemente archivieren.
  • WebDav
    Auf über den HTTP-Zugriff auf den Informationsspeicher ist nicht nur das Auslesen und schreiben von Elementen möglich, sondern ein Prozess kann sich auch vom Server über Änderungen informieren lassen. Bislang kenne ich aber keine Archivlösung, die diesen Weg gewählt hat.
  • Exchange 2007 Journal Regel
    Mit Exchange 2007 können nun auch auf dem Transport entsprechende Journalregeln erstellt werden, so dass auch Nachrichten im Archiv landen können, die nicht "lokal" zugestellt werden.

Im Hinblick auf die weitere Verbreitung von Exchange 2000/2003 ist der Weg über einen EventSink der leistungsfähigste Weg, der auch alle Veränderungen archivieren kann. Ist nur ein Archiv für übertragene Mails gefragt, kann auch das Archivpostfach von Exchange 2000/2003 als Quelle ausreichend sein.

Sehr viele Produkte archivieren nur Mail, die längere Zeit im Postfach liegen, auf ein anderes Medium und hinterlassen einen Platzhalter. Dies ist aus meiner Sicht nicht geeignet, da ein Anwender damit eine Mail vor dem Archiv löschen kann und diese damit nie im Archiv landet. Korrekt müsste eine Archivlösung jede übertragene Mail beim Eintreffen am Ziel schon in das Archiv kopieren und ein Prozess darf später einmal die Mail im Postfach durch einen Platzhalter auf die schon lange im Archiv liegende Kopie ersetzt.

Aufgabe 2: Versionierung

Wird nun aber z.B. ein Element im Informationsspeicher geändert, dann muss das Archivsystem nun entscheiden, wie es damit umgeht. Einige Systeme archivieren nur die erste Version, andere archivieren die geänderte Version. Genau genommen muss das Archivsystem alle Versionen speichern und vorhalten und eine entsprechende Versionierung anbieten.

Dies ist beim Zugriffe über die Exchange 2000/2003 Archiv Mailbox natürlich nicht möglich. Beim Zugriff über MAPI muss der Archivhersteller darauf geachtet haben, dass er nicht nur auf "neue " oder gar auf ungelesene Mails prüft, sondern alle Veränderungen erkennt und archiviert. Auch hier ist vermutlich der StoreEventSink, welcher beim Zurückschreiben des Elements in die Datenbank angesprochen wird, die leistungsfähigste Variante.

Diese Leistung hat aber zugleich den größten Nachteil, da damit viele Änderungen oder z.B. auch Zwischenspeicherungen als Entwurf immer wieder einen Archivvorgang auslösen. Das Bedeutet eine höhere Belastung des Exchange Servers, der Netzwerkverbindung zum Archivserver und natürlich vergrößert sich auch der Speicherbedarf für das Archiv.

Aufgabe 3: Platz schaffen, Backupreduzierung, Desaster Unterstützung

Lang Zeit haben Archivhersteller als primären Aspekt zum Einsatz einer Archivlösung auch die Reduzierung des Speicherplatzbedarfs des Exchange Servers vorgebracht. Da die meisten Personen in ihrem Mailsystem nur mit den aktiven Nachrichten arbeiten und ältere Informationen in der Regel kaum oder gar nicht mehr gelesen werden, liegen damit in der Exchange Datenbank auch sehr viele tote Objekte, die einfach nur Speicherplatz belegen, täglich teuer gesichert werden und beim Restore oder einem Fehler die Zeit der Wiederherstellung überflüssigerweise verlängern. Einige Hersteller haben sich sogar auf den Standpunkt gestellt, dass eine Migration schneller ablaufen kann, wenn die älteren Mails des alten Servers archiviert werden und beim Migrationsprozess nur noch kleine Postfächer umzuziehen sind..

Faktisch arbeiten aber nahezu alle Archivsysteme mit der Funktion, Nachrichten anhand bestimmter Kriterien (Alter, Größe, Ablageort etc.) aus dem produktiven Server zu entfernen und in das Archiv zu verlagern. Am ursprünglichen Ort bleibt meist ein kleines Platzhalterobjekt zurück, über das der Anwender wieder an diese Mail kommt.

Die Archivsysteme greifen dabei meist per MAPI (zukünftig vielleicht auch per WebDAV) auf die Postfächer zu und Extrahieren die Elemente. Wurden die Elemente allerdings schon im Rahmen einer Echtzeitarchivierung als Kopie in das Archiv abgelegt, dann ist es ein einfaches, diese Mails einfach zu löschen und eine Referenz auf die schon früher erstellte Kopie zu hinterlassen.

Dazu ist es aber erforderlich, dass das Archiv eben solche zusammen gehörende Mails wird zuordnen kann. Dazu kann eine Hashwert über die Nachricht oder die Message-ID der Nachricht, sofern vorhanden, dienen.

Aufgabe 4: Frage des GUI für den Anwender

Zuletzt stellt sich die Frage, wie der Anwender auf die archivierten Nachrichten zugreifen kann. Auch hier gibt es wieder mehrere Wege, die individuelle Vorteile und Nachteile haben. Dies betrifft natürlich nur die Mails, die auch in das Archiv verschoben wurden.

Wer täglich mit Outlook Mails bearbeitet wird nur ungern zu einer anderen Anwendung wechseln. Da ist es von Vorteil, wenn auch der Zugriff auf archivierte Elemente mit Outlook erfolgt. Aber schon hierzu gibt es drei Wege:

  • Outlook Formular Siehe Outlook Formulare)
    Der einfachste Weg ist die Nutzung entsprechende Formulare, die Outlook beim Lesen einer archivierten Mails anstelle der Standardformulare nutzt. Formulare sind sehr einfach und schnell zu verteilen und zu aktualisieren und in einem gewissen umfang auch mit Code zu verbinden. Wird allerdings auf externe Programme zugegriffen, so muss sichergestellt werden, dass diese auch lokal installiert sind.
    Ein Formular kann aber eine angepasste Ansicht, quasi eine Voransicht anbieten und dem Anwender die Funktionen für den Zugriff auf das originale Dokument geben. Einige Archivlösungen (z.B. IXOS ECon Server) lösen den Zugriff dann so, dass das Formular eine Mail an den Archivserver sendet, der die archivierte Mail dann in das Postfach restauriert und vom Formular angezeigt wird. Dies ist natürlich sehr pfiffig, da auf dem Client überhaupt keine Zusatzsoftware erforderlich ist. Allerdings erhöht sich das Mailaufkommen entsprechend.
  • Outlook COM-Addin
    Ein zweiter Weg ist die Installation einer Software auf dem Client, die Outlook um zusätzliche Menüs und Funktionen erweitert. Dies ist ein durchaus gangbarer Weg, ist aber davon abhängig, dass die Anwender wirklich mit Outlook arbeiten und die Verteilung der Software kein allzu großes Problem ist.
  • Outlook mit HTML
    Einem Formular bzw. über Outlook HEUTE oder eine Ordnerhomepage ist es natürlich problemlos möglich einen Webbrowser so aufzurufen, dass der Anwender fast keinen unterschied bemerkt. Den bemerkt er aber spätestens dann, wenn der PC offline arbeitet oder über "Drag and Drop" Verschiebeaktionen ausgeführt werden sollten, die so nicht möglich sind.
  • Zugriff triggert restore
    Virenscanner für Exchange machen es schon lange vor, dass ein Objekte auch allein beim lesenden Zugriff auf dem Server von einer Drittsoftware analysiert und verändert werden kann. So könnte auch eine Archivlösung sich in Exchange einbinden und ähnlich einem Virenscanner den Zugriff auf Objekte erkennen und wenn es sich dabei um ein archiviertes Element handelt, das Originalelement zurückgeben. So wäre überhaupt keine Erweiterung auf dem Client erforderlich.
    Allerdings ist hierbei ganz genau zu prüfen, da auch andere Zugriffe auf Elemente dann ein Zugriff auf das Archiv bedeuten würden. So würde ein Single Item Backup, ein Zugriff mit EXMERGE oder MailMig ebenso als Clientzugriff gewertet, wie ein Verschieben einer Mailbox auf einen anderen Server oder die Replikation mit einer OST-Datei. Das Archivsystem müsste in dem Fall sehr viele Daten sehr schnell bereit stellen.

Da bleiben dann aber noch einige weitere Fragen offen, z.B.:

  • Zugriff ohne Outlook
    Nicht immer arbeitet ein Benutzer mit einem vollwertigen Outlook. Wie stellt sich der Zugriff auf ein Platzhalterelement dar, wenn der Anwender z.B.: mit OWA arbeitet? Auch der Zugriff von Anwendern mit IMAP4, OMA etc. ist zu berücksichtigen.
  • Integrierte Suche
    Programme wie Outlook aber auch Ergänzungen wie Lookout etc. erlauben eine sehr schnelle Suchen in den Mails. Das funktioniert natürlich nur soweit, wie die Mails noch vorliegen. Hat das Archivsystem ältere Mails entfernt oder durch Platzhalter ersetzt, dann findet Outlook nichts mehr und der Anwender muss im Archivsystem suchen. Wir funktioniert das bzw. kann eventuell eine Integration in ein unternehmenssuchportal erfolgen? Wie wird dann aber sicher gestellt, dass beim Suchen der Anwender nur "seine" Mails wieder findet ?
  • Offline
    Outlook kennt eine Funktion, bestimmte Elemente auch offline verfügbar zu machen. Werden dabei einfach die Platzhalterelemente der archivierten Objekte repliziert, so ist ein Zugriff von unterwegs ohne Netzwerkverbindung nicht möglich. Der Anwender erfreut sich zwar einer kleineren OST-Datei aber wenn er so auf wichtige Daten verzichten muss, ist die Archivlösung ungeeignet. So sollte diese z.B. für öffentliche Ordner oder die Kontakte und Kalender andere Archivintervalle einstellen können.

Aufgabe 5: Integration und Flexibilität

Als Administrator fragen Sie sich natürlich, welche Belange Sie bei einer Archivierung mit Exchange beachten müssen. Jedes System funktioniert in einer bestimmten Umgebung. Aber niemand weiß heute schon, wie die Welt morgen aussieht und als Administrator stelle ich z.B. folgende Fragen:

  • Domainumzug
    Was passiert mit den Daten, wenn ein Benutzerkonto oder gleich der Server in eine andere Domäne umgezogen wird? Systeme, die auf der SID als primärem Schlüssel basieren, müssen sich etwas überlegen, um den Zugriff weiter zuzulassen. Wird der Server selbst verschoben, dann ändert sich auch er DNS-Name des Servers. Was passiert mit Hyperlinks in Platzhalterobjekten und anderen Metadaten ?. Die Frage stellt sich aber auch, wenn nach 3-6 Jahren der alte Server durch einen neuen Server ersetzt wird.
  • Benutzer scheidet aus
    Trotzdem dürfen die Mails des Benutzers im Archiv nicht einfach gelöscht werden. Aber ohne Postfach fehlt der komplette Zugriff über die Anwendungssoftware. Wie kann erreicht werden, dass ein anderes Postfach nun auch diese archivierten Inhalte lesen kann?
  • Postfach wird verschoben
    Es soll Archivlösungen geben, die schon das Verschieben eines Postfachs auf einen anderen Server oder eine andere Speichergruppe in der gleichen Organisation nicht verstehen und den Zugriff auf die alten Daten verhindern.
  • Neue Organisation
    Auch Firmen werden gekauft und verkauft. Sehr oft ist dies auch mit einer großen Umstellung der Exchange Umgebung verbunden, d.h. Exchange Organisationen werden zusammen gebracht, migriert etc. Kann das Archiv dann immer noch weiter genutzt werden, geht die Verbindung verloren oder kann diese danach wieder hergestellt werden?
  • Postfachlimit und Zurückholen
    Viele Archivsysteme erlauben des dem Anwender, eine archivierte Mail wieder in das Postfach zurückstellen zu lassen. Kann das Archivsystem damit umgehen, wenn der Exchange Server die Ablage aufgrund von Größenbeschränkungen verhindert ?
  • Netzwerkbelastung und Serverbelastung
    Wenn Archivserver und Exchange auf unterschiedlichen Systemen laufen, dann müssen die Informationen übertragen werden. Was bedeutet das für die Verbindung zwischen den Server und die Last der Server selbst.
  • Geografische Verteilung
    Immer noch stehen viele Server auch in Niederlassungen vor Ort. Wenn eine zentrale Archivierung gefordert wird, müssen die Daten über das WAN zur Zentrale. Die Bandbreite aber auch die Pufferung beim Ausfall oder Überlastung der Leitung sind hier wichtige Fragen.
  • Sicherheit und Verbindung
    Viele Produkte erwarten, das der Client direkt auf den Archivserver zugreift und die Informationen erhält. Hierbei interessiert mich natürlich, welche Protokolle genutzt werden, ob diese auch über ein VPN und durch eine Firewall durchkommen und ob die Daten ausreichend gesichert sind. Eine Anmeldung an einer Weboberfläche ohne SSL sind für heutige Programme wie CAIN etc. auch für Computereinsteiger kein Problem mehr.
  • Virenscan
    Es passiert, dass eine Mail einen Virus enthält, die beim Empfang noch nicht vom Virenscanner erkannt wurde und damit auch im Archiv gelandet ist. Wie geht eine Archivlösung damit um ?. Beim Zurückschreiben könnte das Archiv einen Fehler erhalten. Aber auch der Zugriff auf die Archivablage selbst z.B.: auf einer Festplatte könnte durch einen dateibasierten Scanner nach einigen Tagen später verhindert werden. "Überlebt" dies die Archivsoftware ?
  • Accounting
    Wenn die Nutzung von Postfächern berechnet wird, kann dann auch die archivierte Größe einfach mit einbezogen werden ?
  • Steuerung der Archivierung
    Die die Einstellung, was wie archiviert werden global oder auch pro Server, Datenbank oder gar Postfach zusteuern. Werden neue Benutzer automatisch mit in die Archivierung aufgenommen oder ist dies ein zweiter Konfigurationsschritt. können bestimmte Benutzer ausgeschlossen werden, weil für diese keine Archivierung erforderlich ist, z.B.: den POSTMASTER ?

Es gibt sicher noch viele weitere Fragen. Denken sie bei einem Termin mit ihrem Anbieter rechtzeitig, welche Problemstellung sie lösen möchten und welche Antworten Sie benötigen. Oder sie kaufen externe Hilfe zur Produktauswahl ein. Eine Entscheidung für ein Archivsystem ist meist einer sehr langfristige Bindung, zumal Archivlösungen nicht gerade zu den Produkten unter 1000 Euro zählen.

Was ein Archiv nicht ist !

Ein Archiv ist niemals ein Ersatz für ein Backup, da es nur die Inhalte sichert und nie die internen Verknüpfungen. So enthält ein Archiv in der Regel keine Informationen über Regeln, Stellvertretungen, Ansichten etc., sondern immer nur einen Export der Inhalte. Einige Archivsystem sind allerdings in der Lage, aus den archivierten Elementen die Originale wieder zu erstellen und damit im Fall eines Desasters oder Datenverlusts diesen zumindest teilweise wieder herzustellen. Dennoch müssen Sie dazu erst eine lauffähige Datenbank haben. Exchange 2000 und höher kann zwar eine leere Datenbank neu erstellen, aber dies ist keine Basis für einen dauerhaften Betrieb. Also Backup muss weiterhin sein. Sogar das Archiv müssen Sie genau genommen ebenfalls "sichern". Hier unterstützt Sie aber das Archiv in der Art, dass immer nur neue Elemente gesichert werden müssen, da sich alte Elemente nicht ändern sollten.

Archivierung ist nicht für eine Migration erforderlich !
Es gibt immer noch Archivhersteller, die ihre Archivlösung als Voraussetzung für eine Exchange 5.5 nach 200x Migration verkaufen wollen. Ein Archiv kann hier sicher unterstützen aber ist für eine Migration nicht erforderlich.

Das beste Produkt ?

Der Ansatz einer Archivierung ist nicht nur für Exchange relevant, sondern nahezu jede elektronische Information im unternehmen wird mit dem Alter immer unwichtiger und kann nach und nach von den schnellen teuren aktiven Servern auf ein langsameres, günstigeres und sichereres Archivsystem übertragen werden.

Daher funktionieren die meisten Archivlösungen nicht nur mit Exchange, sondern können auch als Archiv f��r Dateiserver oder ihre Buchhaltung dienen. Insofern gibt es kaum Archivserver für Exchange, sondern fast immer nur Archivserver, die auch Exchange unterstützen.  Der Archivierungsgedanke ist hierbei "global" zu sehen.  Dieser Ansatz ist auch richtig, denn eine Archivlösung ist in der Anschaffung nicht gerade billig und daher möglichst umfassen genutzt wird.

Ein Archivsystem entlastet die Hauptserver von alten Daten, reduziert das Datensicherungsvolumen, ermöglicht das Vorhalten von mehreren Versionen und spart damit auch Kosten ein. Das macht aber alles erst Sinn, wenn der Sekundärspeicher auch weniger Euro/Gigabyte kostet und nicht einfach nur eine Festplatte ist. Insofern bedeutet die Installation eines Archivsystems immer auch die Installation eines Servers oder zumindest eines Wechslers mit Bandlaufwerken, CD-Brenner, MO-Laufwerken oder anderen Speichermedien mit günstigen Preisen pro Gigabyte. Hinzu kommt natürlich eine entsprechende Verwaltungssoftware und Datensicherung des Archivs.

Auch die Integration in Exchange ist hierbei genauer zu betrachten. Zwar können nahezu alle System sauber alle Nachrichten in Exchange extrahieren und archivieren, aber der Zugriff über den Client muss ebenfalls bedacht werden. Nicht jede Software erlaubt eine einfache Ansicht der archivierten Daten auch per Outlook Web Access (OWA) oder Terminal Services. Und nicht jeder Archivserver kann damit umgehen, wenn ein Anwender umbenannt wird oder auf einen anderen Server verschoben wird.

Wenn Sie den Einsatz eines Archivsystems planen, dann sollten Sie auf jeden Fall einen guten Partner suchen. Diese FAQ-Seite kann hierzu keine ausreichende Informationsquelle sein. Zumal eine Archivierung für Exchange alleine nur ein Teil der Gesamtlösung ist. Auch Dateiserver und anderen Datenbestände haben die Eigenschaft, schnell zu wachsen und müssen auch betrachtet werden.

In der Regel finden sich aber in Firmen schon heute Archiv Server, welche meist in Verbindung mit SAP oder anderen auch vom Vorstand als "wichtig" eingestuften Prozessen integriert finden. Hierbei ist zu prüfen, ob für Exchange nun wirklich ein neues System gekauft werden muss, oder ob die Nutzung der bestehenden Archivlösung mit dem Einsatz des passenden Moduls möglich ist. Leider treffen bei dieser Diskussion oft scheinbar unvereinbare Welten aufeinander.