Cloud Netzwerk Assessment

Wenn Sie diese Seite lesen, dann nutzen Sie die Cloud entweder noch nicht umfangreich und sind unsicher oder sie nutzen schon Cloud-Dienste aber haben Probleme. Dann sollten Sie weiterlesen, denn ich möchte ihnen ein Angebot machen.

Pilot oder Produktion

Aus meiner Sicht lassen sich Firmen bezüglich Cloud-Nutzung im Jahr 2021 in zwei Gruppen aufteilen:

  • Nutzen noch keine Cloud oder nur wenige Pilotbenutzer
    In den Anfängen von Office 365 wurde ich häufiger gebeten, bei der Bandbreitenschätzung und "Cloud Readyness" zu unterstützen. Wir haben lokale Quellen ausgewertet, um Rückschlüsse auf Datenmenge und erforderlichen Durchsatz zu erhalten und die vorhandenen Leitungen mit synthetischer Last beaufschlagt.
    Niemand wollte das Risiko eingehen, dass mit einer schnelle Migration in die Cloud oder insbesondere Adoption neuer Dienste wie Teams die Zufriedenheit leidet oder bestehende Dienste gestört werden.
  • Nutzen schon Cloud...
    ...aber haben handfeste Probleme oder auch nur das vage Gefühl, dass die Performance und Qualität nicht optimal ist. Gerade durch COVID 19 kam vieles anders und viele Firmen haben sehr schnell Dienste in der Cloud aktiviert. Spätestens durch die "Back to Work"-Bewegungen wird nun aber der Internetzugang der Firma gestresst.

In beiden Fällen haben Kunden sehr viele Fragen zu Verwaltung der Identitäten und Authentifizierung, Lizenzierung und Konfiguration. Dass dazu aber auch das Fundament aus Netzwerk, Firewall, Proxy-Server, Namensauflösung etc. stehen muss, wird zwar nicht ignoriert aber es traut sich nicht jeder an diese "unbekannte" Thema heran. Wer Teams erfolgreich einführt und neue Funktionen zeigen kann, gewinnt nun mal eher einen Blumentopf als der Netzwerker, der immer nur bei Problemen gerufen wird.

SNMP ist nur Teil der Lösung

Ein Netzwerk Assessment dreht sich natürlich zu allererst um das Netzwerk. Dabei geht es mir aber nicht um Fingerpointing sondern dem Verständnis. Dazu nutze ich gerne einen Vergleich:

Sie sind Pförtner am Werkstor und die zählen und wiegen alle ein- und ausfahrenden Fahrzeuge. Welche Aussagekraft haben diese Messungen bezüglich der Warenlieferung beim Kunden? Eigentlich keine, denn schon am nächsten Kreisverkehr könnte ein Unfall die Straße blockieren oder auf der Autobahn könnte ein Stau den Transport verzögern. Genau das ist heute in der Regel eine Messung per SNMP: Sie zählen die Anzahl und Größe der übertragenen Datenpakete und erstellen schöne Grafiken mit einer Auflösung von 1 Minute.

Es kommt noch schlimmer: Wenn wirklich ein Unfall auf der Zufahrt die Lieferung verzögert, dann sieht der Pförtner nur das keine Fahrzeuge mehr ankommen, d.h. das Werktor ist "frei". Im übertragenen Sinne könnten Sie behaupten, das die Bandbreite gar nicht ausgenutzt wird. Nun kommt z.B. Teams und sendet 50 Pakete/Sekunde a 160 Bytes (VoIP) und erwartet eine maximale Roundtriptime von 100ms und weniger als 1% Paketloss. Solche Daten können sie über einfaches Monitoring nicht messen.

Vielleicht verstehen Sie nun besser, dass die Nutzung von Cloud-Diensten ganz andere Anforderungen an ihre Umgebung stellen. Das gilt aber nicht nur für Netzwerker sondern genauso für Applikations-Verantwortliche und Programmierer. Dies ist nicht auf Microsoft 365 der Azure beschränkt. Auch Nutzer von AWS, Google u.a. Plattformanbieter stehen vor den gleichen Herausforderungen.

Die Verlagerung von Diensten von lokalen Servern mit <1ms Roundtriptime und quasi unlimited Netzwerkbandbreite in eine Cloud mit vielfacher Roundtriptime und beschränkter Bandbreite. Hier sind alle Teilnehmer, d.h. Netzwerker, Applikationsentwickler, Servicebetreiber und sogar die Anwender gefordert. Wir kümmern uns nun erst einmal um das Netzwerk.

Assessment

Daher häufen sich die Anfragen in der Form: "Wir haben schlechte Teams-Qualität, könnten Sie mal kurz schauen". Das machen wir natürlich gerne, denn wir haben bei Net at Work sowohl die Expertise im "Netzwerk", d.h. wir sprechend WireShark, SNMP, DNS etc., aber wie kennen auch die Applikationen und wie diese ticken. Daher führen wir schon mehrere Jahre ein Netzwerk Assessment mit Schwerpunkt Microsoft Cloud durch. Die Bausteine sind schnell erklärt:

Baustein Beschreibung
Baustein 1:
Informationsaustausch

Wenn ir ihre Umgebung noch nicht kennen, dann erarbeiten wir gemeinsam das erforderliche Wissen. Neben einem qualifizierten Net at Wok Consultant gehört dazu auch immer 1-2 Personen aus dem Netzwerk-Team und 1-2 Personen aus dem Office/Windows-Team. Im Dialog mit Folienbegleitung erläutern wir, wie Microsoft 365 ihr Netzwerk verwendet und was Microsoft als Backend betreibt. Sie kennen vielleicht die "Office 365 Netzwerk Microsoft Empfehlungen" einer korrekten Konfiguration ihres Netzwerks für die Microsoft Cloud aber wir gehen weiter und prüfen, ob dies der Fall ist und zeigen auch die negativen Auswirkungen einer ungünstigen Konfiguration. Wir erklären ihnen auch das Warum und Wiso zu den Vorgaben

Diese 4-8 Stunden vermitteln geballtes Wissen, was viele schon vorher kannten aber nicht abrufbar war. Kennen Sie noch die Zusammenhänge von Latenzzeit, WindowsSize, Packetloss und Durchsatz, warum Tunnel-VPNs oder UDP-Blockaden für Teams ineffektiv sind oder sie bitte keine "Public DNS-Server" nutzen sollten oder SNMP-Monitoring bei der Cloud wirkungslos ist?

Baustein 2:
Einrichten

Mit dem Vorwissen gehen wir daran, ihre Probleme oder Fehler einzukreisen und zu beheben. Dazu werden an gemeinsam festgelegten Punkten entsprechende Tools eingesetzt, die Verfügbarkeit, Konfiguration und Latenzzeiten kontinuierlich messen. Ggfls. sind Ports in Firewalls zu öffnen und dedizierte Probe-Systeme bereitzustellen. Schon der der Phase zeigt die Praxis, dass dieses Setup manchmal zu einer Dauerinstallation wird.

Die Werkzeuge sind z.B. meine Ende zu Ende-Skripte mit CSV-Dateien oder PRTG als Speicher, andere vorhandene Werkzeuge (Werkzeuge für ein Network Assessment) des Kunden und in selteneren Fällen die Überwachungsfunktionen von Routern (End2End-Router)

Baustein 3:
Messen

Die nächsten meist 7-14 Tage erfassen mindestens eine komplette reguläre Arbeitswoche umfassen. In der Zeit wird das Setup überwacht, dass alle Sensoren auch Daten liefern Oft finden wir schon hier erst Fehler und Probleme und man steckt in der Zwickmühle, ob man diese nun gleich korrigiert oder erst nach Ende und Auswertung anpasst. Die Praxis zeigt: Klar erkannte Fehler werden wenn möglich schnell korrigiert.

Baustein 4:
Nacharbeiten

Nach Abschluss der Erfassung werden wir gemeinsam die Messwerte analysieren und können danach Aussagen zur aktuellen Qualität aber auch möglicher Optimierung machen.

Wie umfangreich das gesamte Paket ist, hängt auch etwas von dem Vorwissen und den Problemen ab. Vor Covid19 bin ich meist zwei Tage vor Ort beim Kunden gewesen, um Baustein 1 und 2 abzuarbeiten und dann 1-2 Wochen später habe ich mir aus der Ferne die Daten geholt, ausgewertet und vorgestellt. Je nach Kunden haben wir aber nach der Analyse auch direkt die Änderungen eingeleitet. Es gab sogar Kunden, wo schon beim Baustein 1 die Probleme dingfest gemacht werden konnten. Da hat es quasi schon gereicht die Kommunikationswege der Cloud, insbesondere von Microsoft Teams zu verstehen, dass die Netzwerker selbständig optimieren konnten. Da reichte schon meine Rolle als "Moderator und Übersetzer" zwischen den verschiedenen Fachabteilungen.

Ein Zeitaufwand ist daher nicht einfach anzugeben. Gehen Sie mal von 2-3 Personentagen an externer Dienstleistung und ca. 4-6 Personentagen interne Mitarbeiter aus.

Weiterentwicklung

Das erste Assessment hat das Ziel mit überschaubarem Aufwand (2-3 Tage) sowohl Wissen zu vermitteln als auch Problemstellen zu erkennen und zu beseitigen. Oft geht es danach aber weiter, denn auch ein Netzwerk und die Anforderungen an die Dienste in der Cloud verändern sich. In eher seltenen Fällen wir das Test-Framework wieder komplett abgebaut. Oft erkennen die verantwortlichen Personen im Bereich Netzwerk aber auch Microsoft 365, dass die neuen Möglichkeiten auf Dauer genutzt werden sollen. Aber durch die Cloud gibt es weitere Kennzahlen, die erhoben werden und in die Überwachung einfließen können.

  • Cloud Connectivity
    So hat Microsoft selbst einen "Microsoft 365 Netzwerk Connectivity"-Bereich im Portal, in dem Anfang die OneDrive-Clients verschiedene Telemetrie-Daten liefern. Diese Lösung steckt auch im Sommer Jahr 2021 noch in den Kinderschuhen und ich bin sicher, dass Microsoft viel mehr Daten hat. Die Bereitstellung an Sie als Kunden hat wohl weniger Priorität
  • Microsoft Teams CDR
    Auch Microsoft Teams protokolliert alle VoIP-Verbindungen in einer Datenbank, welche sogar neartime abgefragt werden kann. Gerade wenn pro Standort quasi immer einige Benutzer mit Teams in der Cloud kommunizieren, erhalten Sie viele Daten, die indirekte Rückschlüsse auf ihre Cloud-Performance liefern.

So gibt es noch viele weitere Datenquellen, aus denen Sie wichtige Kennzahlen für ihren Betrieb und ihre Überwachung herleiten können. Allerdings müssen Sie dann schon auch nach einem Speicherort suchen, in dem Sie diese Daten strukturiert ablegen und auswerten. Das kann eine Monitoring-Plattform wie PRTG, Nagios/Icinga, Grafana, Graylog o.a. sein.

Diese weitergehende Kopplungen und Weiterentwicklungen sind natürlich nicht Bestandteil des initialen Assessment.

Weitere Links