Power BI und Beziehungen

Wenn Administratoren mit Power BI in CSV-Dateien rumstöbern, dann arbeiten Sie anfangs fast immer mit einer CSV-Datei, in der diverse Daten aber mehrfach vorkommen. Diese Seite erklärt, wie Sie mit Power BI Beziehungen hier effektiver arbeiten

Ausgangssituation

Stellen Sie sich vor sie bearbeiten eine IIS-Log oder ein Exchange Message Tracking. In beiden Logs erscheinen IP-Adressen von Clients oder SMTP-Adressen von Empfängern. für bestimmte Auswertungen ist aber die individuelle IP-Adresse oder Mailadresse gar nicht wichtig. Sie denken in "größeren" Dimensionen und möchten eigentlich nur den Standort des Senders und Empfänger erhalten. Ich habe anfangs auch erst versucht, die "Datenbank (Lies: CSV-Datei) mit den relevanten Message-Tracking Dateien einfach um Spalten für die "Quellsite" und "Zielsite" zu bereichern. Das geht per Powershell schon zügig. In einem anderen Fall hatte ich eine Liste von Postfächer mit den Größen der Mails und der Datenbank aber in einer zweiten Datei die Information welche Datenbank auf welchem Server lag und dann die Information, welcher Server in welcher AD-Site ist.

Gesucht wird eine Lösung, wie ich z.B.: aus der Liste der Postfächer mit ihrer Größe und der Datenbank z.B. ein Kuchendiagramm der Verteilung nach AD-Standort erhalten kann

Daten in Beziehung bringen

Zuerst habe ich also wieder die verschiedenen CSV-Dateien eingebunden und dann über den dritten Reiter in Beziehung gebracht. Wenn die Spalten sogar gleich heißen, dann kann eine "Autoermittlung" gestartet werden.

Hier wird nun das Feld "DatabaseName" aus der Liste der Postfächer auf das Feld "DatabaseName" in der Liste der Postfachdatenbanken verknüpft

Daten visualisieren

Im nächsten Schritt kann ich dann in der Visualisierung als Legende z.B. die ADSite aus der Liste der Datenbanken nutzen und als Wert z.B. die Anzahl des Alias aus der Tabelle Mailboxdata. Damit wird das Diagramm viel aussagekräftiger als eine Zusammenfassung nach Datenbankname:

Das linke Bild zeigt die Verteilung nach den AD-Sites, ob wohl diese Information nicht direkt in der Mailboxtabelle enthalten ist. Rechts ist die Ansicht nach der "HomeMDB" jeder Mailbox zu sehen. Man sieht zwar viele Daten aber hilfreich ist es nicht

Vorbereitung ist alles

Mit diesen "neuen" Möglichkeiten quasi per Mausklick ohne Kenntnisse von SQL-Befehlen wie JOIN, INNER JOIN, OUTERJOIN so verknüpfte Daten zu erstellen, eröffnet ganz neue Möglichkeiten. Damit verliert auch eine Normalisierung von Datenbanken und CSV-Dateien etwas ihre Schrecken und Skripte, die die Eingangsdaten generieren, müssen nicht mehr mühselig zusätzliche Informationen beisteuern.

Auf der anderen Seite werde ich aber z.B. beim Messagetracking lieber im Skript schon die Mailadressen der Absender und Empfänger durch eine AD-Site oder den Ziel-Connector ersetzen. Hier sind aber Datenreduktion (Größe) und Datenschutz (Reduzierung der Tiefe) wichtig.

Weitere Links