Large Gallery View / 7x7 Video (49 Teilnehmer)

Lange Zeit war Video ein "Nice to have" aber mit Covid-19 wurde deutlich, dass Video durchaus "Nähe" aber vor allem auch Engagement vermittelt. Waren zuerst bis zu 4 sichtbare Teilnehmer möglich, wurde im Juni 2020 schon die 3x3 Ansicht mit bis zu 9 Teilnehmern freigeschaltet. Aber auch reicht nicht, wenn Sie z.B. eine größere Teilnehmergruppe (Schulklasse) betreuen, dann ist eine visuelle Präsenzanzeige schon ein Vorteil, selbst wenn das Bild sehr klein ist.

So sieht es aus

Die Funktion 7x7 ist aktuell im "Preview", d.h. bestimmte Tenants können die Funktion schon vorab nutzen und ich selbst war schon einen entsprechenden Meeting mit so vielen Anwendern als Teilnehmer eingeladen. So könnte das mit 49+1 Teilnehmern dann aussehen:

Natürlich sind das dann keine FullHD-Bilder mehr sondern deutlich kleinere Bilder, die aber schon einen Rückschluss auf die Teilnehmer zulassen. Allerdings ist diese Ansicht wohl nicht per Default aktiviert, sondern muss jeder Teilnehmer für sich selbst erst freischalten. So kann z.B. der Lehrer sich die 7x7-Ansicht anzeigen lassen aber die Schüler betrachten nur den Lehrer oder Sprecher oder z.B. die per Video übertragene klassische Tafel. Nicht jeder möchte mit dem Whiteboard arbeiten. Wenn weniger Personen teilnehmen, dann werden Bilder so dynamisch größer gemacht, dass es es keine schwarzen Flächen gibt.

Die präsentierende Person sollte in dem Zuge natürlich überlegen, ob wie ihr lokales Setup aussieht. Wer die Teilnehmer in der 7x7-Ansicht sehen will, sollte besser einen zweiten Monitor nutzen, damit der eigene Hauptbildschirm für Chat und insbesondere die Freigabe von Dokumenten voll nutzbar bleibt.

Interessant ist, dass die "große Ansicht" per Default da nicht eingeschaltet ist, sondern jeder Teilnehmer für sich entscheidet, ob er nur die 3x3 oder bis zu 7x7 Personen sehen will. Die Option verbirgt sich aktuell noch den drei "Punkten"-Menü. (Im Englischen wohl auch als Elipse bezeichnet). Auf diesem Bild ist das Menü auch nicht mehr unten in der Mitte, sondern oben rechts.

Aus meiner Sicht gibt es aber noch durchaus Verbesserungspotential. Je mehr Personen ihr Video teilen, desto weniger Platz bleibt für eine "Teilnehmer-Liste" und die Informationen aus dieser Liste, z.B. wer gerade spricht, gemutet ist oder die Hand gehoben hat. Das könnte Microsoft z.B. durch entsprechende Symbole oder farbige Rahmen sichtbar machen. Mal sehen, was aus dem Feedback wird

Technik

Natürlich hat mich interessiert, was da im Hintergrund passiert. Wenn 49 Personen ihren Video-Strom an die Konferenz-MCU senden, dann wollte ich schon wissen, ob dann 49 kleinere Streams bei mir ankommen oder es ein Stream mit einem Bild ist. Im zweiten Fall müsste Microsoft die Bilder mischen was durchaus eine gewisse Anforderung an die Leistungsfähigkeit der MCU stellt.

Was ich bislang (Ende Jun 2020) festgestellt habe ist, dass mein Client als Teilnehmer in einem 7x7-Meeting nicht mehr aber auch nicht weniger Daten sendet. Da alles verschlüsselt ist, kann ich das nur anhand der Paketanzahl und Größen analysieren. Aber H264SVC sind ja mehrere Streams mit I-Frames, P-Frames und B-Frames und da die alle unterschiedlich groß sind, kann man anhand der Größenverteilung in etwa erkennen, was da gesendet wird.

Interessanterweise sind aber die eingehenden Daten genau so aufgebaut. Würde Microsoft nun wirklich von 49 Teilnehmern das kleine CIFS-Video senden, dann müsste ich 49 kleine CIFS-Streams sehen. Wenn ich dann einen Teilnehmer maximiere, müssten die kleinen Streams zugunsten eines großen HD-Streams verschwinden. Das ist aber nicht passiert.

Die einzelnen Wireshark-Traces erspare ich ihnen. Details finden Sie aber dazu auf Video-Codec und VoIP Sniffer

Im Umkehrschluss bedeutet das aber, dass Microsoft die Bilder neu berechnet. d.h. 49 Teilnehmer senden alle ihren H.264SVC-Stream an Microsoft, die dann daraus ein "Gruppenbild" mit 49 kleinen Videos machen und diese an die Teilnehmer senden, die dieses Video anfordern. Das bedeutet für die Teilnehmer, dass Sie in etwas die gleiche Datenmenge empfangen, wie bei einem 1:1 Video-Call. DAs stimmt so natürlich nicht ganz, weil sich auf einem 7x7-Bild prozentual viel mehr Pixel ändern als bei einem einzelnen Kopf mit statischem Hintergrund.

Weitere Links