Teams Noise Supression

Im Okt 2020 haben Teams und Office 365 Administratoren eine Ankündigung über eine neue Funktion gelesen: Teams versucht Hintergrundgeräusche zu eliminieren. Verwechseln Sie diese Funktion nicht mit der Noise Cancelling-Funktion eines Headset-Mikrofons oder der Lärmunterdrückung eines Kopfhörers. Es geht hier um die Nebengeräusche, die ein Mikrofon aufnimmt und nicht an die anderen Teilnehmer des Meetings übertragen werden sollen. Microsoft hat diese Funktion vorab schon am Beispiel einer Frau im Homeoffice demonstriert, bei der im Hintergrund ein Staubsauger lärmt. Eine ähnlich Funktion konnten Besitzer einer "NVIDIA" -Grafikkarte schon länger nutzen. Damit hat NVIDIA quasi demonstriert, was Signalverarbeitung heute schon leisten kann

In der Einleitung habe ich schon drei Bereiche zu "Noise Supression/Cancelling" beschrieben, auf die ich hier noch einmal genauer eingehen will. Einige Funktionen gibt es nämlich schon heute und wir müssen hier auch zwischen "Störgeräusche (Noise)" und "Echo" unterscheiden.

Cancellation im Mikrofon

Jedes gutes Headset versucht nicht nur die Stimme des Sprechers möglichst gut aufzunehmen sondern filtert möglichst auch Nebengeräusche heraus. Es gibt dazu mehrere Wege, die oft auch kombiniert werden.

  • Charakteristik Niere/Kugel/Keule
    Schon die Bauart eines Mikrofons hat großen Einfluss, aus welcher Richtung die unterschiedlichen Frequenzen abgenommen werden. Ein Kugel-Mikrofon ist für Sprache nicht gut geeignet. Eine Niere mit der Mitte zum Sprecher blendet schon physikalisch viele Dinge aus, die man später nicht mehr wegretuschieren muss
  • Dämmung
    Wir kennen alle die Schaumstoff-Überzüge, Popp-Schutz-Membrane bei Podcast-Mikrofonen oder die Felle bei Außenmikrofonen. Auch beim Headset kann ein Dämmstoff
  • mechanische Kompensation
    Sennheiser hat mir mal gezeigt, dass deren Mikrofon-Kapsel von beiden Seiten den Schall aufnimmt. Da Fremdgeräusche auch beide Seiten der Membran quasi zeitgleich und mit gleicher Stärke erreichen, heben sie sich auf. Die Sprecherstimme hingegen kommt nur von der Vorderseite und wird damit erfasst.
  • elektronische Kompensation
    Ein schlechtes Signal kann man per Software nur eingeschränkt verbessern. Aber in Grenzen kann die Lautstärke (und damit auch das Rauschen) angehoben oder vermindert werden. Immer bessere Signalprozessoren versuchen auch die Sprache zu erkennen und Nebengeräusche elektronische zu unterdrücken. Oft hilft ihnen dabei aber einfach ein zweites oder dritten Mikrofon auf dem dem Mund abgewendeten Seite, um die Nebengeräusche von dem direkten Signal zu subtrahieren.

Das Ziel all dieser Optionen ist ein möglichst klar verständliches Sprachsignal für die weitere Verarbeitung, welches ausreichend laut und möglichst ohne unerwünschte Nebengeräusche und minimaler Verzögerung bei der nächsten Stufe ankommt.

Cancellation im Headset

Die zweite Stelle zur besseren Verständigung ist beim Empfänger zu sehen. Gerade in lauteren Umgebungen fällt es dem Zuhörer schwerer, der Sprache im Headset zu folgen. Der geringste Schutz haben hier eine Freisprecheinrichtung oder Lautsprecher im PC oder Monitor. Das funktioniert nur in einem abgeschlossen Raum ohne weitere Geräuschquelle. Auch die anderen Büronutzer würden durch so eine "Sendung" beeinträchtigt.

Monoaurale Headsets mit aufliegenden Hörern sind sehr angenehm zu tragen aber schirmen wenig Umgebungsgeräusche ab. In ruhigen Umgebungen funktioniert dies dennoch gut. Wenn es aber lauter wird, dann geht der Trend zu Headsets mit beidseitigen Hörern und teilweise geschlossenen Ohrmuscheln.

Die Krönung sind hier natürlich Headsets mit aktiver "Noise Cancellation" mit Gegenschall. Dabei nehmen Mikrofone am Kopfhörer die Umgebungsgeräusche auf und versuchen diese mit gegenläufigem Lärm letztlich aufzuheben. Die Technik ist schon einige Jahre alt und wer z.B. Langstrecke fliegt, wird so einen Kopfhörer nicht mehr missen wollen. Er senkt die Lärmbelastung speziell für tiefe Töne sehr wirksam, so dass Sie die Lautstärke des Entertainments deutlich niedriger einstellen können. Das gleiche Verfahren hilft und nun bei der Sprachverständigung in lauten Umgebungen, indem der Lärm eliminiert und damit die Sprache besser verstanden wird.

Teams Echo Cancellation

Unter der Funktion "Echo Cancellation" verstehen wir aber einen anderen Ansatz, der die Sprache und Wiedergabe auf einer Seite optimiert. Der klassische Einsatzfall ist, dass das Mikrofon auch den Ton der Gegenseite z.B. aus einem Lautsprecher aufnimmt. Das ist der Fall, wenn Sie z.B.: über eigene Boxen oder Monitore den Ton wiedergeben aber mit einem Ansteck-Mikrofon oder sogar einen Podcast-Mikrofon arbeiten. Ich habe selbst so eine Konstellation, die sie etwa so darstellt:

Der Ton einer Konferenz kann ja per Lautsprecher unter dem Monitor oder sogar aus dem Laptop ertönen, und in meinem Fall gibt es neben dem Headset noch weitere Orte, wo ein Mikrofon meinen Ton aber auch die Wiedergabe aufzeichnen kann:

  1. Webcam
    Die meisten externen Webcams haben auch ein Mikrofon, welches durchaus gut die Stimme des Sprechers aufnehmen kann, wenn er denn nahe genug dabei ist.
  2. Lavalier-Mikrofon
    Sie kennen sicher die klassischen Mikrofone aus Talk-Shows, bei denen am Hemdkragen oder Ausschnitt ein kleines Mikrofon die Sprache aufnimmt
  3. "Podcast-Mikrofon"
    Wer einen "guten Klang" speziell für Webcasts o.a. möchte, kann auch ein dickes Podcast-Mikrofon einsetzen.

Nicht aufgelistet habe ich hier nun das Headset selbst, denn wenn ich ein Headset zur Aufnahme meiner Sprache nutze, dann nutze ich auch den Lautsprecher des Headsets. Zwar gibt es auch hier geringe Rückkopplungen aber die sind sehr einfach zu eliminieren. Bei allen drei anderen Mikrofonen besteht aber ganz klar das Risiko, dass die per Lautsprecher wiedergegebenen Töne vom Mikrofon direkt wieder erfasst werden. Je nach Ausprägung führt dies zu:

  • Rückkupplungen/Pfeifen
    Das passiert aber meist nur, wenn der Abstand sehr nahe ist.
  • Echo
    Störender sind aber die Echos bei der anderen Seite des Gesprächs. Wenn der andere Teilnehmer etwas sagt, dann dauert es 50-100ms, bis der Ton bei ihnen wiedergegeben wird und die gleiche Zeit wieder zurück. Der Aktive Sprecher hört seine eigenen Worte mit 100-200ms Verzögerung, was sehr irritierend ist. Sie selbst bemerken dies in der Regel nicht.

Der Effektiv kann durch Software und Hardware reduziert oder eliminiert werden. So gibt es Konferenz-Spinnen, z.B. das Jabra Speak 410, welche keinen Duplexmode unterstützt, Wenn es also annimmt, dass Sie sprechen, dann wird der Lautsprecher stumm geschaltet und umgekehrt. Erst das 510 erlaubt wohl einen echten Duplex-Betrieb und rechnet die Differenzen raus.

Die gleiche Funktion macht meiner Ansicht nach aber auch Teams schon länger. Wenn ich in obigem Setup nämlich den Ton über den Bildschirmlautsprecher ausgebe und gleichzeitig spreche, dann hört die Gegenseite nur meine Sprache aber nicht sich selbst.

Ich kann mir das nur so erklären, dass Teams aus meinem Sprachsignal die Töne aus der parallel erfolgten Wiedergabe meines Gesprächspartners heraus rechnet. Das Podcast-Mikrofon hat nichts mit dem Lautsprecher gemein

Teams Background Noise

Kommen wir nun zu dem neuen Feature, welches Ende 2020 auf dem Client eingeführt wurde. Teams nimmt weiterhin die Sprache über das Mikrofon auf und versucht nun Störgeräusche per Software zu eliminieren. Damit sind also nicht die Echos von anderen Sprechern sondern der Lärmpegel im Hintergrund gemeint. Wenn Sie also in einer Hotel-Lobby, am Flughafen, am Küchentisch oder anderen Umgebungen mit Fremdgeräuschen sitzen, dann soll Teams die Sprache erkennen und den Rest entfernen.

Die Einstellung verbirgt sich unter den Einstellungen zu den Geräten.

Die Funktion wird im Laufe Novembers ausgerollt und erscheint nicht bei allen Mandanten zur gleichen Zeit.

Weitere Links

Noise Suppression in Microsoft Teams (your co-workers will thank you)
https://www.youtube.com/watch?v=CpCXByLYU08&feature=youtu.be&ab_channel=MattSoseman