MSXFAQ MeetNow aktiv: Komm doch einfach dazu.

Sprachprofil in Teams

Bei mir hat sich Microsoft Teams am 3. März gemeldet, dass ich optional ein "Sprachprofil" einrichten kann. Diese Seite beschreibt, was es damit auf sich hat und wie was damit gesteuert wird.

 

Einrichten

Wenn Sie in ihrem Tenant nichts verändert haben, dann könnte bei ihren Anwendern folgende Meldung in Teams erscheinen:

Wenn Sie dann "Profil erstellen" starten, landen sie direkt in den Einstellungen

Beim Sprachprofil müssen Sie einen vorbereiteten Text einsprechen

Danach können Sie den Dialog schließen oder gleich noch ihr Gesicht mit erfassen lassen

Gesichtserkennung

Wenn Sie schon dabei sind, können Sie nun noch ihre Gesicht erfassen lassen, damit Microsoft Teams anhand dieser Informationen sie in einem Besprechungsrau, erkennen kann. Es fängt damit an, dass Sie direkt in die Webcam schauen sollen:

Danach werden Sie gebeten, in verschiedene Richtungen zu schauen. Teams unterstützt Sie dabei mit einer grünen Hilfslinie und meldet Probleme.

Sie müssen erst nach Links, dann nach Rechts, nach oben, nach unten, nach obenlinks, obenrechts untenrechts und untenlinks schauen. Das Verfahren unterscheidet sich daher von der Gesichtserkennung von Windows Hello. Hier kommt auch keine Infrarot-Kamera zum Einsatz sondern die ganz normale optische Kamera.

Einsatz

Ab sofort wird Teams zum einen Versuchen, ihre Person in Meetings zu erkennen. Dies ist z.B. für das Transcript interessant, um ihre Sprache zu dem Text zuordnen zu können. Mit den passenden Kameras kann Teams sie auch auf Bildern erkennen und kennzeichnen.

Die Funktion ist nicht notwendig, wenn jeder Besprechungsteilnehmer an seinem individuellen Endgeräte teilnimmt. Dann kann Teams schon allein über den RTP-Datenstrom die Audio/Video-Daten den einzelnen Personen zuordnen

Mit dem Wissen um ihre Sprache kann Microsoft Teams auch Umgebungsgeräusche besser ausblenden und ihre Sprache hervorheben. Sie sehen auch im Fenster, wenn die Funktion "Sprachisolation" aktiv ist:

Daten löschen

Wenn Sie als Anwender diese Funktion nicht mehr mehr nutzen wollen, können Sie in den Einstellungen ihre Daten auch wieder löschen: 

 

Damit werden die Daten sofort gelöscht. Microsoft hat aber noch weitere Löschfristen eingebaut. Wenn Sie das Teams Konto löschen, wird das Sprach- oder Gesichtsprofil nach 90 Tagen gelöscht. Wenn Sie mehr als 12 Monate inaktiv sind, dann werden die Daten auch entfernt. Als Anwender müssen Sie dann neu erfasst werden.

Hinweis im Transcript

In einem Teams Meeting mit aktiviertem Transcript können Sie ggfls. einen Hinweis auf die Spracherkennung erhalte.

Die Transcript-Funktion profitiert von diesen aufgezeichneten Sprachbeispielen, um den Sprecher anhand der Stimme zu erkennen. 

Admin-Steuerung

Ein Administrator kann über die Teams-PowerShell in der Meeting-Policy einstellen, ob die Anwender diese Funktion nutzen dürfen oder nicht. Er kann aber nicht vorschreiben, dass die Anwender sich registrieren müssen. Die letzte Kontrolle aus technischer Sicht bleibt beim Anwender.

Sprach und Gesichtserkennung erlauben

Set-CsTeamsMeetingPolicy -Identity Global -EnrollUserOverride Enabled 
Set-CsTeamsMeetingPolicy -Identity <policyname> -EnrollUserOverride Enabled

Ein "Disabled" verhindert die Nutzung der Funktion. Ab Mai 2025 soll die Steuerung in das Commandlet "Set-CsTeamsAIPolicy" erfolgen, da hier Sprache und Gesicht dann getrennt gesteuert werde können

Set-CsTeamsAIPolicy -Identity Global -EnrollFace Disabled

Einen Sonderfall nehmen "Teams Room Systems" ein. Technisch hat jeder Teams Raum ein eigenes Anmeldekonto und damit kann diesem Konto auch eine eigene Policy zugewiesen werden. Sie können hier bestimmen, ob die verschiedenen Sprecher im Raum nicht, nach ihrem Sprachprofil oder allgemein nach Sprecher 1,2, ..N in einem Transcript erfasst werden. Um die vom Anwender hinterlegten Sprachprofile zu nutzen, müssen Sie den Wert auf "Attribute" stellen

Set-CsTeamsMeetingPolicy -Identity <policy -RoomAttributeUserOverride Attribute

Bis die Richtlinie vom Raum angewendet wird, können angeblich bis zu 48h vergehen oder sie melden den Raum neu an, um den Vorgang zu beschleunigen.

Datenschutz

Eine quasi normierte "Sprachprobe" einer Person zur Erkennung des aktiven Sprechers in einem Besprechungsraum weckt natürlich Begehrlichkeiten. Offiziell werden die Daten natürlich nur innerhalb des Tenants und nur für Microsoft Teams Audio/Video verwendet. Microsoft schreibt dazu sehr ausführlich. Für mich ein Zeichen, dass hier die Personen sehr wohl die Brisanz solcher Daten erkannt haben.

Die Sprach- und Gesichtsdaten für Benutzer werden im Ruhezustand und während der Übertragung verschlüsselt und durch die Sicherheits- und Datenschutzrichtlinien und -praktiken von Microsoft geschützt. Microsoft greift nicht auf die Sprach- und Gesichtsdaten von Benutzern zu oder teilt sie mit Dritten, es sei denn, dies ist gesetzlich vorgeschrieben oder mit der Zustimmung des Benutzers.
Quelle: https://learn.microsoft.com/de-de/microsoftteams/rooms/voice-and-face-recognition#data-handling  

Verifizieren werden wir dies aber alles nicht können und letztlich bleibt nur das Vertrauen an die ordnungsgemäße Verarbeitung und Speicherung der Daten. Ich hinterfrage besser nicht, ob diese Sprachschnipsel auch genutzt werden könnten, um mittels KI eine synthetische Stimme mit meiner Stimmfarbe zu erzeugen.

Bei Überwachungen sehe ich weniger ein Risiko, denn schon heute wird ihr Bild beim Personalausweis und Reisepass elektronisch verarbeitet und staatliche Stellen haben schon lange die Möglichkeit, ihre Stimme zu erhalten. Sei es durch eine Telefonaufzeichnung, Mitschnitt einer Befragung oder ganz trivial aus Social Media-Aktivitäten. Wenn ich mir hier Sorgen machen sollte, dann dürfte ich keinen Podcast als auch keine Webcasts oder Videos auf YouTube o.ä. veröffentlichen. Es stellt sich dann eher die Frage, inwieweit eine Aufzeichnung generell als "authentisch" vor Gericht gewertet wird, wenn Sie per Computer und KI sehr einfach und für Menschen nicht erkennbar synthetisch hergestellt werden kann.

Weitere Links