Diktieren mit Office 365

Schon seit vielen Jahren kann Windows XP auf dem Bildschirm vorlesen. Fast genauso lange können Sie Windows über ihre Sprache steuern. Drittprodukte erlauben sogar das Diktieren von Texten direkt in Word und anderen Applikationen. Drittprodukte waren sehr oft aber branchenspezifisch, zum Beispiel für Rechtsanwälte oder Ärzte und nicht immer günstig. Seit Mitte 2018 enthält Office 365 Professional eine Diktierfunktion Ich hätte aber nie gedacht, dass ich diese Funktion so schnell einmal ausprobieren wollte.

Auslöser

Ich bin ein klassischer Tastatur Benutzer. Selbst auf dem Notebook nutze ich eher den Knubbel von Lenovo oder das Touchpad. Ich kenne auch die meisten Kurztasten, um Befehle in der entsprechenden Applikation schnell umzusetzen. Dazu benutze ich natürlich beide Hände, auch wenn ich kein perfekter aber doch zügiger 10-Finger-Schreiber bin. Mitte Oktober 2018 habe ich beim Umsteigen im Bahnhof einer Frau geholfen, den Kinderwagen die Treppe hinunter zu tragen. Leider habe ich dabei die letzte Stufe übersehen, bin umgeknickt und habe mich mit Arm abgefangen. Das unvermeidliche ist passiert, wenn Knochen auf Beton trifft und der Verlierer ist von vornherein klar: Mein Ellbogen war gebrochen und das bedeutete drei Wochen Gips am linken Arm im schönsten Net at Work Blau.

Damit stellen sich ganz neue Herausforderungen für das Drücken von Sondertasten CTRL-AL-DEL oder „@“. Es ist weiterhin eine große Einschränkungen beim Schreiben . Einer Hand ist nämlich deutlich langsamer als zwei Hände. Vor allem denn die Hand mit der Handfläche nach oben eingegipst wird, damit Elle und Speicher parallel liegen.

Diktieren mit Word, Outlook und Co

Es war schon ein ziemlich perfektes Timing, dass quasi im gleichen Monat Microsoft die Diktierfunktion in Word, Outlook, Excel und anderen Office 365 Professional Programmen freigeschaltet hat. Ein Erfassen einer neuen Mail oder in Word gibt es oben rechts ein kleines bläuliches Mikrofon.

Sobald sie diesen anklicken, startet die Diktierfunktion von Office 365. Meine Sprache wird aufgenommen, in die Cloud geschickt und dort im Text übersetzt. Der Text kommt dann zurück zum Programm und wird an der aktuellen Stelle eingesetzt. Interessant dabei ist, dass ich sehr schnell diktieren kann und der Text durchaus einige Worte später erst auf dem Bildschirm auftaucht. Wenn ich dann mit dem Satz fertig bin, stelle ich fest, dass Word oder auch die anderen Programme bereits geschriebenen Text nochmal nachträglich korrigieren und verändern. Sie sollten sich also nicht aus der Ruhe bringen lassen, wenn das was Sie gerade diktiert haben, nicht sofort korrekt auf dem Bildschirm erscheint Sobald sie wieder mit der Tastatur eingreifen, stoppt die Diktierfunktion sofort.

Wie beim Diktieren üblich, müssen sie natürlich Interpunktionszeichen mit diktieren. Die Diktatfunktion kann nicht selbst erkennen, wann ein Satz neu auf einer neuen Zeile beginnen soll oder wann ein Satz zu Ende ist und selbst ein "Komma" müssen sie diktieren. Das klingt letzt wie der Lehrer in der Deutschstunde, nur dass Office 365 ihr Schüler ist. Über die Diktat-Funktion lassen sich natürlich auch die ein oder anderen Steuerkommandos ausführen, z.B. um eine vorheriges Wort zu löschen oder eine Zeile zu löschen . die am häufigsten genutzten Worte von mir sind dabei:

Aktuell sind nur die Sprachen Englisch, Chinesisch und Spanisch Final. Deutsch ist aber schon mit aufgeführt, hat aber noch den Status "Preview". Ich bin dennoch positiv überrascht, wie zügig und effektiv ich darüber diktieren kann. Allerdings muss ich schon  jeden Text durchaus noch einmal überarbeiten. Dies ist übrigens schwieriger, als ich mir dies zuerst vorstellen, denn es ist ja mein persönlicher Text. Damit ist verbunden, dass ich Fehler sehr leicht überlese, weil ich genau weiß, was es hätte heißen sollen. Wenn es möglich ist, sollte jemand anderes natürlich diesen Text überlesen und die Fehler korrigieren. Die Erfahrung habe ich aber schon beim Schreiben meines Buches über Exchange 2003 gemacht, bei dem ein unabhängiger Lektor sehr viel mehr Fehler findet als der beste Autor bei der Selbstkontrolle. Ich bin aber sicher, dass Microsoft durch die Bereitstellung dieses Dienstes in der Cloud sehr viele Audiodaten bekommt um die Qualität zu verbessern. ich weiß allerdings nicht, ob meine nachträglichen Korrekturen in meinem lokalen Dokument an die Cloud zurückgemeldet werden und so als Basis für eine weitere Optimierung dienen können.

Selbst Programme, die nicht aus dem Office 365 Professional Paket kommen können von dieser Funktion profitieren. So habe ich in den drei Wochen mit Gips diverse Webseiten der MSXFAQ quasi in Outlook oder Word diktiert und den Text über die Zwischenablage dann in meinen Editor für die Webseite übertragen.

Einschränkungen

Dafür, dass ich teilweise mit dem Notebook-Mikrofon diktiert habe und die Software ohne manuelles Training auf meine Sprache auskommen muss, ist die Erkennungsrate schon sehr hoch. Aber Deutsch ist noch "Preview" und einige Einschränkungen haben ich schon gefunden, z.B. sind folgende Fehler sehr oft passiert:

  • Zahlen werden manchmal komisch aus geschrieben
    So geht aus einem 2008 gerne auch mal ein „2 Tausend 8“
  • Großschreibung am Satzanfang
    Wenn ich einen Satz mit einem Punkt beende, dann sollte es danach auch mit einem Großbuchstaben weitergehen. Das gelingt eher selten
  • Verpasste Korrektur
    Sehr häufig ist es passiert, dass nach dem Diktat Texte rot unterstrichen sind. Die Office Rechtschreibprüfung erkennt, dass hier etwas falsch ist und schlägt sogar die richtige Lösung als erste Option vor. Wenn ich sehe, wie das Diktat Sätze und Worte nachträglich verändert, dann wäre es doch ein Leichtes, auch diese Korrekturen gleich mit umzusetzen und zu kennzeichnen.
  • Ersetzungen wie "Zum Beispiel" nach "z.B."
    Diese und andere Abkürzungen werden in der Regel ausgeschrieben.

Da ist sicher noch mehr Luft nach oben aber ich werde die Funktion auf jeden Fall weiter beobachten.

Andere Systeme

Neugierig geworden habe ich nun natürlich auch noch mal mein IPhone zur Hand genommen. Ich spreche da nun nicht auf Siri oder die anderen Helfer wie Alexa, Google, Cortana u.a. an, die eher Befehle verstehen, sondern due Diktierfunktion, die z.B. in IOS enthalten ist.

Testweise habe ich auch hier Mails und WhatsApp-Meldungen diktiert statt per Bildschirmtastatur einzugeben. Das hat ebenfalls sehr gut geklappt, wobei ich hier natürlich viel weniger Text generiert habe.

Allerdings sollten Sie bedenken, dass eine Spracherkennung grundsätzlich am besten mit einer natürlichen Stimmlage, Hochdeutsch und einem ruhigen Hintergrundpegel funktioniert. Insofern habe ich Hoffnung, dass morgen in der Bahn nicht alle Menschen ihr Telefon per Sprache zutexten und auch im Büro der Einsatz unter kontrollierten Bedingungen erfolgt. Vielleicht ist aber genau das dann wieder die Domäne der Noise Cancelling Headsets, die Nebengeräusche ausblenden und den Sprecher zu einer leiseren Sprechweise bringen können.

Ausblick

Dennoch sehe ich in der Funktion Diktieren, die mit jedem Tag sicher besser werden wird, eine interessante und vor allem für viele Personen schnellere Möglichkeit, Text einzugeben. In Exchange Unified Messaging haben wir schon lange gesehen, dass Sprache zu Text umgesetzt werden kann, auch wenn damals das Ergebnis durchwachsen war.

Die Spracherkennung ist aber z.B. für Menschen mit Hörproblemen sehr interessant, um Vorträge als Textuntertitel zu verfolgen. Wenn dann der Leser noch Sprache vorgeben kann und eine maschinelle Übersetzung gleich mit erfolgt, dann öffnet dies ganz neue Wege der Kommunikation.

Weitere Links