QoS Sprache

Wer schon etwas älter ist, kann sich noch an die frühen transatlantischen Telefonate erinnern. Es dauerte etwas Zeit, bis mein Wort auch "drüben" angekommen ist und die Antwort mein Ohr erreicht hat. Entsprechend mussten die Teilnehmer schon eine gewisse Sprachdisziplin an den Tag legen, wie dies früher in den ersten Chatfenstern und CB-Funk üblich war. Nach dem eigenen Satz oder Nachricht sollte man etwas Zeit vergehen lassen, damit der Gesprächspartner antworten kann. Wer zu früh weiter redet, provoziert eine Überlappung, bei der beide erst mal innehalten.

Was ist Sprachqualität ?

Was macht nun aber ein gutes Telefonat in technischer Hinsicht aus ? Es sind zwei wesentliche Faktoren:

  • Audioqualität
    Eine Komponente ist der Klang selbst, welcher durch die Aussteuerung bei der Aufnahme (Mikrofonleistung), die verwendeten Codecs (Kompressionen) und der Qualität der Wiedergabe. Es gibt wirklich qualitative deutliche unterschiede von Headsets und Mikrofonen. Günstige Geräte müssen nicht schlecht sein, aber sind es leider doch allzu oft. Darunter leidet dann die Verständlichkeit. Es macht durchaus Sinn, Wideband und echokompensierte Mikrofone und hochauflösende Webcams einzusetzen, da gutes Ausgangsmaterial eine wichtige Basis für ein gutes Ergebnis nach der Kompression und Übertragung sind.
  • Laufzeit, Kontinuität, Verzögerung
    Der zweite Faktor ist durch den Anwender weniger zu beeinflussen, sondern Bestandteil des Übertragungsweg. für die Sprach und Bildkomprimierung muss der Codec einen Buffer betreiben, der natürlich etwas Zeitverzögerung mit sich bringt. Und dann gibt es natürlich die Laufzeit der Paket über ein paketvermitteltes Netzwerk. Abhängig von Belastung, Weitverkehrsverbindungen und verschiedenen Leitwege können Pakete unterschiedliche Wege und Laufzeiten haben. Am Ziel müssen die Pakete als wieder in die Reihenfolge gebracht werden. Auch dazu muss der Codec auf das langsamste Paket warten oder welche weg lassen. Das kann zu Aussetzern und Fremdgeräuschen führen..

Beide Faktoren beeinflussen maßgeblich die Akzeptanz dieser neuen Art zu kommunizieren. Wenn Sie sich überlegen, wie viel Geld einige Tischtelefone kosten, sollte es also kein Problem sein, ein paar gute OC-kompatible Endgeräte zu organisieren.

Codec

Der Codec, welcher die Sprache umsetzt hat direkten Einfluss auf die Qualität und einige Codecs können sogar mit schlechten Leitungen" besser umgehen als andere. Schon beim Wechsel von einem analogen Telefon auf ISDN hat sich die Sprachqualität damals stark gebessert. Das lag aber weniger an ISDN denn an der direkten Digitalisierung am Telefon und dem Wegfall langer analoger Strecken. Bei VoIP können Codecs folgende Methoden einsetzen, um Probleme der Übertragung zu reduzieren.

  • Kompression
    Technisch ist ISDN mit G.711 ein mit 64kbit (160 x 8bit Samples alle 20ms) ein einfacher Codec ohne Kompression o.ä. In den frühen Tagen von ISDN war CPU-Leistung nun mal knapp bemessen. Heute ist Kompression kein Problem mehr und neben der Einsparung von Datenmengen werden die Pakete damit auch "kürzer" und damit auch etwas schneller. Bei GSM werden Codecs verwendet, die nur 22,8kbit/s oder sogar nur 12,2kbit/s benutzen dürfen
  • Änderungen des Sampling-Rate
    Ein zweiter Weg ist einfach die Audiosignale anders zu digitalisieren. Ein Codec kann z.B. längere Abschnitte (30 oder 40ms statt 20ms) abtasten und in ein Paket verpacken. Damit gibt es weniger Pakete und weniger Overhead aber die Latenzzeit erhöht sich.
    Bei Videoübertragungen kann entsprechend die Framerate reduziert werden.
  • Änderungen des Sampling-Qualität
    ISDN tastet ein Audiosignal mit einer Auflösung von 8bit ab. Wenn hingegen von "Wideband"-Audio gesprochen wird, werden 16bit abgetastet, was die Datenrate erhöht, auch wenn mit Kompression wieder viel gewonnen wird. Ein Codec kann also die Qualität reduzieren, indem er auf Narrowband umschaltet.
    Bei Videoübertragungen kann die Auflösung reduziert werden
  • Jitterbuffer
    Variiert die Laufzeit von Paketen sehr stark, dann verzögern Codec beim Empfang die Wiedergabe etwas, so dass spät eintreffende Paket noch zeitgerecht wiedergegeben werden. Das gesamte Signal ist natürlich etwas "verzögert" aber immer noch besser zu verstehen als Störgeräusche durch fehlende Daten
  • Forward Error Correction
    Wenn Pakete "verloren" gehen, dann werden diese bei VoIP nicht neu gesendet. Der Empfänger kann dem Sender über RTCP mitteilen, dass Pakete verloren gehen und der Sender kann auf einen Codec mit FEC umsteigen. Dabei werden Informationen über mehrere Pakete verteilt, so dass der Verlust eines Pakets beim Empfänger aus Informationen des nachfolgenden Pakets ersetzt werden kann. Das kostet aber natürlich mehr Bandbreite und verzögert die Wiedergaben

Optionen wie "Silence Detection" etc. helfen zwar auch die Datenmenge insgesamt zu reduzieren aber zählen hier nicht. Sie können den Telefonteilnehmern schließlich nicht das Reden verbieten.

Risiken für Audio/Video

Ein normales "unmanaged" Netzwerk ist für VoIP Pakete oft erstaunlich gut geeignet, da Codec und Software mittlerweile ganz gut auch kleinere Fehler kompensieren können. Meist liegt es aber auch daran, dass in einem LAN einfach genug Bandbreite vorhanden ist, um gar keine Mangelsituation aufkommen zu lassen. Das sieht aber ganz schnell anders aus, wenn es über WAN-Stecken geht oder das LAN einfach größer ist und auch Gigabit-Links zwischen Switchen zumindest zeitweilig an ihre Grenzen kommen. Die Probleme im LAN, die für VoIP dann zum Problem werden sind.

  • Verzögerungen (Jitter)
    VoIP ist "Realtime" und Verzögerungen, die bei einem Dateizugriff nicht mal bemerkt werden, sind bei VoIP sofort hörbar. Viel mehr als 150ms sind schon eine merkliche Verschlechterung. Wechselnde Lasten führen sogar noch zu unterschiedlichen Laufzeiten, die von Codecs aufwändig ausgeglichen werden müssen.
  • Paketverluste
    VoIP nutzt primär verbindungslose UDP-Pakete. Wird ein Paket aufgrund von Überfüllung "verworfen", dann wird es nicht mehr erneut angefordert. Beim Empfänger "fehlt" einfach dieses Stück Audio. Solange die Rate gering bleibt, dann machen ein paar fehlenden 20ms Tonstücke nichts aus. Störend sind natürlich "Bursts", d.h. mehrere hintereinander fehlende Pakete.
  • Linkverluste
    Nicht zu unterschätzen sind Unterbrechungen bei der Verbindung. Das betrifft nicht nur WLAN-Stecken sondern kann auch eine ungeeignete Port-Konfiguration (Stichwort Halb/Voll-Duplex) oder und der ungeeignete Einsatz von Desktop-Switches oder "PassThough"-Ports von VoIP-Geräten bedeuten. Manchmal spielt auch PoE hier mit rein.

VoIP funktioniert also dann problemlos, wenn alle Pakete in der gesendeten Reihenfolge mit minimaler Verzögerung und ohne Verluste beim Ziel ankommen.

Weitere Links