ZHW, NTM, 25/6, Rur 1 Kapitel 5: Digitale Übertragung im Basisband 5.2. Nichtlineare Amplitudenquantisierung 5.2.1. Einleitung...1 5.2.2. Das A-Law Kompressionsverfahren...3 5.2.3. Das A-Law Verfahren nach ITU-T G.711...7 5.2.4. Das µ-law Kompressionsverfahren (fakultativ)...9 5.2.5. Das µ-law Verfahren nach ITU-T G.711 (fakultativ)...1 Dieses Kapitel ist vollständig aus der Vorlesung SU von Prof. Dr. A. Steffen übernommen worden. 5.2.1. Einleitung In vielen Fällen liegt die zu übertragende Nachricht schon in digitaler Form vor. In diesem Kapitel betrachten wir die nichtlineare Amplitudenquantisierung, wie sie bei der Übertragung von analogen Sprachsignalen über digitale Telefoniekanäle eingesetzt wird. Wenn ein AD-Wandler mit Wortbreite W sinusförmig voll ausgesteuert wird, resultiert wegen dem Rundungsrauschen bei der Quantisierung ein SNR von SNR Q [db] = 6 W + 1.8. (5.1) Nimmt der Signalpegel ab, so verringert sich bei unveränderter Quantisierungsstufe das SNR Q, wie Figur 5.5 am Beispiel einer Wortbreite von W=5 Bit zeigt. Da das menschliche Ohr ein logarithmisches Lautstärkeempfinden besitzt, wäre es bei Audioanwendungen vorteilhafter, wenn das SNR über den ganzen Bereich der Signalaussteuerung konstant wäre, so wie es die horizontale Linie in Figur 5.5 angibt. Dies bedeutet, dass nicht der absolute Quantisierungsfehler konstant gehalten werden muss, wie es bei einer linearen Amplitudenquantisierung mit gleichmässigen Quantisierungsstufen m der Fall ist, sondern dass der relative Quantisierungsfehler konstant sein sollte. Dies kann erreicht werden, in dem die Dnamik des Eingangssignals vor der linearen Quantisierung durch eine logarithmische Kennlinie komprimiert wird und bei der Rekonstruktion wieder epandiert wird. Die Schaltung, welche diese nichtlineare Amplitudenquantisierung durchführt, ist in Figur 5.6 als Blockschaltbild aufgezeichnet und wird Kompander genannt. Sie besteht aus einem Kompressor mit logarithmischer Kennline, einem linearen Quantisierer und einem Epander mit eponentieller Kennlinie, welcher die Nichtlinearität wieder rückgängig macht. Die Schwierigkeit besteht nun darin, dass die nichtlineare Kompressionskennlinie = f() erstens durch den Nullpunkt (, ) = (,) gehen sollte und zweitens eine Punktsmmetrie bezüglich dieses Nullpunkt gefordert wird, damit positive und negative Amplituden gleich behandelt werden. Beim natürlichen Logarithmus = ln() ist weder die eine noch die andere Bedingung erfüllt.
ZHW, NTM, 25/6, Rur 2 336 Vollaussteuerung 27 3-2log(A) = -14.6 db 21 24 logarithmische Kennlinie SNR [db] 18 A-Law Kennlinie 12 9 lineare Kennlinie 36-42 -36-3 -24-18 -12-6 S / S ma [db] Figur 5.5: Signal-zu-Quantisierungsgeräuschabstand SNR Q als Funktion des Signalpegels für lineare, logarithmische und stückweise lineare A-Law Kennlinien. Beispiel für W = 5 Bit. Kompressor = f() logarithmisch Quantisierer = Q[] linear Epander = f -1 () eponentiell Figur 5.6: Kompander realisieren eine nichtlineare Amplitudenquantisierung, basierend auf einer Dnamikkompression, linearer Quantisierung und anschliessender Epansion. Es eistieren nun zwei Verfahren, wie die Logarithmusfunktion modifiziert werden kann, damit die beiden oben genannten Bedingungen erfüllt werden. Das eine Verfahren wird englisch A-Law genannt, das andere µ-law. Sie werden in den nächsten Abschnitten genauer vorgestellt.
ZHW, NTM, 25/6, Rur 3 5.2.2. Das A-Law Kompressionsverfahren Das A-Law Verfahren hat seinen Namen vom Parameter A in der Formel (5.2), welche den Verlauf der Kennlinie definiert. 1+ ln A sgn( ) = 1+ lna A 1+ ln A 1 mit =1/A (5.2) Das vereinfachte Beispiel in Figur 5.7 erklärt die Bedeutung des Parameters A. Die Wertebereiche der Eingangsvariablen, respektive der Ausgangsvariablen sind auf den Bereich [-1.. +1] normiert. Für grosse Eingangswerte im Bereich 1 kommt die Logarithmusfunktion zum Zug. Die Signumfunktion sgn() wechselt dabei das Vorzeichen für negative Werte von. Für kleine Eingangswerte im Bereich geht die Kennlinie in eine Gerade durch den Nullpunkt mit Steigung A a = (5.3) 1+ ln A über. Wird = 1/A gewählt, so stimmen in diesem Punkt die Funktionswerte und die ersten Ableitungen der beiden Kurventeile überein und es entsteht ein nahtloser Übergang. Der Parameter A steuert über (5.3) die Steilheit a des linearen Teils, in welchem die kleinen Eingangsgrössen liegen. Dadurch wird im Vergleich zum Fall der linearen gleichmässigen Quantisierung ein SNR-Gewinn erzielt. Allgemein gilt, dass je steiler der Kurvenverlauf in einem Teilbereich ist, desto mehr Quantisierungsstufen stehen in diesem Bereich zur Verfügung und desto kleiner wird dadurch der Quantisierungsfehler. Die Tabelle 5.1 listet die Werte des Parameters A für die ersten vier Zweierpotenzen der Geradensteigung a auf. Für a = 2 ergibt sich A = 5.3567. Dieser spezielle Wert erlaubt eine gute Annäherung der A-Law Kennlinie durch drei stückweise lineare Segmente, wie Figur 5.7 zeigt. Im ersten Segment 1/4 beträgt die Steigung a = 2. Die Quantisierungsstufen werden dadurch halb so gross wie bei der gleichmässigen Amplitudenquantisierung und somit beträgt der SNR-Gewinn 6 db. Im zweiten Segment 1/4 1/2 ist die Steigung 1, mit der gleichen Anzahl von Quantisierungsintervallen wie im linearen Fall. Im dritten Segment 1/2 1 beträgt die Steigung nur noch 1/2, mit einem SNR-Verlust von 6 db. a 2 log(a) A = 1/A 2 log( ) Segmente 1 db 1. 1.. db 1 2 6 db 5.3567.187-14.6 db 3 4 12 db 14.775.68-23.4 db - 8 18 db 36.8562.27-31.3 db - 16 24 db 87.5565.11-38.8 db 7 Tabelle 5.1: Wahl des Parameters A für einige Zweierpotenzen der Geradensteigung a.
ZHW, NTM, 25/6, Rur 4 1 3/4 2/4 = 1/A = [1 + ln(a)] / [1 + ln(a)] 1/4 1/4 1/2 1 Figur 5.7: Logarithmische Kompressionskennlinie nach dem A-Law mit A = 5.3567 und ihre stückweise Annäherung durch 3 lineare Segmente. Durch diese Massnahme wird im Bereich 1/8 1 ein annähernd konstantes SNR erzielt. Wie die entsprechende Kurve in Figur 5.5 zeigt, verursacht die Approimation durch stückweise lineare Segmente im Bereich [-18 db.. db] eine sägezahnförmige SNR-Schwankung von 6 db innerhalb jedes Segments. Für Pegel < -18 db sinkt das SNR dann kontinuierlich ab, ist aber immer noch 6 db höher als bei der linearen Quantisierung. Dies ist höchst erwünscht, da wir ja das SNR von schwachen Signalen anheben wollen. Figur 5.8 zeigt die stückweise lineare A-Law Kennlinie aus Figur 5.7 nun in entnormierter Form. Der Eingangswertebereich von [-64..64], zu dessen Darstellung 7 Bit benötigt werden, wird durch die nichtlineare Kennline = f() auf den Bereich [-16..16] komprimiert. Die anschliessende Quantisierung bildet 32 gleich grosse Intervalle [-16..-15], [-15..-14],..., [-2..-1], [-1..], [..1], [1..2],..., [14..15], [15..16], für deren Codierung nun 5 Bit ausreichen. Jeder 5-Bit Code steht für einen analogen Wert, der sich in der Mitte des jeweiligen Intervalls befindet. So entspricht 11 in Figur 5.9 dem Wert +1.5, während 1 den negativen Wert -1.5 bezeichnet.
ZHW, NTM, 25/6, Rur 5 16 15 14 13 12 11 1 9 8 7 6 5 4 3 2 1 2 4 6 8 1 12 14 16 2 24 28 32 4 48 56 64 Figur 5.8: Dnamikkompression von 7 Bit auf 5 Bit an der stückweise linearen A-Law Kennlinie mit drei Segmenten. Es wird nur der positive Quadrant gezeigt.
ZHW, NTM, 25/6, Rur 6 11111 1111 1111 111 1111 111 111 11 1111 111 111 11 111 11 11 1 1 3 5 7 9 11 13 15 18 22 26 3 36 44 52 6 Figur 5.9: Dnamikepansion von 5 Bit auf 7 Bit an der stückweise linearen A-Law Kennlinie mit drei Segmenten. Es wird nur der positive Quadrant gezeigt. Als Codierung wurde hier in Übereinstimmung mit der ITU-T Empfehlung G.711 nicht das sonst übliche Zweierkomplement gewählt, sondern eine Darstellung mit einem 4 Bit langen Betrag und einem vorangestellten Vorzeichenbit, wobei 1 einen positiven Wert bezeichnet und den entsprechenden negativen Wert. In dem wir die nichtlineare A-Law Kennlinie in der inversen Richtung benützen, wie dies in Figur 5.9 getan wird, kann jedem quantisierten Wert -15.5, -14.5,..., -1.5, -.5,.5, 1.5,..., 14.5, 15.5 in der komprimierten -Skala ein zugehöriger Wert -6, -52,..., -3,.-1, 1, 3,..., 52, 6 in der epandierten -Skala zugewiesen werden. Die Kombination der Kompressionskennlinie mit anschliessender Quantisierung aus Figur 5.8 mit der Epansionskennlinie aus Figur 5.9 ergibt die Quantisierungskennlinie des Kompanders in Figur 5.1.
ZHW, NTM, 25/6, Rur 7 6 52 44 36 3 26 22 18 15 13 11 9 7 5 3 1 2 4 6 8 1 12 14 16 2 24 28 32 4 48 56 64 Figur 5.1: Kompander-Quantisierungskennlinie mit variablen Quantisierungstufen, basierend auf der A-Law Kennlinie mit drei Segmenten. Es wird nur der positive Quadrant gezeigt. Es ist klar zu erkennen, dass jedes Segment eine unterschiedliche Höhe der Quantisierungsstufen besitzt, die sich von Segment zu Segment um einen Faktor 2 unterscheiden. 5.2.3. Das A-Law Verfahren nach ITU-T G.711 Normiert durch die ITU-T Empfehlung G.711, wird das A-Law Verfahren bei der Übertragung von analogen Sprachsignalen über digitale Telefoniekanäle eingesetzt. Und dies in allen Ländern Europas, sowie im Rest der Welt mit Ausnahme von Nordamerika und Japan. Auf internationalen Verbindungen zwischen zwei beliebigen Ländern ist das A-Law ebenfalls Pflicht. Die in der Telekommunikation verwendete Norm unterscheidet sich vom im vorhergehenden Abschnitt vorgestellten vereinfachten Verfahren nur darin, dass anstatt A = 5.3567 mit 3 Segmenten, der Parameterwert A = 87.5565 aus Tabelle 5.1 mit 7 Segmenten verwendet wird. Die entsprechende Kompressionskennlinie ist in Figur 5.11 aufgetragen. Der 13 Bit breite Eingangswertebereich [-496.. 496] wird auf den Bereich [-128.. 128] komprimiert, dessen 256 Intervalle mit 8 Bit codiert werden können.
ZHW, NTM, 25/6, Rur 8 128 112 96 8 64 48 32 16 256 512 124 248 496 Figur 5.11: Dnamikkompression von 13 Bit auf 8 Bit an der stückweise linearen A-Law Kennlinie mit sieben Segmenten gemäss ITU-T Empfehlung G.711. Es wird nur der positive Quadrant gezeigt Die Kompression wird normalerweise digital durchgeführt, in dem das analoge Eingangssignale mit 8 khz abgetastet und mit mindestens 13 Bit linear amplitudenquantisiert wird. Der erhaltene 13 Bit Wert wird anschliessend mit Hilfe einer digitalen Logik oder einer Look-up- Tabelle auf den 8 Bit Wert des zugehörigen Intervalls abgebildet. Bei der Epansion wird der inverse Vorgang angewendet, in dem das durch einen Lookup von 8 Bit auf 13 Bit epandierte Digitalwort auf einen 13-Bit breiten linearen Digital/Analog-Wandler gegeben wird. Die erzielte SNR-Charakteristik für das quantisierte Sprachsignal ist aus Figur 5.12 ersichtlich. Bei linearer Quantisierung mit 8 Bit würde bei Vollaussteuerung ein SNR von 49.8 db erreicht werden, was für Sprache mehr als genügend ist. Die totale Eingangspegeldnamik beträgt aber nur 49.8 db. Durch die Anwendung der A-Law Kompression sinkt der Störabstand für den grössten Pegel zwar um 12 db, dafür wird ein fast konstantes SNR zwischen 31.8 db und 37.8 db über einen weiten Eingangspegelbereich von [-42.. db] erzielt, das immer noch eine sehr gute Verständigung erlaubt. In dem das SNR für schwache Pegel durch die Geradensteigung a = 16 um 24 db angehoben wird, vergrössert sich die totale Dnamik auf fast 8 db, was in etwa der Hördnamik des menschlichen Ohrs entspricht.
ZHW, NTM, 25/6, Rur 9 51 54 Vollaussteuerung 45 48 39 42 336 logarithmische Kennlinie -2log(A) = -38.8 db SNR [db] 3 24 15 18 A-Law Kennlinie lineare Kennlinie 912 36-78 -72-66 -6-54 -48-42 -36-3 -24-18 -12-6 S / S ma [db] Figur 5.12: Signal-zu-Quantisierungsgeräuschabstand SNR Q als Funktion des Signalpegels für lineare, logarithmische und stückweise lineare A-Law Kennlinien. Beispiel für W = 8 Bit gemäss ITU-T G.711. 5.2.4. Das µ-law Kompressionsverfahren (fakultativ) Eine gleichwertige Alternative zum A-Law Verfahren stellt das µ-law Verfahren dar, das nach dem Parameter µ in der Definitionsformel (5.4) benannt wurde. ln( 1+ µ ) = sgn( ) ln( 1+ µ ) 1 Wie die dazugehörige Figur für µ = 15 zeigt, wird die Logarithmusfunktion = ln() durch eine horizontale Translation in den Nullpunkt (,) = (, ) verschoben. Die Signumfunktion sgn() stellt die Punktsmmetrie sicher. Um eine einfache Realisierung zu ermöglichen, wird auch hier die Kennlinie stückweise linearisiert. Dadurch, dass 4 Segmente gebildet werden, ergibt sich im Vergleich zum A-Law in Figur 5.7 den Vorteil, dass die Geradensteigung des ersten Segments mit a = 4.25 mehr als doppelt so steil wird und damit die schwachen Pegel 6.6 db mehr angehoben werden, als bei der A-Law Kompression mit vergleichbaren Parametern. Als Nachteil ergeben sich mit, 7, 23, 55 und 119 kompliziertere Segmentgrenzen. (5.4)
ZHW, NTM, 25/6, Rur 1 1 3/4 2/4 = ln(1 + µ) / ln(1 + µ)] 1/4 7/119 23/119 55/119 1 Figur 5.13: Logarithmische Kompressionskennlinie nach dem µ-law mit µ = 15 und ihre Annäherung durch 4 stückweise lineare Segmente. 5.2.5. Das µ-law Verfahren nach ITU-T G.711 (fakultativ) Abweichend vom Rest der Welt, werden Sprachsignale in Nordamerika und Japan bei der digitalen Übertragung nach dem µ-law codiert, das als gleichwertige Alterative ebenfalls in der ITU-T Empfehlung G.711 normiert wurde. Dabei wird der Parameter µ = 255 verwendet und die resultierende logarithmische Kennlinie wird durch die acht stückweise linearen Segmente angenähert, die in Figur 5.14 dargestellt sind. Der 14 Bit breite Eingangspegelbereich [-8159.. 8159] wird auf den Bereich [-128.. 128] komprimiert, dessen 256 Intervalle mit 8 Bit codiert werden. Das zusätzliche Segment in der Kennlinie bewirkt eine erhöhte Steilheit bei sehr schwachen Pegeln und damit eine SNR- Verbesserung von ca. 6 db im Vergleich zum 8 Bit A-Law Verfahren. Die ITU-T Empfehlung G.711 definiert zusätzlich eine Konversionstabelle zwischen A-Law und µ-law codierten Sprachsamples, die zum Beispiel bei Transatlantikgesprächen in der amerikanischen Vermittlungsstelle angewendet wird. Das µ-law Verfahren wurde durch Sun Microsstems in ihrem *.au Soundformat verwendet.
ZHW, NTM, 25/6, Rur 11 128 112 96 8 64 48 32 16 479 991 215 463 8159 Figur 5.14 Dnamikkompression von 14 Bit auf 8 Bit an der stückweise linearen µ-law Kennlinie mit acht Segmenten gemäss ITU-T Empfehlung G.711. Es wird nur der positive Quadrant gezeigt.