Puls-Code Modulation (PCM)

Puls-Code Modulation (PCM) Zur Erassung und rechnerbasierten Verarbeitung physikalischer Messgrößen werden spezielle Sensoren eingesetzt, mit denen der zeitliche Verlau der jeweiligen Messgröße in ein analoges elektrisches Signal gewandelt wird. Beispielsweise wird bei Sprache, die als Schallwelle übertragen wird, ein Mikroon als Sensor eingesetzt, mit dem die Veränderung des Schalldrucks in ein elektrisches Signal gewandelt wird. Der elektrische Signalverlau stellt ein zeit- und wertekontinuierliches Signal dar. Um das Signal mit einem Digitalrechner verarbeiten zu können, muss das zeit- und wertekontinuierliche Signal in ein zeit- und wertediskretes Signal umgesetzt werden. Dazu setzt man einen nalog-/digital-umsetzer (DU) ein. In den olgenden bschnitten werden die zur Umsetzung notwendigen Schritte der btastung und Quantisierung vorgestellt. Die Vorgehensweise zur Wandlung eines analogen Signals in eine Folge quantisierter btastwerte bezeichnet man als Puls-Code-Modulation (PCM). btastung Zur Erassung eines analogen, elektrischen Signalverlaus wird das Signal zu äquidistanten Zeitpunkten n T abgetastet, wie es Bild beispielhat zur unahme eines udiosignals mit einem Mikroon als Sensor veranschaulicht. Bild : btastung des tiepassgeilterten Mikroonsignals Den Kehrwert der Zeit T bezeichnet man als die btastrequenz a T, die die nzahl der btastwerte je Sekunde estlegt. Die konkrete Wahl des Werts der btastrequenz wird durch das sogenannte btasttheorem, das auch als. Nyquistkriterium bezeichnet wird, bestimmt. Das btasttheorem besagt, dass ein Signal mit einer Frequenz abgetastet werden muss, die größer als das Doppelte der höchsten in dem Signal enthaltenen Frequenz ist. a H.G. Hirsch DKS-SS 05

Da man die in einem Signal autretende imale Frequenz häuig nicht kennt, erolgt vor der btastung eine Filterung des analogen Signals mit einem Tiepass. Dieser verhindert weitgehend das utreten von Frequenzanteilen oberhalb von a /, um das zur Festlegung von umgestellte btasttheorem a zu erüllen Da ein realer analoger Tiepass nicht die ideale rechteckörmige Charakteristik besitzt, wie sie in Bild veranschaulicht wird, wird die Grenzrequenz g des Tiepasses in der Regel zu g < a / gewählt. Damit wird insbesondere der Tatsache Rechnung getragen, dass die Flanke im Bereich der Grenzrequenz des Tiepasses nur eine endliche Steilheit besitzt. Beispielsweise besitzt ein Sprachsignal Frequenzanteile im Bereich bis etwa 7 khz. Dies bedingt eine btastung mit einer Frequenz, die größer als 4 khz sein muss. Bei der Entwicklung des analogen Teleons hat man allerdings estgestellt, dass auch die Beschränkung au den Bereich von 300 Hz bis 3,4 khz noch ein gut verständliches Sprachsignal lieert. Daher verwendet man zur digitalen Erassung der Sprache im Bereich der Telephonie in der Regel eine btastrequenz von 8 khz, so dass man auch bei Einsatz eines nicht idealen Tiepasses noch Frequenzanteile bis 3,4 khz erassen kann. Zur Realisierung einer qualitativ besseren Übertragung mit höherer Sprachqualität verwendet man eine btastrequenz von 6 khz. Damit lassen sich Frequenzanteile bis etwa 7 khz auch mit einer nicht idealen Filtercharakteristik erassen. Die btastwerte des zeitdiskreten Signals n T mit n,,,,0,,,, x lassen sich aus einer mathematischen Beschreibung des analogen Signals x(t) durch eine Substitution von t durch n T berechnen. Damit ergibt sich beispielsweise ür ein Cosinussignal die nachstehende mathematische Darstellung des zeitdiskreten Signals. x t cos t t nt xn T cos nt cos n Es ergibt sich eine Folge von btastwerten, die das Cosinussignal repräsentiert. Die zuvor angegebene mathematische Beschreibung veranschaulicht die bhängigkeit von dem Verhältnis der Frequenz des Cosinus zur btastrequenz. Damit erhält man beispielsweise bei gleichzeitiger Verdopplung der Frequenz und der btastrequenz die gleiche Folge von btastwerten. Ohne Kenntnis der btastrequenz kann man einer Folge von btastwerten keinen absoluten Frequenzwert zuordnen. Dies macht deutlich, dass die Verarbeitung eines Signals in einem H.G. Hirsch DKS-SS 05 a

Digitalrechner immer relativ zur btastrequenz erolgt. Man beschreibt das zeitdiskrete Signal in der Regel auch nur in bhängigkeit des ganzzahligen btastindex n als x(n). Dabei deiniert n, welcher Wert aus der Folge von btastwerten bearbeitet wird. Um die Eigenschaten des abgetasteten Signals im Frequenzbereich zu bestimmen, beschreibt man die btastung zu äquidistanten Zeitpunkten mathematisch als die Multiplikation des Signals mit einer Folge von Dirac Impulsen, wie es Bild veranschaulicht. Bild : naloges Signal (oben), Folge von Dirac-Impulsen (Mitte), PM Signal (unten) Das Signal, das aus der Folge von Dirac Impulsen besteht, nimmt zu den btastzeitpunkten den Wert an und ist ansonsten Null. Das aus der Multiplikation resultierende Signal xab(t) nimmt zu den btastzeitpunkten die Werte n T Vorgehensweise auch als Pulsamplitudenmodulation (PM). x an und ist ansonsten Null. Man bezeichnet diese Die Folge von Dirac Impulsen lässt sich ormal beschreiben als n (t n T) H.G. Hirsch 3 DKS-SS 05

Unterwirt man diese Impulsolge einer Fourier Transormation, so ergibt sich im Spektralbereich ebenalls eine Folge von Dirac Impulsen: n (t n T) n ( ) ( T T T n Die Dirac Impulse treten bei Vielachen der btastrequenz a au. n n a ) us der Multiplikation des Signals mit einer Impulsolge im Zeitbereich wird eine Faltung des Spektrums mit der entsprechenden Impulsolge im Frequenzbereich. x ab t x( t) n ( t n T) X ab X ( ) T n ( n Dies wird in Bild 3 in einer zweiseitigen spektralen Darstellung einschließlich negativer Frequenzen veranschaulicht, in der das Betragsspektrum eines gemäß dem btasttheorem tiepassgeilterten analogen Signals, die Folge von Dirac Impulsen im Frequenzbereich sowie das Betragsspektrum des abgetasteten Signals dargestellt sind. XTP() a ) - a / a / - a - a 0 a a Xabgetastet() -5 a / - a -3 a / - a - a / a / 3 a / a a Bild 3: Wiederholtes utreten des TP-Spektrums nach einer Faltung des Spektrums mit einer Folge von Dirac-Impulsen Die btastung im Zeitbereich ührt zu einer periodischen Wiederholung des tiepassgeilterten Spektrums bei Vielachen der btastrequenz. Das Spektrum Xab() des PM Signals xab(t) ist H.G. Hirsch 4 DKS-SS 05

unendlich ausgedehnt. Zur Rekonstruktion des analogen TP Signals aus dem PM Signal muss das PM Signal mit einem Tiepass mit einer Grenzrequenz g ~ a geiltert werden. Die komplette Verarbeitungskette zur Gewinnung und Übertragung eines pulsamplitudenmodulierten Signals sowie einer Rekonstruktion des analogen Signals aus dem PM Signal ist in Bild 4 dargestellt. Bild 4: PM Signalgenerierung und Rekonstruktion des TP geilterten analogen Signals Die Kenntnis von dem wiederholten utreten des Spektrums eines abgetasteten Signals kann auch herangezogen werden, um die bei einer Verletzung des btasttheorems autretenden Eekte darzustellen. Es wird der Fall betrachtet, dass vor der btastung eines Signals keine entsprechende TP Filterung erolgt, so dass in dem abzutastenden Signal Frequenzanteile oberhalb der halben btastrequenz enthalten sind. Beispielhat ist dazu in Bild 5 das Spektrum eines Cosinussignals, das eine Frequenz von 5 khz besitzt, im oberen Bild dargestellt. X() -5-4 4 5 Xabgetastet() erste Wiederholung /khz -0-6 - -8-5 -4-3 3 4 5 8 /khz Xabgetastet&TP() -4-3 3 4 /khz Bild 5: Spektrum eines 5 khz Signals (oben), Spektrum des unterabgetasteten Signals (Mitte), Spektrum des TP geilterten Signals (unten) H.G. Hirsch 5 DKS-SS 05

Das Spektrum besteht aus zwei Dirac Impulsen bei den Frequenzen -5 und +5 khz. Nach einer btastung des Cosinussignals mit einer Frequenz von 8 khz, treten weitere Impulse bei 8-5 = 3 khz und bei 8+5 = 3 khz als erste Wiederholung des Spektrums au. ls zweite Wiederholung treten weitere Impulse bei 6-5 = khz und bei 6+5 = khz au. Entsprechend ortgesetzt treten weitere Impulse ür die weiteren Vielachen der btastrequenz sowie im negativen Frequenzbereich au. Wird das aus der btastung resultierende PM Signal mit einem korrekt gewählten Tiepass mit ~ a khz geiltert, so erhält man ein Cosinussignal, das eine g 4 Frequenz von 3 khz besitzt. Den beobachteten Eekt kann man verallgemeinernd so beschreiben, dass Frequenzanteile, die im abzutastenden Signal oberhalb von a / bei a /+Δ vorhanden sind, nach der btastung und Filterung bei a /-Δ autreten. Man spricht dabei auch von einer Rückaltung der oberhalb von a / liegenden Frequenzanteile. Im llgemeinen kommt es zu einer Überlagerung der eigentlichen Frequenzanteile im Frequenzbereich unterhalb von a / mit den rückgealteten Komponenten. Man nennt diesen Eekt der Überlagerung von Spektralanteilen liasing. Das vor der btastung eingesetzte TP Filter wird daher häuig auch als ntialiasingilter bezeichnet. Quantisierung und Codierung In einem Digitalrechner werden Werte als Dualzahlen mit einer bestimmten nzahl von Bits dargestellt. Dazu werden in einem zweiten Schritt die mplituden der btastwerte quantisiert. Der Wertebereich, in dem die mplitudenwerte autreten, wird in eine estgelegte nzahl von Nbit gleich breiten Intervallen unterteilt. lle mplitudenwerte in einem Intervall werden als eine Dualzahl mit Nbit Bits codiert. Die Vorgehensweise zur Quantisierung und Codierung ist exemplarisch in Bild 6 ür eine lineare Unterteilung des zu quantisierenden mplitudenbereichs in 8 Intervalle dargestellt. u der x- chse werden die mplituden der btastwerte augetragen. Der zu quantisierende mplitudenbereich geht von - bis +. Ein Quantisierungsintervall besitzt dann die Breite x Nbit 3 4 Die treppenörmige bbildungskennlinie, die man als Quantisierungskennlinie bezeichnet, ergibt sich aus einer bbildung der Werte in einem Quantisierungsintervall au den Wert in der Mitte des Intervalls. lle Werte in einem Intervall werden in diesem Fall als Dualzahl mit 3 Bits codiert. H.G. Hirsch 6 DKS-SS 05

xˆ n 0 Δx 00 - -Δx Δx/ 00 000 Δx mplitude x(n) 0 0 00 Bild 6: Quantisierungs- und bbildungskennlinie ür eine PCM bei einer Wortlänge von 3 Bit Die Quantisierungskennlinie lässt sich mathematisch beschreiben durch xˆ n signx( n) int arg wobei sign arg x( n) int x, x das Vorzeichen von arg reräsentiert und die Bestimmung der nächstkleineren ganzen Zahl von arg deiniert. Die bolge von btastung, Quantisierung und Codierung bezeichnet man als Pulscodemodulation (PCM). Das usgangssignal der PCM ist zeit- und wertediskret. Die praktische Realisierung der PCM erolgt in einem nalog-digital Umsetzer (DU). Die Quantisierungskennlinie beinhaltet auch die Vorgehensweise bei der Rekonstruktion eines analogen Signals aus der Folge von binären Codewörtern. Ein Codewort, das aus Nbit Bits besteht, wird wieder au den mplitudenwert in der Mitte des zugehörigen Intervalls abgebildet. Dabei tritt ein Quantisierungsehler e(n) au, der sich als Dierenz des quantisierten mplitudenwerts und des ursprünglichen Werts ergibt. en xˆ n xn x Die Quantisierungsehler liegen dabei in dem Intervall e n x. Sie überlagern sich dem ursprünglichen Signal als sogenanntes Quantisierungsrauschen. Bei akustischen Signalen wird das Rauschen bei einer zu geringen Bitanzahl hörbar. Die Quantisierungsehler, die bei einer H.G. Hirsch 7 DKS-SS 05

Quantisierung des bereits in Bild verwendeten Signalabschnitts autreten, werden in Bild 7 veranschaulicht. Dabei wird eine Quantisierung des mplitudenbereichs von - bis + mit Nbit = 3 Bit vorgenommen, so dass sich die Breite eines Quantisierungsintervalls zu x ergibt 3 und die Quantisierungsehler im Intervall e n autreten. 4 4 Bild 7: naloges und PM Signal (oben), PCM Signal (Mitte), Quantisierungsehler (unten) Um den Einluss des Quantisierungsrauschens quantitativ zu beschreiben, betrachtet man das Verhältnis der Leistungen des Signals und des Rauschens. Man bezeichnet das Verhältnis daher auch als Signal/Rauschleistungsverhältnis (SNR = signal-to-noise ratio). Die Leistung eines Signals lässt sich bei Kenntnis der utrittswahrscheinlichkeiten aller mplitudenwerte als Erwartungswert der quadrierten mplitude berechnen: S Ex x p( x) x dx H.G. Hirsch 8 DKS-SS 05

Man bezeichnet die Funktion p(x), die die Wahrscheinlichkeit des utretens der mplitude x beschreibt, auch als Verteilungsdichteunktion. Bei einem natürlichen Signal kann man annehmen, dass die Quantisierungsehler im Bereich x x en mit gleich großer Wahrscheinlichkeit autreten, da sich die Lage eines mplitudenwerts in einem Quantisierungsintervall zuällig ergibt. Damit nimmt die Verteilungsdichteunktion p(e) das in Bild 8 dargestellt ussehen an. p(e) /Δx -Δx/ Δx/ e Bild 8: Verteilungsdichteunktion des Quantisierungsehlers Eine Verteilungsdichteunktion besitzt die grundlegende Eigenschat, dass die Fläche unter der Funktion gleich Eins ist: p ( x) dx. Damit ergibt sich die konstante Wahrscheinlichkeit des utretens eines Quantisierungsehlers im Intervall N des Quantisierungsrauschens lässt sich damit berechnen zu N 3 e x 3 x x en zu x 3x 8 p( e). Die Leistung x x x 3 3 x ( ) e p e de e de x x x x x 8 Nimmt man auch ür das Signal ein gleichwahrscheinliches utreten der mplitudenwerte im Quantisierungsbereich xn an, so lässt sich die Leistung des Signals berechnen zu S x p( x) dx x x dx 3 x 3 6 3 3 Damit ergibt sich das Signal/Rauschleistungsverhältnis in db zu S SNR 0 log ( ) 0 log ( 0 N 0 3 x 4 Mit x SNR 0log ( Nbit 0 4 ) Nbit ) 0log 0 ( Nbit ) SNR 0 N bit log 0 () N bit 00,30 N bit 6,0 db H.G. Hirsch 9 DKS-SS 05

Das Signal/Rauschleistungsverhältnis besitzt unter der nnahme des gleichwahrscheinlichen utretens aller mplitudenwerte im gesamten Quantisierungsbereich eine lineare bhängigkeit von der Bitanzahl Nbit. Damit ergibt sich beispielsweise die häuiger zu indende ngabe eines Signal/Rauschleistungsverhältnisses von 96 db ( 6 6,0dB) als Qualitätsangabe bei CDs (compact disks), bei denen ein udiosignal in 6 Intervallen, d.h. mit einer Wortlänge von 6 Bit, quantisiert wird. Zur Codierung von Sprache mit Hile der Puls-Code-Modulation benötigt man eine Quantisierung mit Nbit = Bit, um bei einer Rekonstruktion des Signals eine gute Sprachqualität zu gewährleisten. Damit ergeben sich Datenraten von 8000 Bit 96000 s Bit s im Fall von Teleonsprache und 6000 Bit 9000 s Bit s im Fall von Breitbandsprache. bei einer Verwendung der PCM zur Codierung von Sprache. Die Bestimmung des Signal/Rauschleistungsverhältnisses mit SNR Nbit 6, 0 db ist an zwei Bedingungen gebunden, die ür Sprache in der Regel nicht erüllt sind. Die erste Bedingung ist die volle usnutzung des Quantisierungsbereichs. Ein nalog-/digitalumsetzer wird normalerweise so koniguriert, dass es nicht zu einer Überschreitung des Quantisierungsbereichs (Übersteuerung) kommen sollte. Eine Übersteuerung kann zu sehr großen Quantisierungsehlern ühren, die sich auch akustisch störend bemerkbar machen. Daher wird man im Fall von Sprache die Quantisierung so konigurieren, dass es auch bei einem lauten Sprecher nicht zur Übersteuerung kommt. ndererseits ührt dies bei einem leisen Sprecher dazu, dass möglicherweise nur ein kleiner Teil des Quantisierungsbereichs genutzt wird. uch die zweite Bedingung, dass alle mplitudenwerte mit gleicher Wahrscheinlichkeit autreten, ist bei Sprache nicht erüllt. Tatsächlich treten bei Sprachsignalen kleine mplitudenwerte wesentlich häuiger au als große. Eine näherungsweise Darstellung der Verteilungsdichteunktion ür Sprachsignale indet sich in Bild 9. Diese Funktion besitzt die Charakteristik einer Laplace oder Gamma Verteilung. Dabei ist die logarithmische Skalierung der Ordinate zu beachten. H.G. Hirsch 0 DKS-SS 05

Bild 9: Gamma Funktion zur Beschreibung der Verteilungsdichteunktion bei Sprachsignalen Da die kleinen mplitudenwerte wesentlich häuiger als große autreten, resultiert daraus auch eine im Vergleich zur Gleichverteilung wesentlich geringere Signalleistung. Für Sprache erhält man daher bei linearer Quantisierung ein SNR, das um etwa 6 bis 7 db schlechter ist als bei einem Signal, dessen mplitudenwerte eine Gleichverteilung über den gleichen mplitudenbereich auweisen. Zusammenassend kann man esthalten, dass die häuig angegebene näherungsweise Beschreibung SNR Nbit 6, 0 db als Maß ür die Güte der Quantisierung die in der Praxis anzutreenden Signal/Rauschleistungsverhältnisse bei Sprach- und udiosignalen nicht wiedergibt. Meist stellt man Werte des SNR est, die um etwa 6 bis 0 db kleiner sind als die der näherungsweisen Beschreibung. H.G. Hirsch DKS-SS 05