Matthias Fröhlich *), Dirk Michaelis, Hans Werner Strube Drittes Physikalisches Institut Bürgerstr. 2- D-707 Göttingen *) Tel.: 0551-9771 FAX: 0551-97720 email: matth@physik.gwdg.de Eberhard Kruse Georg-August-Universität Göttingen Abt. Phoniatrie und Pädaudiologie Robert Koch Str. 0 D-7075 Göttingen Akustische Stimmqualität unter verschiedenen Rahmenbedingungen Einleitung Die objektive Beschreibung von Stimmeigenschaften durch akustische Größen wird in zunehmendem Maß in der phoniatrischen Diagnostik eingesetzt. Normalerweise wird die zu analysierende Stimmprobe getrennt von der phonoskopischen Untersuchung (Laryngoskopie/Stroboskopie der Stimmlippen während der Phonation) aufgezeichnet. Dies bietet den Vorteil, daß die Aufnahmen in einem geräuscharmen Hintergrund vorgenommen werden können, der ansonsten nicht garantiert werden kann. Außerdem entspricht die Aufnahmesituation den alltäglichen Anforderungen an die Stimme weit besser als die Phonation während der phonoskopischen Untersuchung. Zudem können dem Patienten unterschiedliche Aufgaben gestellt werden, so daß sich ein weiter Umfang der natürlichen Stimmgebung erfassen läßt (verschiedene Vokale, fortlaufende Sprache, usw.). Für die Interpretation der akustischen Analyseergebnisse wird normalerweise vorausgesetzt, daß die akustischen Eigenschaften der Stimme - und damit die speziellen Phonationsbedingungen - in beiden Situationen vergleichbar sind. In diesem Beitrag wird dieser Fragestellung durch den Vergleich der akustischen Stimmqualität von Stimmproben, die unter verschiedenen Rahmenbedingungen aufgezeichnet wurden, nachgegangen. Datenmaterial und Methoden Das Heiserkeits-Diagramm [1] hat sich als geeignete Methode zur Beschreibung der akustischen Stimmqualität pathologischer Stimmen bewährt [2] und wurde für die akustischen Untersuchungen dieser Studie verwendet. In diesem Diagramm stellt die horizontale Irregularitätskomponente (IK) die Unregelmäßigkeit des Stimmsignals und damit der Stimmlippenschwingung, die vertikale Rauschkomponente (RK) den Rauschanteil und damit indirekt die Qualität des glottalen Schlusses dar. Für die vorliegenden Untersuchungen wurden Stimmproben von 69 zufällig ausgewählten Patienten der Abteilung Phoniatrie und Pädaudiologie der Universität Göttingen unter verschiedenen Bedingungen aufgenommen und verglichen. Jede Person wurde zunächst phoniatrisch mittels Laryngo-Stroboskopie untersucht (Lupenlaryngo-skop (90 ) R.Wolf 50.57) und die Stimmproben währenddessen digital aufgezeich-net (DAT-Recorder mit Abtastrate 8 khz). Dabei wurde einerseits ein hochwertiges Mikrofon mit Kopfhalterung verwendet (beyer dynamics HEM 191, Kugelcharakteristik), andererseits das Mikrofonsignal der Laryngoskopieapparatur (LA) auf der zweiten Spur synchron aufgenommen. Anschließend erfolgte die Aufnahme der unbehinderten Phonation in einem schallgedämmten Raum anhand eines umfangrei-cheren Protokolls ( Vokalserien à 7 Vokalen, Standardtext [2]) unter Verwendung eines baugleichen Kopfmikrofons. Aus diesen Aufnahmen wurden die in normaler Stimmlage gesprochenen Vokale /ε:/ ausgewählt. Es wurde darauf geachtet, daß alle Aufnahmen in ähnlicher Tonhöhe und Intensität gesprochen wurden. Die Aufzeichnungen bei laufendem und bei ausgeschaltetem Stroboskop
(d.h. während der Stroboskopie und der reinen Laryngoskopie) wurden getrennt analysiert, um Einflüsse des Stroboskopgeräuschs auf die Analyseergebnisse aufzeigen zu können. Die Analyseergebnisse jedes Patienten in jeder der Situationen (Laryngoskopie, Stroboskopie und separate Stimmaufnahme bei unbehinderter Phonation) wurden durch Mittelwert (MW) und Standardabweichungen (SA) der beiden Koordinaten beschrieben und im Heiserkeits-Diagramm als Ellipsen dargestellt (Abb. 1) [2]. Zum Test der Vergleichbarkeit der Situationen wurden für jeden Patienten die Verschiedenheit der Verteilungen (2-dimensionaler Kolmogorov-Smirnov Test) sowie der Mittelwerte bezüglich der beiden Koordinatenrichtungen (Student t-test für unbekannte Varianzen) untersucht. Daneben wurde die Korrelation der Ellipsenzentren für alle paarweisen Kombinationen der Situationen mittels Spearman Rangtest berechnet. Zum Test des Mikrofoneinflusses (Kopfmikrofon gegenüber Mikrofon der LA) wurde die Korrelation zwischen der Gesamtheit der Analyseergebnisse für die beiden synchron aufgezeichneten Spuren bestimmt. Die Interpretation aller statistischen Tests erfolgte auf einem Signifikanzniveau von p<0,01. Ergebnisse Die nachfolgende Tabelle stellt die Ergebnisse der statistischen Analyse zusammen. n gibt die Anzahl der Patienten pro Gruppe an. Die Anzahl der statistisch signifikant voneinander verschiedenen Ellipsen (in mindestens einer Koordinate) wurde in allen paarweisen Kombinationen getrennt für die beiden Mikrofonarten ermittelt (angegeben in absoluten Werten und in Prozent). Die mittlere Differenz (MW) zwischen den Ellipsen für die verschiedenen Bedingungen ist mit der zugehörigen Standardabweichung (SA) für beide Koordinatenrichtungen angegeben (negative Werte: mittlere Koordinate der zweiten Gruppe ist größer als die der ersten Gruppe). Signifikante Differenzen sind hierbei mit * markiert. Die letzten beiden Spalten enthalten die Korrelationen der beiden Gruppen. Die unteren beiden Zeilen beschreiben die Ergebnisse des Mikrofonvergleichs. Abb. 2 zeigt beispielhaft ein typisches Ergebnis der akustischen Analysen für einen Patienten. Vergleich Mikrofon n signif. Diff. Differenz (1. - 2.Gruppe) Korrelation Irreg. komp. Rauschkomp. Anz. % MW SA MW SA Irr.k. R.k. Strob.-unbeh. extern 9 87,7 0,8 0,99 0,86* 0,69 0,78 0,76 Laryng. 9 5 71, -0,09 0,9 0,0* 0,55 0,77 0,77 Lar.-unbeh. extern 8 0 78,9 0,9 1,10 0,90* 0,65 0,8 0,85 Laryng. 8 22 57,8 0,8 1,25 0,55* 0,62 0,81 0,8 Strob. - Lar. extern 7 20 2,5-0,51 1,02-0,06 0,5 0,87 0,86 Laryng. 7 19 0, -0,51 1,19-0,1 0,62 0,90 0,89 Mikrovergleich Situation extern -Laryng. Strobosk. 2111 0,60* 0,88 0,* 0,59 0,82 0,86 Laryngosk. 1805 0,57* 0,89 0,0* 0,59 0,8 0,87 Diskussion Im Vergleich der Laryngoskopie/Stroboskopieaufnahmen mit den Stimmproben bei unbehinderter Phonation fanden sich für die Mehrzahl der Stimmen (58-88%) statistisch signifikante Unterschiede der Mittelwerte. Die mittleren Differenzen in den beiden Koordinaten wiesen eine signifikante Verschlechterung der Stimmqualität (0,-0,9) für die RK auf. Dies deutet auf eine signifikante Beeinträchtigung des glottalen Schlusses während der Phonoskopie hin, wohingegen die Beeinträchtigung
der Regelmäßigkeit der Schwingungen zwar im Mittel deutlich (0,1-0,9), jedoch nicht signifikant ist. Dieser deutlichen Beeinträchtigung der Stimmgüte während der Phonoskopie steht die mittlere Differenz beim Vergleich zwischen Laryngoksopie und Stroboskopie von 0,5 für die IK und 0,1 für die RK gegenüber. Diese Differenzen sind jedoch nicht signifikant. Die Verringerung der Anzahl der statistisch signifikanten Differenzen auf 0-2% kann daher als Hinweis auf die Robustheit des Heiserkeits-Diagramms im Hinblick auf Hintergrundgeräusche gedeutet werden. Der verbleibende, immer noch relativ hohe Prozentsatz an signifikant verschiedenen akustischen Stimmqualitäten spiegelt eventuell die Schwierigkeit wider, gleiche Phonationsmechanismen unter den erschwerten Bedingungen der phonoskopischen Untersuchung zu realisieren. Ein deutlicher Einfluß auf die Analyseergebnisse ist durch die Wahl bzw. Positionierung des Mikrofons gegeben. Die Ellipsen für das Laryngoskopmikrofon in Abb. 2 befinden sich in beiden Koordinatenrichtungen bei kleineren Werten. Für diesen und für andere Patienten waren bei den Aufnahmen mit Kopfmikrofon deutlich stärkere Hintergrundgeräusche feststellbar. Die mittleren Differenzen zwischen den Ellipsen für die unterschiedlichen Mikrofone (0,6 0, für die IK RK) sind signifikant und bestätigen diese informelle Beobachtung. Das qualitativ hochwertige Kopf-mikrofon mit Kugelcharakteristik stellte sich daher als ungeeigneter für die Aufnahme unter Hintergrundgeräuschen heraus als das eingebaute Mikrofon der LA. Die Korrelationen in beiden Koordinaten zwischen den verschiedenen Situationen ist trotz der diskutierten Unterschiede hoch (0.77-0.90). Dies bestätigt die generelle Vergleichbarkeit der Phonationsbedingungen während Phonoskopie und unbehinderter Phonation. Ergebnisse der akustischen Analysen dürfen daher im Hinblick auf die während der Phonoskopie beobachteten Phonationsbedingungen interpretiert werden. Schlußfolgerungen 1.) Die akustische Stimmgüte ist abhängig von den Rahmenbedingungen. So beeinflussen Hintergrundgeräusche die Analyseergebnisse, doch zeigen nur die Änderungen der Stimmqualität bedingt durch die phonoskopische Untersuchung bezüglich der RK statistische Signifikanz. 2.) Die Erfassung der Stimmgüte sollte während der phonoskopischen Untersuchung vorzugsweise mit dem Mikrofon der LA erfolgen. Ein externes Mikrofon, insbesondere eines mit Kugelcharakteristik, liefert stärker durch Hintergrund- und Berührungsgeräusche kontaminierte Aufnahmen, so daß eine schlechtere Stimmqualität suggeriert wird..) Die Korrelation der individuellen Ergebnisse während Stroboskopie, Laryngoskopie und unbehinderter Phonation sind nichtsdestotrotz hoch und weisen denselben Trend auf. Dies bestätigt generell den Ansatz, daß die Stimmqualität während der Phonoskopie der normalen Stimmqualität entspricht. Literatur [1] Michaelis, Fröhlich, Strube. Selection and combination of acoustic features for the description of pathologic voices. J Acoust Soc Am 10():1628-169 (1998) [2] Fröhlich, Michaelis, Kruse. Objektive Beschreibung der Stimmgüte unter Verwendung des Heiserkeits-Diagramms, HNO 6:68-689 (1998)
Bildlegenden Abb. 1: Akustische Stimmqualität aller Patienten während unbehinderter Phonation. Abb. 2: Akustische Stimmqualität unter verschiedenen Bedingungen für einen einzelnen Patienten. Die Ellipsen beschreiben die Analyseergebnisse während der Phonoskopie (Laryngoskopie und Stroboskopie) und für die unbehinderte Phonation. Die dunklen Ellipsen stehen für Aufnahmen mit dem Kopfmikrofon, die hellen Ellipsen für die synchron erfolgten Aufnahmen mit dem eingebauten Mikrofon der LA. erschienen in: Aktuelle phoniatrisch-pädaudiologische Aspekte 1998/99, Vol. 6, M. Gross (Hrsg.) Median Verlag Heidelberg 1999, S. -9
5 Heiserkeits-Diagramm Rauschkomponente [GNE] 2 1 0 1 2 5 6 7 8 9 10 Irregularitätskomponente [Jitter, Shimmer, Periodenkorrelation] Rauschkomponente [GNE] 5 2 1 0 Patient hj Stroboskopie (Laryngoskopmikro) (n=55) unbehinderte Phonation (n=5) 1 2 Heiserkeits-Diagramm Stroboskopie (ext. Kopfmikro) (n=55) Laryngoskopie (ext. Kopfmikro) (n=2) Laryngoskopie (Laryngoskopmikro) (n=2) 5 6 7 8 9 Irregularitätskomponente [Jitter, Shimmer, Periodenkorrelation] 10