Altersbedingte Veränderungen der Stimme und Sprechweise von Frauen. Eine perzeptive und akustische Analyse

Ähnliche Dokumente
Abbildungsverzeichnis. Tabellenverzeichnis. Definitions- und Gleichungsverzeichnis. Einleitung 1. Theoretischer Teil 3

Spracherkennung. 4. Sitzung 23. Oktober 2008

Ästhetische Urteile über weibliche Sprechstimmen

Akustische Phonetik. Uwe Reichel, Phil Hoole IPS, LMU München

Inhaltsverzeichnis 1 Vorbemerkungen zur Sprachkommunikation Wahrnehmung und Messung von Schall... 9

Lesen von Sonagrammen III Vokale, Plosive

2 Perioden in 0.02 s 1 Periode in 0.01 s 100 Perioden in 1 s, Grundfrequenz = 100 Hz

Sprechgeschwindigkeit und Regionalität

Reihe: Mündliche Kommunikation Herausgeber: Walter F. Sendlmeier

Fachbereich Kommunikationswissenschaft der Universität Duisburg-Essen. von Verena Schütte Geburtsort: Braunfels

Die akustische Analyse von Sprachlauten.

Testtheorie und Gütekriterien von Messinstrumenten. Objektivität Reliabilität Validität

7. Sitzung. Kategoriale Wahrnehmung, McGurk-Effekt

RETESTRELIABILITÄT. Teststabilität. Korrelation wiederholter Testdurchführungen. Persönlichkeitstests. Stabilität des Zielmerkmals.

Klatschen vs. Pfeifen

Lesen von Sonagrammen I: Grundlagen. Uwe Reichel IPS, LMU München 16. November 2007

Akustische Phonetik Teil 3. Uwe Reichel, Phil Hoole IPS, LMU München

Der Erwerb und die Verarbeitung der Laute bilingualer Sprecher

Teil: lineare Regression

Zusammenhang zwischen Intelligenz und Berufserfolg in Deutschland. Fragestellung. Intelligenztests als Personalauswahl-Instrument in Deutschland

Statistik, Geostatistik

Vorlesung: Statistik II für Wirtschaftswissenschaft

K3.1 Phonetik und Phonologie II. 4. Sitzung.

WAHRNEHMUNGSDIMENSIONEN VON STIMME UND SPRECHWEISE. 1 Einleitung

Der Zusammenhang zwischen funktionellem Status und Krankheitseinsicht nach Schädel- Hirn-Trauma: Eine Längsschnittstudie

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Konsonanten: Artikulationsart

Bei näherer Betrachtung des Diagramms Nr. 3 fällt folgendes auf:

Messung & Darstellung von Schallwellen

Programme (hier können Sie selber üben) Einführung in die Linguistik (Ling 101) WS 2009/10. Wiederholung. Thema heute: Sprachsignale

Wahrnehmungsförderung mit dem FRODI-Frühförderkonzept

Empirische Forschung. Übung zur Vorlesung Kognitive Modellierung. Kognitive Modellierung Dorothea Knopp Angewandte Informatik/ Kognitve Systeme

Methodenlehre. Vorlesung 10. Prof. Dr. Björn Rasch, Cognitive Biopsychology and Methods University of Fribourg

Mutabor Therapeutische Tagesstätte am Stemmerhof. Evaluation von Behandlungseffekten

Informationen zur KLAUSUR am

Was passiert beim Sprechen?

Brückenkurs Statistik für Wirtschaftswissenschaften

Dr. Maike M. Burda. Welchen Einfluss hat die Körperhöhe auf das Körpergewicht? Eine Regressionsanalyse. HU Berlin, Econ Bootcamp 7.-9.

Statistik II Übung 2: Multivariate lineare Regression

Ziel: Vorhersage eines Kriteriums/Regressand Y durch einen Prädiktor/Regressor X.

Die Maximum-Likelihood-Methode

Eigene MC-Aufgaben Kap. 4 Operationalisierung & Indikatorenauswahl (X aus 5)

Realisierung von Wortakzent

Signifikanzprüfung. Peter Wilhelm Herbstsemester 2014

Ergebnisse VitA und VitVM

1 Beispiel zur Methode der kleinsten Quadrate

Inhalt. I. Deskriptive Statistik Einführung Die Grundgesamtheit Merkmale und Verteilungen Tabellen und Grafiken...

Statistik. Ludwig Fahrmeir Rita Künstler Iris Pigeot Gerhard Tutz. Der Weg zur Datenanalyse. Springer. Zweite, verbesserte Auflage

Multivariate Verfahren

Statistik II Übung 1: Einfache lineare Regression

Rhythmus in den Sprachen der Welt. Jonathan Harrington

Objektivität und Validität. Testgütekriterien. Objektivität. Validität. Reliabilität. Objektivität

Warum haben es Schnellsprecher schwerer?

Masterstudiengang Sprache und Kommunikation: Angewandte Kommunikations- und Sprachwissenschaft

Statistik I für Betriebswirte Vorlesung 14

Voice Quality - Laryngeale Settings

11. Sitzung Auswertungsstrategien; Darstellung von Forschungsergebnissen

Geschichte der Psycholinguistik

Multivariate Verfahren

Vorlesung: Statistik II für Wirtschaftswissenschaft

Statistik II Übung 1: Einfache lineare Regression

Können Spezialisten für Redeflussstörungen Poltern von Stottern unterscheiden?

Phonetik im Unterricht Deutsch als Fremdsprache

Statistische Methoden der Datenanalyse Wintersemester 2012/2013 Albert-Ludwigs-Universität Freiburg

SPSS V Gruppenvergleiche ( 2 Gruppen) abhängige (verbundene) Stichproben

Umfrage, eine Methode für die Maturaarbeit. GM.my in Zusammenarbeit mit der Kantonsschule Olten

Spektra von periodischen Signalen. Resonanz. Jonathan Harrington

I. Deskriptive Statistik 1

If something has a 50% chance of happening, then 9 times out of 10 it will. Yogi Berra

Grundzüge der Marktforschung

Nicht-Eindeutigkeit der Orthographie: [f]: <f> Farbe <v> Vogel <ph> Pharao <w> Löwchen <pf> Pfahl (Standard-, Umgangslautung)

Franz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum

5. Spezielle stetige Verteilungen

Forschungsstatistik I

Standardisierte Vorgehensweisen und Regeln zur Gewährleistung von: Eindeutigkeit Schlussfolgerungen aus empirischen Befunden sind nur dann zwingend

Phonetisches Laboratorium Schreien im Labor

Statistische Grundlagen I

FRIKATIVE Wie sehen stimmhafte und stimmlose Frikative im Spektrogramm aus? Was unterscheidet die stimmlosen von den stimmhaften Frikativen? Worin unt

Statistik II Übung 2: Multivariate lineare Regression

Glossar. Cause of Effects Behandelt die Ursache von Auswirkungen. Debriefing Vorgang der Nachbesprechung der experimentellen Untersuchung.

Kapitel 4: Merkmalszusammenhänge

Multivariate Verfahren

Entwicklungsauffälligkeiten bei Kindern Schulprobleme bei visueller Wahrnehmungsstörung

3 Grundlagen statistischer Tests (Kap. 8 IS)

VS PLUS

4 Ergebnisse. 4.1 Evaluierung der Methode. 4.2 Allgemeine Beobachtungen. 4.3 CD68-positive Zellen 4 ERGEBNISSE 17

Entscheidung zwischen zwei Möglichkeiten auf der Basis unsicherer (zufälliger) Daten

Prof. Dr. Walter F. Tichy Dr. Matthias Müller Sommersemester 2006

Bivariate Analyseverfahren

Bewältigungsstrategien von Patienten vor und nach Nierentransplantation

Psychologische Methodenlehre Statistik

6. Schätzverfahren für Parameter

Grundlagen sportwissenschaftlicher Forschung Inferenzstatistik 2

Children s Production of Word Accents in Swedish Revisited (Mitsuhiko Ota; Edinburgh)

Einführung in die Phonetik und Phonologie. Grundbegriffe

3.2 Grundlagen der Testtheorie Methoden der Reliabilitätsbestimmung

Analyse von Querschnittsdaten. Spezifikation der unabhängigen Variablen

1 Einleitung und Grundlagen 1

Tutorium Testtheorie. Termin 3. Inhalt: WH: Hauptgütekriterien- Reliabilität & Validität. Charlotte Gagern

Transkript:

Altersbedingte Veränderungen der Stimme und Sprechweise von Frauen Eine perzeptive und akustische Analyse

Übersicht Stand der Forschung Ziele Daten und Methoden Ergebnisse der perzeptiven Analyse Ergebnisse der akustischen Analyse Zusammenfassung

Stand der Forschung physische Veränderungen im Sprechapparat: Lunge wird kleiner, leichter, steifer, die Muskulatur wird weniger und schwächer Kehlkopf senkt sich ab; Kehlkopfknorpel verknöchern, Muskulatur versteift Stimmlippen werden länger, steifer, muskulärer Anteil nimmt ab Schädel wächst weiter, Gesichtsmuskulatur und Zunge werden schwächer und steifer Nervensystem verliert an Masse (Myelin aber auch Neuronen); Verringerung von Neurotransmittern

Stand der Forschung kognitive Veränderungen: angeeignetes Wissen nimmt (bis zum 60. Lebensjahr) zu Effektivität der Verarbeitung nimmt stetig ab

Stand der Forschung Ist das Alter eines Sprechers über auditive Wahrnehmung zu ermitteln? Ptacek & Sander (1966): 99% richtige Zuordnungen gelesener Äußerungen zu jung vs. alt Linville & Fisher (1985): 51% richtige Zuordnungen gehaltener Vokale zu 3 Kategorien Shipp & Hollien (1969): r=0,88 zwischen (gemittelten) Schätzungen des Alters (PA) in Jahren anhand gelesener Rede und dem chronologischen Alter (CA) Hartman (1979): r=0,93

Stand der Forschung von (Laien-) Hörern genannte Charakteristika höheren Sprecheralters: tiefere Sprechtonlage vermehrte Heiserkeit, Rauhigkeit der Stimme vermehrte Behauchung vermehrte Zittrigkeit vermehrte Stimm(-an-)spannung (engl.: strain) reduzierte Lautstärke langsamere Sprechweise weniger genaue Artikulation vermehrtes Verzögern des Redeflusses (hesitancy) längere Sprechpausen

Stand der Forschung akustische Veränderungen des Sprachsignals: mittlere Grundfrequenz: ist konstant (Baken, 1987) steigt (Hummert, 1999) sinkt (Linville, 2001) Dispersion der Grundfrequenz: max. Stimmumfang sinkt (Böhme & Hecker, 1970) Spannbreite und SD sinkt in Rede (Decoster & Debruyne, 1997 sowie Morgan & Rastatter, 1986) SD steigt in Rede (Morris & Brown, 1994 sowie Hummert, 1999) SD steigt in kontrollierter Phonation (Linville, 2001)

Stand der Forschung Perturbationsmaße: steigen, aber eher durch schlechteren gesundheitlichen Zustand (Orlikoff, 1990 sowie Ramig & Ringel, 1983) Jitter aber mehr als Shimmer (Brückl, 2003 sowie Winkler, 2008) verändern sich nicht (Decoster & Debruyne, 1997) Modulationsmaße: Perturbationsmaße, die zeitlich größere Abschnitte integrieren sind besser Modulation? (Linville, 2001) Frequenztremor-Intensitäts-Index steigt (Brückl, 2003)

Stand der Forschung Maße der spektralen Energieverteilung visuelle Begutachtung von Sonagrammen von Männern: spektrales Rauschen nimmt zu (Ramig, 1983) LTAS-Bänder um 6300 Hz gelesener Rede zeigen erhöhte Energie (Linville, 2002) H1-H2 gehaltener Vokale sinkt im Querschnitt aber nicht im Längsschnitt (Decoster & Debruyne, 1997)

Stand der Forschung Maße spektralen Rauschens MDVP-Maße steigen im Gruppenvergleich (Xue & Deliyski, 2001) MDVP-Maße nicht verändert (Brückl & Sendlmeier 2003) Praat-HNR (spezifischer Bänder) sinkt, aber abhängig vom Äußerungstyp und Art der Altersskala (Winkler, 2008): gar nicht bei spontaner Rede bei Wörtern mit CA bei Vokalen mit PA

Formanten Stand der Forschung Point of Formant Concentration sinkt (Endres et al., 1971) zunehmende Zentralisation (Benjamin, 1982, 1997 sowie Rastatter & Jacques, 1990) nur im /u/ steigt F1 und sinkt F2 eher konstante Formantlagen (Rastatter et al., 1997) Sprechgeschwindigkeit AR sinkt (Oyer & Deal, 1985 sowie Smith et al., 1987) AR bliebt konstant (Hoit et al., 1989) AR sinkt nur beim Lesen (Brückl & Sendlmeier, 2003)

Ziele Beantwortung der Fragen: Wie genau lässt sich das an einer Äußerung perzeptiv ermittelbare Alter (PA) bestimmen? Wie genau lässt sich das chronologische Alter (CA) einer Sprecherin aus dem PA bestimmen? Welche akustischen Merkmale erzeugen die Alterswirkung? Welche akustischen Merkmale indizieren das CA?

Daten: Sprecherinnen Ziele bei der Auswahl: möglichst große Variabilität hinsichtlich des Alters Verallgemeinerbarkeit der Ergebnisse auf möglichst große Grundgesamtheit ad-hoc-stichproben Querschnitt: 88 Sprecherinnen, 20 bis 87 Jahre alt Längsschnitt: 9 Sprecherinnen, bei der 1. Aufnahme 20 bis 87 Jahre alt, 5 Jahre älter bei der 2.

Daten: Äußerungen gehaltene Vokale drei Qualitäten: /a/, /i/ und /u/ drei Abschnitte: Anfang, quasi-stationärer Mittelteil, Schluss [Beispiel: stat. /a/ jung, stat. /a/ alt] gelesene Rede [Bsp.: jung, alt] spontane Rede [Bsp.: jung, alt]

Methodischer Dreiklang zur Analyse mündlicher Kommunikation: perzeptive Analyse auditive Generierung von Hypothesen Bestimmung vergleichbarer Einheiten perzeptive akustische Analyse statistische Integration

Methoden: Transkription

Methoden: perzeptive Analyse Verfahren 1. Konstruktion von Wahrnehmungsverfahren 2. Bestimmung der Urteilerreliabilität 3. Bestimmung der Validität der Urteile (Korrelation) 4. Regression Zweck 1. Beurteilung des Sprecheralters durch Hörer 2. Prüfung der Übereinstimmung der Hörer; Beurteilung der Genauigkeit des PA; Zusammenfassung (beste) Schätzer des PA 3. Prüfung des Zusammenhangs von CA und PA 4. Bestimmung von Modellen zur Vorhersage von CA aus PA

Methoden: akustische Analyse Verfahren 1.Berechnung akustischer Maße 2.Korrelation mit CA und PA 3.Regression mit CA und PA Zweck 1.Abbildung von Konstrukten der Stimme/Sprechweise 2.Bestimmung des Zusammenhangs mit CA und PA 3.Bestimmung von Modellen zur Vorhersage von CA und PA und Auswahl unabhängiger Prädiktoren

Wahrnehmungserhebungen 5 verschiedene Wahrnehmungserhebungen: 4 an den Querschnittsdaten, 1 an den Längsschnittsdaten Gemeinsamkeiten der Querschnittserhebungen: das (chronologische) Alter wird durch Hörer abgeschätzt Unterschiede der Querschnittserhebungen: verschiedene Hörer unterschiedliche Teilmengen und Abfolgen der Äußerungen Papier und Bleistift vs. computergestützt

Wahrnehmungserhebungen 115 Hörer in der (zusammengefassten) Querschnittserhebung im Mittel (pro Äußerungstyp) zwischen 37,92 (spontane Rede) und 21 (/u/-enden) 34 Hörer in der Längsschnittserhebung, 32 davon beurteilen Vokaläußerungen Aufgabe der Hörer in der Längsschnittserhebung: Paarvergleich von gleichen Äußerungen gleicher Sprecherinnen

Ergebnisse: Perzeptive Analyse Urteilerübereinstimmung im Querschnitt ICC(2,1) ICC(3,1) ICC(2,k) ICC(3,k)

Ergebnisse: Perzeptive Analyse Messgenauigkeit der Hörer (Querschnitt): aus den Reliabilitäten (ICCs) lassen sich Konfidenzintervalle für (neue) Hörerschätzungen ableiten: KI(95%;2,1): spontane Rede: 25,43 Jahre /i/-enden: 37,39 Jahre KI(95%;2,k) spontane Rede: 4,68 Jahre (k=37,92) /i/-enden: 12,78 Jahre (k=22)

Ergebnisse: Perzeptive Analyse Die Mittel pro Äußerungstyp der (Schätzungen der) perzeptiven Alterswerte (Querschnitt):

Ergebnisse: Perzeptive Analyse Korrelation zwischen PA und CA pro Äußerungstyp (Querschnitt):

Ergebnisse: Perzeptive Analyse Regression zur Erklärung von CA aus PA (Querschnitt): CA(gelR.50) = 1,13 * 50 2,8 = 53,7 KI(95%,50) = [38,9; 68,3]

Ergebnisse: Perzeptive Analyse Urteilerübereinstimmung im Längsschnitt ICC(3,1) ICC(3,k)

Ergebnisse: Perzeptive Analyse Korrelation zwischen PA und CA pro Äußerungstyp (Längsschnitt): auf 5%-tigem α-fehler-niveau signifikant sind nur die Korrelationen anhand der Redeäußerungen: r(spo.) = 0,731 (p = 0,008) r(gel.) = 0,653 (p = 0,020) Hörerschätzungen anhand der Vokale sind zwar reliabel, aber nicht valide

Konstrukte und Parameter Konstrukte Stimmtonlage Stimmumfang Stimmvariabilität Rauhigkeit/Heiserkeit Zittrigkeit der Stimme Parameter Grundfrequenz (F0) Minimum, Maximum und Range von F0 Standardabweichung, Variationskoeffizient von F0 Grundfrequenzperturbation (Jitter) Amplitudenperturbation (Shimmer) Grundfrequenzmodulation (Frequenztremor) Amplitudenmodulation (Amplitudentremor)

Konstrukte und Parameter Konstrukte Behauchung, Harmonizität, Stimmhärte Energieverteilung Sprechintensität Sprechpausen Parameter Quotienten aperiodischer und periodischer Energie in bestimmten Frequenzbändern) Intensitäten in LTAS-Bändern Intensität von Harmonischen Formantfrequenzen vocal effort Pausendauern Pausenanzahlen

Konstrukte und Parameter Konstrukte Artikulationsgenauigkeit Sprechgeschwindigkeit Artikulationsmonotonie Parameter Anzahl der Elaborationen und Reduktionen Lautzahlminderungsquotient Formanttransitionen in Diphthongen Formantdifferenzen in Vokal- Nasal-Diphonen Artikulationsrate um Koartikulationseffekte korrigierte Artikulationsrate Phon-Jitter Phon-Shimmer Silben-Jitter

Konstrukte und Parameter Konstrukte Artikulationsmonotonie Betonung Parameter Silben-Shimmer Veränderungen der Perturbationsmaße von Silbe zu Silbe Dauern (kanonisch) betonter und unbetonter Vokale Dispersion von F1 und F2 von unbetonten Vokalen

Ergebnisse: Akustische Analyse kein einziger Parameter erzielt an allen Äußerungstypen höchstsignifikante Korrelationen nur die Standardabweichung der Periodendauern ist bei beiden Redetypen und auch bei gehaltenen Vokalen ein passables Korrelat beider Altersskalen: r(spor,ca) = 0,431 r(/a/e,pa) = 0,610

Ergebnisse: Akustische Analyse Beste Korrelate: Typ spor gelr /a/a /a/s /a/e /i/a /i/s /i/e /u/a /u/s /u/e CA Pf0md Pf0- ATrI_ ATrI_ Pf0- Pf3 MFTR FTrI_ Pt0sd FTrI vow min_a Ln Ln min Ln Ln -0,636-0,583 0,585 0,489-0,458-0,350 0,529 0,383 0,363 0,405 PA Pf0md Pf0- FTrI_ FTrI_ Pf0- Pf3 FTrI_ FTrI_ Pf3sd Pt0sd FTrI vow min_a Ln Ln min Ln Ln Ln -0,621-0,648 0,521 0,635 0,669-0,439 0,689 0,466 0,408 0,644 0,559 Korrelate von PA und CA unterscheiden sich nicht wesentlich Parameter korrelieren tendenziell besser mit PA

Ergebnisse: Akustische Analyse Ergebnisse der Verknüpfung mehrerer Parameter zur Erklärung des Alters: multiple Regression erreicht 75% Varianzaufklärung von CA, Prädiktoren sind: Minimum der Grundfrequenz (/a/ in gel. Rede) Standardabweichung der Periodendauern (Nasale gel. Rede) Geräuschintensität 70-4500Hz (spon. Rede) Frequenztremorintensität (gehaltene /i/-s) korr. Artikulationsrate (gel. Rede) Ampl.-Perturbation, Glättung 11 (Vokale in spon. Rede) Intensität im LTAS-Band um 6000Hz (gel. Rede)

Ergebnisse: Akustische Analyse Ergebnisse der Verknüpfung mehrerer Parameter zur Erklärung des Alters: multiple Regression erreicht 68% Varianzaufklärung von PA (gel. Rede), Prädiktoren sind: Minimum der Grundfrequenz von /a/-segmenten korr. Artikulationsrate Standardabweichung des 4. Formanten vokalischer Segmente

Ergebnisse: Akustische Analyse akustische Prädiktoren des Alters: spontane Rede: Grundfrequenzparameter (Amplituden-) Perturbationsparameter Maße des spektralen Rauschens gelesene Rede: Grundfrequenzparameter Dauer- bzw. Sprechgeschwindigkeitsmaße gehaltene Vokale: Tremormaße Grundfrequenzparameter (Amplituden-) Perturbationsparameter Maße des spektralen Rauschens

Ergebnisse: Akustische Analyse Ergebnisse bzgl. der replizierten Maße: Formanten: sind untauglich Intensitäten der Harmonischen: untauglich LTAS-Intensitäten: um 6000Hz erhöht, unklar Sprechgeschwindigkeit: sinkt (beim Lesen) Grundfrequenz: sinkt, v.a. das Minimum Spektrales Rauschen: steigt Perturbationen: steigen, Amp.P geeigneter

Ergebnisse: Akustische Analyse Ergebnisse bzgl. der neu und weiter entwickelten Maße: korrigierte Sprechrate: besser als nicht korrigierte... Aufwand? Maße der prosodischen Veränderung von Silben und Phonen: ok, aber verbesserungswürdig segmentweise Extraktion stimmqualitativer Maße: lohnend Maße spektralen Rauschens: besser als bestehende Tremormaße: liefern beste Korrelate (an Vokalen)

Zusammenfassung verschiedene Äußerungstypen vermitteln unterschiedliches Ausmaß an Information über das Alter in verschiedenen Äußerungstypen wird Alter durch unterschiedliche akustische Merkmale vermittelt

Zusammenfassung die präziseste Schätzung des Sprecheralters erhält man durch die Zusammenfassung mehrerer Hörerurteile Verfahren zur Bestimmung der Urteiler- Reliabilität wurden auf die Anwendbarkeit an unvollständigen Urteilsmatrizen erweitert generell unterschätzen Hörer das Alter von Sprechrinnen EMU liegt bei ca. 5 Jahren

Zusammenfassung Genauigkeit der Altersschätzung über akustische Algorithmen erreicht (erstmals) diejenige einer Hörergruppe besonderen Beitrag hierzu leisten: Tremormaße Maße spektraler Energieverteilungen Messung stimmqualitativer Parameter an (phonetischen) Rede(-segmenten) um Koartikulationseffekte korrigierte Sprechrate Maße der Sprechtonlage

Zusammenfassung Die Stimme älterer Sprecherinnen ist zittriger tiefer rauer behauchter die Sprechweise (beim Lesen) ist langsamer und/oder weniger genau artikuliert durch vermehrte/längere Sprechpausen unterbrochen