Allgemeine Nachrichtentechnik Prof. Dr.-Ing. Udo Zölzer Echtzeit-Analyse/Synthese von Sprachsignalen unter Berücksichtigung des Sprachverständlichkeitsindex (SII) Von Sayak Ghosh Choudhury Prof. Dr.-Ing. Udo Zölzer
Motivation Echtzeit-Analyse und Synthese von Sprachsignalen Berechnung des Sprachverständlichkeitsindex (SII) Verbesserung der Sprachverständlichkeit in Flugzeugen Schlechte Sprachverständlichkeit bei Kapitändurchsage oder Stewardessdurchsage durch falsche Mikrofonhaltung durch Nebengeräusche im Cockpit oder Catering-Bereich einfacher Lautsprecher in der Fahrgastkabine 2
Gliederung System zur Analyse und Synthese Rauschschätzung Sprachverständlichkeitsindex Software-Realisierung Zusammenfassung und Ausblick 3
System zur Analyse/Synthese ST-FFT: Short Time Fast Fourier Transform ST-IFFT: Short Time Inverse Fast Fourier Transform SV: Signalverarbeitung RS: Rauschschätzung TA: Terzanalyse SII: Speech Intelligibility Index 4
Analyse und Synthese (1) Signalblock lesen Signalblock durch diskrete Ableitung von bilden Spektren von und berechnen 5
Analyse und Synthese (2) Suche der M lokalen Maxima im Spektrum von und 6
Analyse und Synthese (3) Bestimmung der korrekten Frequenz des i-ten Maximums: Bestimmung der Amplitude und Phase durch DFT-Bildung: Amplitude als Betrag und Phase als Argument der komplexen Zahl 7
Analyse und Synthese (4) Rekonstruktion des harmonischen Anteils durch Summe der Sinusoiden Die gefensterten Blöcke werden anschließend überlappend addiert (OLA: Overlap and Add) 8
Rauschschätzung 9
Rauschschätzung (1) Kurzzeit-Leistungsdichtespektrum P_x(k,m) des verrauschten Sprachsignals für die k-te Spektralkomponente und den m-ten Block Kurzzeit-Leistungsdichtespektrum des Störsignals 10
Rauschschätzung (2) Spektral-Minimum-Suche in Teilbänder 11
Sprachverständlichkeitsindex 12
Sprachverständlichkeitsindex (1) Blockbasierte FFT zur Terzanalyse in 18 Frequenzbänder Bestimmung der Beiträge der Spektren des Sprachsignals und Störsignals pro Frequenzband Selbstmaskierungsspektrum für alle Frequenzbänder berechnen Berechnung des Leistungsspektrums für die Maskierung Berechnung des Leistungsspektrums des gehörinternen Rauschens Bestimmung des Leistungsspektrums des gesamten Störsignals Berechnung des Hörbarkeitsfaktors Bestimmung des Sprachverständlichkeitsindex mit Bandgewichtungsfaktor 13
Software-Realisierung 14
Zusammenfassung System zur Analyse und Synthese Rauschschätzung Sprachverständlichkeitsindex Software-Realisierung 15
Ausblick Sprachverständlichkeitsindex als Indikator für weitere Verarbeitungsschritte wie Verifikation des Sprachverständlichkeitsindex unter Flugrandbedingungen Automatische Störgeräuschreduktion Automatische Sprachverbesserung Sprachverbesserung durch Verarbeitung von Sinus-/Rausch- /Transienten-Anteilen Mittelung des SII über der Zeit Akzeptanztest bei Anzeige des SII 16
17