Echtzeit-Analyse/Synthese von Sprachsignalen unter Berücksichtigung des Sprachverständlichkeitsindex (SII)



Ähnliche Dokumente
Bildverarbeitung Herbstsemester Fourier-Transformation

Versuch 3: Anwendungen der schnellen Fourier-Transformation (FFT)

MATLAB Kurs 2010 Teil 2 Eine Einführung in die Frequenzanalyse via MATLAB

DFT / FFT der Titel der Präsentation wiederholt (Ansicht >Folienmaster) Dipl.-Ing. Armin Rohnen, Fakultät 03, rohnen@hm.edu

1. Wie viel Zinsen bekommt man, wenn man 7000,00 1 Jahr lang mit 6 % anlegt?

VAD - Voice Activity Detection -

Wie ist das Wissen von Jugendlichen über Verhütungsmethoden?

Melanie Kaspar, Prof. Dr. B. Grabowski 1

Klausur zur Vorlesung Signale und Systeme

Prüfung SS Mechatronik. Prof. Dr.-Ing. K. Wöllhaf

Andreas Schilling - Light Peak und Silicon Photonics Link

Technik der Fourier-Transformation

1.3.2 Resonanzkreise R L C. u C. u R. u L u. R 20 lg 1 , (1.81) die Grenzkreisfrequenz ist 1 RR C . (1.82)

System Dynamics. Simulation von Systemen in Powersim. Systemische Prozess und Organisationsberatung Individuelles Coaching für Führungskräfte

Webseiten mit fragwürdigen Aufrufen von "spy & track" - Unternehmen

Fourier-Zerlegung, Fourier-Synthese

Messtechnik-Praktikum. Spektrumanalyse. Silvio Fuchs & Simon Stützer. c) Berechnen Sie mit FFT (z.b. ORIGIN) das entsprechende Frequenzspektrum.

Spezielle Lebenslösung für die Grafts zum Aufbewahren - Songul Alci

Grundlagen der Künstlichen Intelligenz

Im Jahr t = 0 hat eine Stadt Einwohner. Nach 15 Jahren hat sich die Einwohnerzahl verdoppelt. z(t) = at + b

Grundlagen der Computer-Tomographie

Sichere Anleitung Zertifikate / Schlüssel für Kunden der Sparkasse Germersheim-Kandel. Sichere . der

Wir stehen für Wettbewerb und Medienvielfalt. Analyse des Verlaufs der Multiband-Auktion Dr. Georg Serentschy

Vfg 40/ Frequenznutzungsparameter: Maximale äquivalente Strahlungsleistung (ERP) / Maximale Magnetische Feldstärke. Frequenzbereich in MHz 1)

Access [basics] Rechnen in Berichten. Beispieldatenbank. Datensatzweise berechnen. Berechnung im Textfeld. Reporting in Berichten Rechnen in Berichten

Simulink: Einführende Beispiele

ANHÄNGE. Delegierte Verordnung (EU) Nr.../.. der Kommission vom XXX

Einführung in den Reportgenerator

Signalübertragung und -verarbeitung

MICROSOFT WORD 2007 SERIENBRIEFE

Grundlagen der Videotechnik. Redundanz

Relaunch der PI3-Website

Hinweise zur Kalibrierung von Kameras mit einer AICON Kalibriertafel

Kapitel 1: Einrichten der Kostenrechnung. Kanzleientwicklungsdialog, Stand 04 11, DATEV Seite 1 von 8

Newsletter Datum:

Rechtsanwalt Michael Drasdo, Fachanwalt für Miet- und Wohnungseigentumsrecht. Die Stimmrechtswertigkeit im Rahmen der Verwalterbestellung

Kybernetik Laplace Transformation

RTA-BW Version 6.16 Anderungsbeschreibung

Das neue digitale Alarmierungsnetz

FRAGEBOGEN ANWENDUNG DES ECOPROWINE SELBSTBEWERTUNG-TOOLS

Versicherungsrechtliche und beitragsrechtliche Beurteilung von

A2.3: Sinusförmige Kennlinie

Anwendungsbeispiel zu XML -MathML

Auswertungsbogen Versorgungskapazitäten & Public Health

Modulationsanalyse. Amplitudenmodulation

Förderung bisher nach Richtlinien vom

Was-wäre-wenn-Analysen - Szenarien

1 Einleitung. Lernziele. automatische Antworten bei Abwesenheit senden. Einstellungen für automatische Antworten Lerndauer. 4 Minuten.

Weiterbildung - Therapie und Coaching mit Brainspotting

Signale und Systeme. A1 A2 A3 Summe

Würfelt man dabei je genau 10 - mal eine 1, 2, 3, 4, 5 und 6, so beträgt die Anzahl. der verschiedenen Reihenfolgen, in denen man dies tun kann, 60!.

Qualitätsmanagement. Andreas Bäuml SWT-Projekt WS 07/08

Vfg 30 / 2014, geändert mit Vfg 36 / 2014, geändert mit Vfg 69 / 2014

FLUGSPORTGRUPPE ZÜRCHER-OBERLAND SCHULUNG CHARTERUNG RUNDFLÜGE

Cofiba - Anlagenspiegel ein Add-On der C3 Consulting Group GmbH. C3 Consulting Group GMBH /// Schlehdornstr. 3 /// Grünwald /// GERMANY

Lacke. Farbe hat einen Namen: HORNBACH. Intelligentes Nummernsystem. Automatische Farbharmonien. Wunschfarbe online bestellen - So geht s:

Störgeräuschreduktion bei stimmhaften Sprachsignalen

Eignungsnachweis von Prüfprozessen

Herzlich Willkommen. zum Workshop 1. Runde. Handlungsschwerpunkt: Dorfentwicklung und ländliche Lebensqualität. LEADER Lippe-Möhnesee

Machen Sie sich stadtbekannt! Das Branchenbuch auf abendblatt.de die ideale Kommunikationsstrategie für Ihr Unternehmen.

Schwingungsanalyse an elektrischen Maschinen

1. In welchen Prozess soll LPA eingeführt werden und warum? (Auslöser und Prozess)

Allg. u. Anorg. Chemie

So geht s Schritt-für-Schritt-Anleitung

Das Quelle-Filter-Modell der Vokalproduktion

Preis- und Leistungsverzeichnis der Host Europe GmbH. Domain & Mail V 2.1. Stand:

Einflussparameter bei gepulster GD-ToF- MS für Echtzeit-Speziierungsanalyse

Energieeffizienz. Ergebnisse einer repräsentativen Telefonbefragung bei 400 B2B-Finanzentscheidern

Ein Blick voraus. des Autors von C++: Bjarne Stroustrup Conrad Kobsch

MTV-Klausurvorbereitung, TFH Berlin, Cornelius Bradter

Stornierungsbedingungen und weitere Voraussetzungen

= = = = = = = = = = = = = = = = = =

Projektdokumentation

Leitfaden für Turnierveranstalter

Dreamweaver 8 Einführung

7.3 Einrichtung 13. Monatslohn. Auszahlung Ende Jahr / Ende der Beschäftigung

Ventilatorgeräusch mehr als nur Schallpegel und Frequenzspektrum. Christian Haag, ebm-papst Mulfingen

Der HIV-Antikörper-Schnelltest aus Sicht des Labormediziners. Dr. Thomas Berg, Berlin

Fachhochschule Düsseldorf Fachbereich Maschinenbau und Verfahrenstechnik. Praktikum Elektrotechnik und Antriebstechnik

Anforderungsanalyse: Tutor

Application Bulletin

Warum die Regelrente nicht die Regel ist!

Um die Rücklagen ordnungsgemäß zu verbuchen, ist es wichtig, Schritt-für-Schritt vorzugehen:

Aktualisierung des Internet-Browsers

Güte von Tests. die Wahrscheinlichkeit für den Fehler 2. Art bei der Testentscheidung, nämlich. falsch ist. Darauf haben wir bereits im Kapitel über

Computer Schulung, Shop, Support, Service und Büro Center

Oberstufenkoordination. Informationen zur Wahl der Prüfungsfächer im Abitur

Übungsaufgaben Tilgungsrechnung

Folgende didaktische Hinweise können bei der Unterrichtsgestaltung hilfreich sein.

Einrichtung von Mozilla Thunderbird

WinWerk. Prozess 6a Rabatt gemäss Vorjahresverbrauch. KMU Ratgeber AG. Inhaltsverzeichnis. Im Ifang Effretikon

Stapelverarbeitung Skalieren von Bildern

Feuersteintagung 2014

Statisches und dynamisches Verhalten eines 3D-Druckers. - Überschwingverhalten der X- und Y-Achse -

Hauptprüfung Fachhochschulreife Baden-Württemberg

Absicherung der Zuverlässigkeit im Produktlebenslauf. Projekt Coaching

2. Besonderheit Teilnehmereinkommen für ALG II - Empfänger:

Auswirkungen verschiedener Anonymisierungsverfahren und Erarbeitung von Korrekturverfahren in ausgewählten GLMs

Produktbeschreibung. MCD Audio Analyzer. Softline. Modline. Funktionen und Merkmale des Produkts. Conline. Boardline. Avidline. Pixline.

Transkript:

Allgemeine Nachrichtentechnik Prof. Dr.-Ing. Udo Zölzer Echtzeit-Analyse/Synthese von Sprachsignalen unter Berücksichtigung des Sprachverständlichkeitsindex (SII) Von Sayak Ghosh Choudhury Prof. Dr.-Ing. Udo Zölzer

Motivation Echtzeit-Analyse und Synthese von Sprachsignalen Berechnung des Sprachverständlichkeitsindex (SII) Verbesserung der Sprachverständlichkeit in Flugzeugen Schlechte Sprachverständlichkeit bei Kapitändurchsage oder Stewardessdurchsage durch falsche Mikrofonhaltung durch Nebengeräusche im Cockpit oder Catering-Bereich einfacher Lautsprecher in der Fahrgastkabine 2

Gliederung System zur Analyse und Synthese Rauschschätzung Sprachverständlichkeitsindex Software-Realisierung Zusammenfassung und Ausblick 3

System zur Analyse/Synthese ST-FFT: Short Time Fast Fourier Transform ST-IFFT: Short Time Inverse Fast Fourier Transform SV: Signalverarbeitung RS: Rauschschätzung TA: Terzanalyse SII: Speech Intelligibility Index 4

Analyse und Synthese (1) Signalblock lesen Signalblock durch diskrete Ableitung von bilden Spektren von und berechnen 5

Analyse und Synthese (2) Suche der M lokalen Maxima im Spektrum von und 6

Analyse und Synthese (3) Bestimmung der korrekten Frequenz des i-ten Maximums: Bestimmung der Amplitude und Phase durch DFT-Bildung: Amplitude als Betrag und Phase als Argument der komplexen Zahl 7

Analyse und Synthese (4) Rekonstruktion des harmonischen Anteils durch Summe der Sinusoiden Die gefensterten Blöcke werden anschließend überlappend addiert (OLA: Overlap and Add) 8

Rauschschätzung 9

Rauschschätzung (1) Kurzzeit-Leistungsdichtespektrum P_x(k,m) des verrauschten Sprachsignals für die k-te Spektralkomponente und den m-ten Block Kurzzeit-Leistungsdichtespektrum des Störsignals 10

Rauschschätzung (2) Spektral-Minimum-Suche in Teilbänder 11

Sprachverständlichkeitsindex 12

Sprachverständlichkeitsindex (1) Blockbasierte FFT zur Terzanalyse in 18 Frequenzbänder Bestimmung der Beiträge der Spektren des Sprachsignals und Störsignals pro Frequenzband Selbstmaskierungsspektrum für alle Frequenzbänder berechnen Berechnung des Leistungsspektrums für die Maskierung Berechnung des Leistungsspektrums des gehörinternen Rauschens Bestimmung des Leistungsspektrums des gesamten Störsignals Berechnung des Hörbarkeitsfaktors Bestimmung des Sprachverständlichkeitsindex mit Bandgewichtungsfaktor 13

Software-Realisierung 14

Zusammenfassung System zur Analyse und Synthese Rauschschätzung Sprachverständlichkeitsindex Software-Realisierung 15

Ausblick Sprachverständlichkeitsindex als Indikator für weitere Verarbeitungsschritte wie Verifikation des Sprachverständlichkeitsindex unter Flugrandbedingungen Automatische Störgeräuschreduktion Automatische Sprachverbesserung Sprachverbesserung durch Verarbeitung von Sinus-/Rausch- /Transienten-Anteilen Mittelung des SII über der Zeit Akzeptanztest bei Anzeige des SII 16

17