Sprachverarbeitung I

Größe: px
Ab Seite anzeigen:

Download "Sprachverarbeitung I"

Transkript

1 Institut für Technische Informatik und Kommunikationsnetze Eidgenössische Technische Hochschule Zürich Swiss Federal Institute of Technology Zurich Ecole polytechnique fédérale de Zurich Politecnico federale di Zurigo Skript zur Vorlesung Sprachverarbeitung I Departement Informationstechnologie und Elektrotechnik Herbstsemester 2007 Beat Pfister und René Beutler Institut für technische Informatik und Kommunikationsnetze ETH Zürich

2

3 Inhaltsverzeichnis Vorbemerkungen 1 1 Grundsätzliches zur Sprache Sprache als Kommunikationsmittel Lautsprachliche Kommunikation Geschriebene vs. gesprochene Sprache Die Beschreibung von Sprache Die linguistischen Ebenen Die phonetische Schrift Die akustisch-phonetische Ebene Die Prosodie der Sprache Die menschliche Sprachproduktion Übersicht über den Sprechapparat Die Funktion des Sprechapparates Die Artikulation der Sprachlaute Das menschliche Gehör Die Wahrnehmung der Schallintensität Periodizität und Tonhöhe Die Phasenwahrnehmung Der Verdeckungseffekt Wahrnehmung der Sprachlaute Komplexität der Sprache Übersicht über die Sprachverarbeitung Was in einem Sprachsignal steckt Teilgebiete der Sprachverarbeitung Sprachcodierung i

4 ii Vorlesung Sprachverarbeitung I HS Signalformcodierung Logarithmischer Kompander Differenz-Codierer Modellierung von Sprachsignalen Sprachsynthese Spracherkennung Sprecheridentifikation Darstellung und Eigenschaften des Sprachsignals Digitalisieren von Sprachsignalen Bandbegrenzungsfilter Zeit- und Amplitudendiskretisierung Rekonstruktionsfilter Darstellung digitaler Sprachsignale im Zeitbereich Darstellung im Frequenzbereich Kombinierte Zeit-Frequenz-Bereichs-Darstellungen Sprachmerkmale und ihre Darstellung Grundfrequenz Formanten Dauer der Laute Intensität der Laute Analyse des Sprachsignals Kurzzeitanalyse Kurzzeitspektrum Diskrete Fouriertransformation Eigenschaften der DFT Fensterfunktionen Die Frequenzauflösung der DFT Zeitabhängige Fouriertransformation Das Leistungsdichtespektrum Schätzung des Leistungsdichtespektrums mittels DFT Eigenschaften des Periodogramms Die Autokorrelation Definition der Autokorrelationsfunktion

5 Vorlesung Sprachverarbeitung I HS 2007 iii Eigenschaften der Autokorrelationsfolge Kurzzeit-Autokorrelation Lineare Prädiktion Herleitung der LPC-Analyse Autokorrelationsmethode Kovarianzmethode Sprachmodellierung mittels linearer Prädiktion Interpretation der linearen Prädiktion Die Präemphase Homomorphe Analyse Das verallgemeinerte Superpositionsprinzip Homomorphe Systeme Das DFT-Cepstrum Das LPC-Cepstrum Das Mel-Cepstrum Das Delta-Cepstrum Mittelwertfreie Cepstren Die cepstrale Distanz Vektorquantisierung Realisation der Vektorquantisierung Generieren eines Codebuches K-means-Algorithmus LBG-Algorithmus Einführung in die Sprachsynthese Zusammenhang zwischen Lautsprache und Schrift Teile der Sprachsynthese Die Transkription Die phonoakustische Stufe Lautinventar für die Sprachsynthese Linguistische Grundlagen Festlegen der Lautdifferenzierung Verfahren für die Sprachsignalproduktion Der artikulatorische Ansatz Der Signalmodellierungsansatz

6 iv Vorlesung Sprachverarbeitung I HS Wichtige Eigenschaften von Sprachsignalen Sprachsignalerzeugung mit dem LPC-Modell Sprachsignalerzeugung mit dem Formantmodell Der Verkettungsansatz Sprachsynthese nach dem Verkettungsansatz Wahl der Grundelemente Ausschneiden von Grundelementen Veränderung der prosodischen Grössen Dauer- und F 0 -Veränderung mittels LPC Dauer- und F 0 -Veränderung mittles Fourier-Analyse- Synthese Dauer- und F 0 -Veränderung mittels PSOLA Steuerung der Prosodie Dauersteuerung Die Lautdauer beeinflussende Faktoren Dauersteuerung mit einem linearen Ansatz Dauersteuerung mit einem neuronalen Netz Grundfrequenzsteuerung Die Tonhöhe beeinflussende Faktoren Stilisierung von Grundfrequenzverläufen Linearer Ansatz der Grundfrequenzsteuerung Steuerung der Grundfrequenz mit einem neuronalen Netz Intensitätssteuerung Umsetzung der prosodischen Grössen auf die Laute Prosodische Veränderung der Grundelemente Einführung in die Spracherkennung Die Aufgabe der Spracherkennung Probleme der Spracherkennung Anwendungen Einteilung der Spracherkennungssysteme Historischer Rückblick Merkmalsextraktion Mel-Frequency Cepstral Coefficients (MFCC) Geglättete Mel-Spektren von Vokalen und Frikativen

7 Vorlesung Sprachverarbeitung I HS 2007 v..3 Plosivlaute im geglätteten Mel-Spektrogramm Spektrale Variabilität Rekonstruktion des Signals Spracherkennung mittels Sprachmustervergleich Zeitliche Anpassung zweier Sprachmuster Dynamische Programmierung Dynamische Zeitanpassung (DTW) Anwendungen des DTW-Algorithmus Statistischer Ansatz der Spracherkennung Einleitung Statistische Sicht Hidden-Markov-Modelle (HMM) Phonetisch-akustische Modelle Ein einfaches Lautmodell Ein realistisches Lautmodell Hidden-Markov-Modelle HMM als akustisches Modell Parameter eines HMM Grundlegende Algorithmen Aufbau von Spracherkennern mit HMM Einzelworterkenner Spracherkenner mit Erkennungsnetzwerk Erkennung kontinuierlicher Sprache Evaluation der Erkennungsleistung Wortfehlerrate Algorithmus zur Bestimmung der Wortfehlerrate A Fourieranalyse und -synthese von Sprachsignalen 181 A.1 Prinzip der Fourier-Analyse-Synthese A.2 Das wirkliche Spektrum eines Signals A.2.1 Die Wahl der Fensterfunktion A.2.2 Analyse eines instationären Signals A Vermindern der Instationarität eines Signals durch Umtastung A Fouriertransformation für instationäre Signale

8 vi Vorlesung Sprachverarbeitung I HS 2007 A.3 Schätzung des Sprachspektrums A.3.1 Ermittlung schwacher spektraler Komponenten A.3.2 Elimination unechter spektraler Maxima A.4 Bestimmung der Grundfrequenz A.4.1 Berechnung der Autokorrelation A.4.2 Detektion des AKF-Maximums A.4.3 Erhöhung der Genauigkeit A.5 Rekonstruktion des Sprachsignals B Veränderung der prosodischen Parameter im Kurzzeitspektrum 203 B.1 Dauerveränderung B.1.1 Grundsätzliches zur Dauerveränderung B.1.2 Minimale Phasenkorrektur B.2 Grundfrequenzveränderung B.2.1 Prinzip der Grundfrequenzveränderung B.2.2 Frequenzskalierung und Formanten B.2.3 Rekonstruktion der Formanten B Approximation des Spektrums durch lineare Prädiktion B Cepstrale Methode B Interpolation des wirklichen Spektrums B.2.4 Frequenzskalierung und Signalbandbreite B Kompensation der Bandbreitenreduktion B Erläuterungen zur Bandbreitenkompensation C Abtastratenwandler 215 C.1 Stationarisierung von Signalausschnitten C.2 Ermitteln von Zwischenabtastwerten C.2.1 Abtastratenvervielfacher C.2.2 Interpolator C.2.3 Abtastratendezimator C.3 Veränderung des Spektrums C.3.1 Veränderung der Frequenz C.3.2 Veränderung der Amplitude C.3.3 Veränderung der Phase D Grundlagen der Wahrscheinlichkeitstheorie 223

9 Vorlesung Sprachverarbeitung I HS 2007 vii Literaturverzeichnis 225 Glossar 227 Index 233

10 viii Vorlesung Sprachverarbeitung I HS 2007

11 Vorbemerkungen Im Deutschen wird unter dem Begriff Sprache sowohl lautliche als auch geschriebene Sprache (Text) verstanden. 1 Da es in dieser Vorlesung hauptsächlich um den Zusammenhang zwischen lautlicher und textlicher Form von Sprache geht, bzw. um die Umsetzung lautlicher Sprache in Text oder umgekehrt, wird konsequent zwischen den beiden Formen unterschieden: Lautsprache bezieht sich stets mehr oder weniger direkt auf das Sprechen oder Hören und wird je nach Zusammenhang auch als akustische oder gesprochene Sprache oder im technischen Sinne auch als Sprachsignal bezeichnet. Text bezeichnet die normale geschriebene Form der Sprache, für die auch Begriffe wie orthographische oder graphemische Form der Sprache verwendet werden. Die technische Umsetzung von Text in Lautsprache wird als Sprachsynthese bezeichnet. Der quasi umgekehrte Prozess, die Spracherkennung, ermittelt aus der Lautsprache den entsprechenden textlichen Inhalt. Die Zielsetzung dieser zweisemestrigen Vorlesung (SPV I und SPV II) besteht darin, die im Zusammenhang mit Sprachsynthese und -erkennung relevanten Grundlagen zu vermitteln. Dazu gehören insbesondere: - Grundkenntnisse über die menschliche Sprachproduktion und -wahrnehmung 2 - Eigenschaften von Sprachsignalen und ihre Darstellung - Grundkenntnisse in Linguistik, insbes. Phonetik, Morphologie und Syntax - die wichtigsten Transformationen und Methoden der digitalen Sprachsignalverarbeitung - statistische Ansätze zur Beschreibung vieldimensionaler Grössen und komplexer Zusammenhänge (Markov-Modelle und neuronale Netze) - Formulierung und Anwendung von Wissen in der Form von Regeln 1 Im Gegensatz dazu gibt es beispielsweise im Englischen die Begriffe speech und language, wobeimit dem ersten ausschliesslich die lautliche Form der Sprache gemeint ist und der zweite sich hauptsächlich auf die geschriebene Form der Sprache bezieht. Der zweite Begriff wird auch dann verwendet, wenn die Unterscheidung zwischen Lautsprache und Text nicht relevant ist. 2 Physiologische Aspekte werden nur soweit behandelt, als sie für das Verständnis der vorgestellten Modellansätze nötig sind. Das Wesentliche ist dabei nicht das Wie, sondern das Was wir hören. 1

12 2 Vorlesung Sprachverarbeitung I HS 2007 Ein Teil dieser Grundlagen, insbesondere die in den beiden letzten Punkten aufgeführten Gebiete, werden in SPV II behandelt. Auf kognitive Theorien dafür, wie beim Menschen der Spracherwerb (das Lernen, insbesondere bei Kindern), die Sprachgenerierung (Umsetzung von Gedanken in Sprache) und das Sprachverstehen vor sich gehen, wird jedoch nicht eingegangen, weil sie, zumindest mit dem heutigen Stand des Wissens, keine wesentliche Hilfe zur Lösung der Probleme im Zusammenhang mit der Sprachsynthese und der -erkennung bieten. Aufbauend auf diesen Grundlagen werden die wichtigsten Ansätze zur Sprachsynthese und -erkennung behandelt. In der Sprachsynthese sind dies: - die Umwandlung von Text in eine phonologische Beschreibung, wie sie im ETH- Sprachsynthesesystem SVOX verwirklicht ist, - einfachere und ausgeklügeltere Ansätze zur Steuerung der Prosodie - und verschiedene Möglichkeiten zum Generieren von Sprachsignalen. In der Spracherkennung werden zwei Prinzipien behandelt: - der ältere Mustererkennungsansatz, der primär in einfachen Systemen zur Anwendung kommt - und die moderne statistische Spracherkennung mittels Hidden-Markov-Modellen und N-Grams (Wortfolgestatistik). Der erste Band des Skripts Sprachverarbeitung umfasst sechs Kapitel zu den folgenden Themen: Das erste Kapitel enthält einführende Angaben zur Sprache als Kommunikationsmittel, zur Beschreibung von Sprache, zur Sprachproduktion und zur akustischen Wahrnehmung. Kapitel 2 vermittelt einen Überblick über die verschiedenen Bereiche der Sprachverarbeitung. Dabei werden auch einige der im Rahmen dieser Vorlesung nicht eingehend behandelten Bereiche gestreift. Das 3. Kapitel zeigt wichtige Darstellungen und Eigenschaften von Sprachsignalen. Im Kapitel 4 werden dann die mathematischen Grundlagen der Verarbeitung von Sprachsignalen behandelt, die in den beiden Kapiteln 5 und gebraucht werden, also für die Sprachsynthese und die Spracherkennung.

Sprachsynthese und Spracherkennung

Sprachsynthese und Spracherkennung 90 Sprachsynthese und Spracherkennung von John N. Holmes Mit 51 Bildern und 69 Übungen mit Lösungshinweisen R. Oldenbourg Verlag München Wien 1991 INHALT Vorwort 11 1 Lautsprachliche Kommunikation 15 1.1

Mehr

Spracherkennung. 8. Sitzung 3. November 2008

Spracherkennung. 8. Sitzung 3. November 2008 Spracherkennung 8. Sitzung 3. November 2008 Überblick 5. Diskretisierung 6. Merkmalsberechnung 7. DTW 8. HMMs 9. Sprachmodellierung w X Textproduktion Artikulation Merkmalsextraktion Dekodierung 2. Sprachproduktion

Mehr

Digitale Signalverarbeitung

Digitale Signalverarbeitung Karl-Dirk Kammeyer, Kristian Kroschel Digitale Signalverarbeitung Filterung und Spektralanalyse mit MATLAB-Übungen 6., korrigierte und ergänzte Auflage Mit 315 Abbildungen und 33 Tabellen Teubner Inhaltsverzeichnis

Mehr

Lesen von Sonagrammen I: Grundlagen. Uwe Reichel IPS, LMU München 16. November 2007

Lesen von Sonagrammen I: Grundlagen. Uwe Reichel IPS, LMU München 16. November 2007 Lesen von Sonagrammen I: Grundlagen Uwe Reichel IPS, LMU München [email protected] 16. November 2007 Inhalt Das Sonagramm: Allgemeines Gewinnung des Sonagramms Zeitsignal Spektrum Spektrogramm

Mehr

Biosignalverarbeitung

Biosignalverarbeitung Peter Husar Biosignalverarbeitung Springer Inhaltsverzeichnis 1 Entstehung bioelektrischer Signale 9 1.1 Das Neuron 9 1.2 Elektrische Erregungsleitung und Projektion 15 2 Verstärkung und analoge Filterung

Mehr

Einführung in die Signalverarbeitung

Einführung in die Signalverarbeitung Einführung in die Signalverarbeitung Phonetik und Sprachverarbeitung, 2. Fachsemester, Block Sprachtechnologie I Florian Schiel Institut für Phonetik und Sprachverarbeitung, LMU München Signalverarbeitung

Mehr

Spracherkennung und Sprachsynthese

Spracherkennung und Sprachsynthese Spracherkennung und Sprachsynthese Einführung in die Computerlinguistik Sommersemester 2012 Peter Kolb Spracherkennung / -synthese Spracherkennung (automatic speech recognition, ASR) Sprachsynthese (text-to-speech,

Mehr

Einführung in die Signalverarbeitung Übung I

Einführung in die Signalverarbeitung Übung I Einführung in die Signalverarbeitung Phonetik und Sprachverarbeitung, 2. Fachsemester, Block Sprachtechnologie I Florian Schiel Institut für Phonetik und Sprachverarbeitung, LMU München Signalverarbeitung

Mehr

Sprachsynthese - ein Überblick

Sprachsynthese - ein Überblick Sprachsynthese - ein Überblick Florian Schiel Florian F Schiel: Sprachsynthese - Übersicht WS 05/06 1 Definition: Produktion von Sprache mit technischen Mitteln Gegensatz: Synthese vs. Wiedergabe (Übergang

Mehr

Sprachdialogsystem mit robuster automatischer Spracherkennung

Sprachdialogsystem mit robuster automatischer Spracherkennung Sprachdialogsystem mit robuster automatischer Spracherkennung Hans-Günter Hirsch Hochschule Niederrhein Fachbereich Elektrotechnik und Informatik Digitale Nachrichtentechnik http://dnt.kr.hs-niederrhein.de

Mehr

Äquivokationen. In der Spracherkennung. Michael Baumann Seminar (mit Bachelorarbeit)

Äquivokationen. In der Spracherkennung. Michael Baumann Seminar (mit Bachelorarbeit) Äquivokationen In der Spracherkennung Michael Baumann 532 0225336 [email protected] Seminar (mit Bachelorarbeit) Inhalt Einführung Äquivokation, Ambiguität, Prosodie Signale Beispiele:

Mehr

V1/2.S Sprachwissenschaft

V1/2.S Sprachwissenschaft V1/2.S Sprachwissenschaft Die Studierenden verfügen über Kenntnisse, die sie befähigen, sprachliche Strukturen zu durchschauen. Sie sind in der Lage, die Einheiten und Regeln der sprachlichen Kommunikation

Mehr

Technische Beschreibung der akustischen Signalkette

Technische Beschreibung der akustischen Signalkette Technische Beschreibung der akustischen Signalkette Wichtige Aufgabe: Vielfältige Medien Gestaltung akustischer Kommunikationsketten (Sprache, Geräusche, Musik, CD, Radio, mp3,...) Unterschiedlichste Information

Mehr

Inhaltsverzeichnis 1 Vorbemerkungen zur Sprachkommunikation Wahrnehmung und Messung von Schall... 9

Inhaltsverzeichnis 1 Vorbemerkungen zur Sprachkommunikation Wahrnehmung und Messung von Schall... 9 Inhaltsverzeichnis 1 Vorbemerkungen zur Sprachkommunikation...1 1.1 Einführung in das Buch, das Sprecher Hörer Modell...1 1.2 Bemerkungen zu Fachbegriffen...5 2 Wahrnehmung und Messung von Schall...9 2.1

Mehr

Spracherkennung. Gliederung:

Spracherkennung. Gliederung: Spracherkennung Gliederung: - Einführung - Geschichte - Spracherkennung - Einteilungen - Aufbau und Funktion - Hidden Markov Modelle (HMM) - HMM bei der Spracherkennung - Probleme - Einsatzgebiete und

Mehr

Digitale Verarbeitung analoger Signale

Digitale Verarbeitung analoger Signale Digitale Verarbeitung analoger Signale Digital Signal Analysis von Samuel D. Stearns und Don R. Hush 7., durchgesehene Auflage mit 317 Bildern, 16 Tabellen, 373 Übungen mit ausgewählten Lösungen sowie

Mehr

Inhaltsverzeichnis. Daniel von Grünigen. Digitale Signalverarbeitung. mit einer Einführung in die kontinuierlichen Signale und Systeme

Inhaltsverzeichnis. Daniel von Grünigen. Digitale Signalverarbeitung. mit einer Einführung in die kontinuierlichen Signale und Systeme Inhaltsverzeichnis Daniel von Grünigen Digitale Signalverarbeitung mit einer Einführung in die kontinuierlichen Signale und Systeme ISBN (Buch): 978-3-446-44079-1 ISBN (E-Book): 978-3-446-43991-7 Weitere

Mehr

Signale, Transformationen

Signale, Transformationen Signale, Transformationen Signal: Funktion s(t), t reell (meist t die Zeit, s eine Messgröße) bzw Zahlenfolge s k = s[k], k ganzzahlig s reell oder komplex s[k] aus s(t): Abtastung mit t = kt s, s[k] =

Mehr

Burkhard Röscher. Meßverfahren zur Analyse DQPSK-modulierter OFDM-Signale

Burkhard Röscher. Meßverfahren zur Analyse DQPSK-modulierter OFDM-Signale Burkhard Röscher Meßverfahren zur Analyse DQPSK-modulierter OFDM-Signale I Inhaltsverzeichnis 1 Einleitung und Zielstellung 1 2 OFDM-Übertragungsstrecke 3 2.1 Übersicht 3 2.2 Das komplexe Basisbandsignal

Mehr

Spanisch: Phonetikund Phonologie

Spanisch: Phonetikund Phonologie Christoph Gabriel/Trudel Meisenburg Maria Selig Spanisch: Phonetikund Phonologie Eine Einführung narr VERLAG Inhalt Vorbemerkung Akürzungen ix xi 1. Einleitung 1 1.1 Der Forschungsgegenstand von Phonetik

Mehr

Grundlagen der Analyse von Sprachdatenbanken. Jonathan Harrington

Grundlagen der Analyse von Sprachdatenbanken. Jonathan Harrington Grundlagen der nalyse von Sprachdatenbanken Jonathan Harrington Die Laborsprache Fast alle ntersuchungen in der Experimentalphonetik im 20 Jahrhundert befassen sich mit der Laborsprache. Warum? Competence/performance

Mehr

Messung & Darstellung von Schallwellen

Messung & Darstellung von Schallwellen Messung Digitalisierung Darstellung Jochen Trommer [email protected] Universität Leipzig Institut für Linguistik Phonologie/Morphologie SS 2007 Messung Digitalisierung Darstellung Überblick Messung

Mehr

Prof. Dr. Marcus Spies Institut f. Informatik LMU München

Prof. Dr. Marcus Spies Institut f. Informatik LMU München Planung für die Vorlesung Spracherkennung und integrierte Dialoganwendungen Sommersemester 2005 am Lehrstuhl Medieninformatik des Institut für Informatik der LMU München Prof. Dr. Marcus Spies Institut

Mehr

9.1.3 Der Verkettungsansatz

9.1.3 Der Verkettungsansatz 242 9. Sprachsynthese: Phonoakustische Stufe Lautübergänge störende Klänge oder Geräusche, welche die Verständlichkeit stark beeinträchtigen. Wie die Laute sind auch die Formanttransitionen der Lautübergänge

Mehr

Numerische Methoden. Thomas Huckle Stefan Schneider. Eine Einführung für Informatiker, Naturwissenschaftler, Ingenieure und Mathematiker.

Numerische Methoden. Thomas Huckle Stefan Schneider. Eine Einführung für Informatiker, Naturwissenschaftler, Ingenieure und Mathematiker. Thomas Huckle Stefan Schneider Numerische Methoden Eine Einführung für Informatiker, Naturwissenschaftler, Ingenieure und Mathematiker 2. Auflage Mit 103 Abbildungen und 9 Tabellen 4Q Springer Inhaltsverzeichnis

Mehr

Einführung in die Phonologie und Graphematik

Einführung in die Phonologie und Graphematik Einführung in die Phonologie und Graphematik Bearbeitet von Nanna Fuhrhop, Jörg Peters 1. Auflage 2013. Buch inkl. Online-Nutzung. XV, 301 S. Softcover ISBN 978 3 476 02373 5 Format (B x L): 15,5 x 23,5

Mehr

Automatische Spracherkennung

Automatische Spracherkennung Ernst Günter Schukat-Talamazzini Automatische Spracherkennung Grundlagen, statistische Modelle und effiziente Algorithmen Technische Universität Darmetadt FACHBEREICH INFORMATIK BIBLIOTHEK MH Invsntar-Nr.:

Mehr

Sitzung 5. Spektrogramm

Sitzung 5. Spektrogramm Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar: x-achse: Zeit (ms) - vgl. Dauer in der Perzeption y-achse: Frequenz (Hz) - vgl. Tonhöhe und Klangqualität in der Perzeption Schwärzungsgrad: Energie

Mehr

Digitale Signalverarbeitung. mit MATLAB

Digitale Signalverarbeitung. mit MATLAB Martin Werner Digitale Signalverarbeitung mit MATLAB Grundkurs mit 16 ausführlichen Versuchen 3., vollständig überarbeitete und aktualisierte Auflage Mit 159 Abbildungen und 67 Tabellen Studium Technik

Mehr

Akustische Phonetik. Uwe Reichel, Phil Hoole IPS, LMU München

Akustische Phonetik. Uwe Reichel, Phil Hoole IPS, LMU München Akustische Phonetik Uwe Reichel, Phil Hoole IPS, LMU München Phonetische Vorgänge Die Bereiche des signalphonetischen Bandes Aus Pompino-Marschall (1995), Abb. 2, S. 14 Inhalt Teil I: Allgemeine Akustik

Mehr

Gunnar Fant (1960): Acoustic theory of speech production. Gerold Ungeheuer (1962): Elemente einer akustischen Theorie der Vokalartikulation

Gunnar Fant (1960): Acoustic theory of speech production. Gerold Ungeheuer (1962): Elemente einer akustischen Theorie der Vokalartikulation Formanten Gipfel im Spektrum, Energiemaxima: Formanten Formanten entstehen infolge selektiver Verstärkung bestimmter Frequenzbereiche, entsprechend der Resonanzcharakteristika des menschlichen Sprechapparates.

Mehr

Einführung in die Phonetik und Phonologie. Allgemeiner Überblick

Einführung in die Phonetik und Phonologie. Allgemeiner Überblick Einführung in die Phonetik und Phonologie Allgemeiner Überblick Phonetik und Phonologie Die beiden Bezeichnungen Phonetik und Phonologie sind aus dem griechischen Wort ϕωνþ (phōnē) abgeleitet, welches

Mehr

Einführung in die automatische Spracherkennung. SS 2007 Klaus Kasper

Einführung in die automatische Spracherkennung. SS 2007 Klaus Kasper Einführung in die automatische Spracherkennung SS 2007 Klaus Kasper 3. Vorlesung Parametrisierung Fourier-Transformation Diskrete Fourier-Transformation (DFT) Fast Fourier-Transformation (FFT) Anmerkungen

Mehr

Digitale Signalverarbeitung

Digitale Signalverarbeitung Daniel Ch. von Grünigen Digitale Signalverarbeitung mit einer Einführung in die kontinuierlichen Signale und Systeme 4. Auflage Mit 222 Bildern, 91 Beispielen, 80 Aufgaben sowie einer CD-ROM mit Lösungen

Mehr

Einführung in die Signalverarbeitung

Einführung in die Signalverarbeitung Einführung in die Signalverarbeitung Phonetik und Sprachverarbeitung, 2. Fachsemester, Block Sprachtechnologie I Florian Schiel Institut für Phonetik und Sprachverarbeitung, LMU München Signalverarbeitung

Mehr

RelAtive SpecTrAl (RASTA) Processing of Speech

RelAtive SpecTrAl (RASTA) Processing of Speech RelAtive SpecTrAl (RASTA) Processing of Speech Paul Glad Mihai 23.11.06 Gliederung Einleitung Wieso RASTA? RASTA erläutert Probleme Modulationsspektrum von Sprache Methode RASTA erweitert Lin-Log Rasta

Mehr

Sprachverstehen. Vorlesung an der TU Chemnitz Wintersemester 2012/2013 Dr. Johannes Steinmüller

Sprachverstehen. Vorlesung an der TU Chemnitz Wintersemester 2012/2013 Dr. Johannes Steinmüller Sprachverstehen Vorlesung an der TU Chemnitz Wintersemester 2012/2013 Dr. Johannes Steinmüller Johannes Steinmüller 1/B309 Tel.: 531 35198 [email protected] Seite zur Vorlesung: http://www.tu-chemnitz.de/informatik/ki/edu/spraver/

Mehr

Signale und Systeme. Grundlagen und Anwendungen mit MATLAB

Signale und Systeme. Grundlagen und Anwendungen mit MATLAB Signale und Systeme Grundlagen und Anwendungen mit MATLAB Von Professor Dr.-Ing. Dr. h. c. Norbert Fliege und Dr.-Ing. Markus Gaida Universität Mannheim Mit 374 Bildern, 8 Tabellen und 38 MATLAB-Projekten

Mehr

Spracherkennung Hauptseminar Interaktion von Mensch und Roboter

Spracherkennung Hauptseminar Interaktion von Mensch und Roboter Spracherkennung Hauptseminar Interaktion von Mensch und Roboter Vladislav Lazarov [email protected] Was ist Spracherkennung? Was ist (automatische) Spracherkennung? Identifikation und Analyse gesprochener

Mehr

Inhalt. Vorwort Einführung 15

Inhalt. Vorwort Einführung 15 FFT- Anwendungen von E. Oran Brigham übersetzt von Seyed Ali Azizi Mit 207 Bildern, 6 Tabellen, 41 Beispielen und 188 Aufgaben sowie Programmen in BASIC R. Oldenbourg Verlag München Wien 1997 Vorwort 11

Mehr

Martin Meyer. Signalverarbeitung. Analoge und digitale Signale, Systeme und Filter 5. Auflage STUDIUM VIEWEG+ TEUBNER

Martin Meyer. Signalverarbeitung. Analoge und digitale Signale, Systeme und Filter 5. Auflage STUDIUM VIEWEG+ TEUBNER Martin Meyer Signalverarbeitung Analoge und digitale Signale, Systeme und Filter 5. Auflage STUDIUM VIEWEG+ TEUBNER VII 1 Einführung 1 1.1 Das Konzept der Systemtheorie 1 1.2 Übersicht über die Methoden

Mehr

Digitale Signalverarbeitung Bernd Edler

Digitale Signalverarbeitung Bernd Edler Digitale Signalverarbeitung Bernd Edler Wintersemester 2010/2011 Wesentliche Inhalte der Vorlesung Abtastung z-transformation Lineare zeitinvariante Systeme Diskrete Fouriertransformation Filterentwurf

Mehr

Mustererkennung. Termine: Montag 9:45-11:15, F138 Mittwoch 11:30-13:00, D108 Freitag 11:30-13:00, A210. Skript, Literatur, Anmeldung im Netz

Mustererkennung. Termine: Montag 9:45-11:15, F138 Mittwoch 11:30-13:00, D108 Freitag 11:30-13:00, A210. Skript, Literatur, Anmeldung im Netz Mustererkennung Termine: Montag 9:45-11:15, F138 Mittwoch 11:30-13:00, D108 Freitag 11:30-13:00, A210 Skript, Literatur, Anmeldung im Netz Mustererkennung Anwendungsbeispiele für Mustererkennung? Mustererkennung

Mehr

Spektrumanalyse. Inhalt. I. Einleitung 2. II. Hauptteil 2-8

Spektrumanalyse. Inhalt. I. Einleitung 2. II. Hauptteil 2-8 Fachhochschule Aachen Campus Aachen Hochfrequenztechnik Hauptstudium Wintersemester 2007/2008 Dozent: Prof. Dr. Heuermann Spektrumanalyse Erstellt von: Name: Mario Schnetger Inhalt I. Einleitung 2 II.

Mehr

xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis

xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis Inhaltsverzeichnis 1 Computerlinguistik Was ist das? 1 1.1 Aspekte der Computerlinguistik.................. 1 1.1.1 Computerlinguistik: Die Wissenschaft........... 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen.....

Mehr

Algorithmen & Datenstrukturen Blatt 0 HS 17

Algorithmen & Datenstrukturen Blatt 0 HS 17 Eidgenössische Technische Hochschule Zürich Ecole polytechnique fédérale de Zurich Politecnico federale di Zurigo Federal Institute of Technology at Zurich Departement Informatik 25. September 2017 Markus

Mehr

System- und Signaltheorie

System- und Signaltheorie Otto Mildenberger System- und Signaltheorie Grundlagen für das informationstechnische Studium 3., überarbeitete und erweiterte Auflage Mit 166 Bildern vieweg 1 Einleitung 1 1.1 Aufgaben der Systemtheorie

Mehr

Vorwort. I Einführung 1. 1 Einleitung Signale Systeme Signalverarbeitung Struktur des Buches 9. 2 Mathematische Grundlagen 11

Vorwort. I Einführung 1. 1 Einleitung Signale Systeme Signalverarbeitung Struktur des Buches 9. 2 Mathematische Grundlagen 11 Vorwort V I Einführung 1 1 Einleitung 3 1.1 Signale 4 1.2 Systeme 4 1.3 Signalverarbeitung 6 1.4 Struktur des Buches 9 2 Mathematische Grundlagen 11 2.1 Räume 11 2.1.1 Metrischer Raum 12 2.1.2 Linearer

Mehr

Versuch 3: Anwendungen der schnellen Fourier-Transformation (FFT)

Versuch 3: Anwendungen der schnellen Fourier-Transformation (FFT) Versuch 3: Anwendungen der schnellen Fourier-Transformation (FFT) Ziele In diesem Versuch lernen Sie zwei Anwendungen der Diskreten Fourier-Transformation in der Realisierung als recheneffiziente schnelle

Mehr

I. II. I. II. III. IV. I. II. III. I. II. III. IV. I. II. III. IV. V. I. II. III. IV. V. VI. I. II. I. II. III. I. II. I. II. I. II. I. II. III. I. II. III. IV. V. VI. VII. VIII.

Mehr

R. Oldenbourg Verlag München Wien 1997

R. Oldenbourg Verlag München Wien 1997 Systemtheorie 1 Allgemeine Grundlagen, Signale und lineare Systeme im Zeit- und Frequenzbereich von Professor Dr.-Ing. Rolf Unbehauen 7., überarbeitete und erweiterte Auflage Mit 260 Abbildungen und 148

Mehr

Puls-Code-Modulation. Thema: PCM. Ziele

Puls-Code-Modulation. Thema: PCM. Ziele Puls-Code-Modulation Ziele Mit diesen rechnerischen und experimentellen Übungen wird die Vorgehensweise zur Abtastung und linearen Quantisierung eines analogen Signals erarbeitet. Bei der Abtastung werden

Mehr

Einführung in die Signalverarbeitung

Einführung in die Signalverarbeitung Einführung in die Signalverarbeitung Phonetik und Sprachverarbeitung, 2. Fachsemester, Block Sprachtechnologie I Florian Schiel Institut für Phonetik und Sprachverarbeitung, LMU München Signalverarbeitung

Mehr

Phonetische Beiträge zur maschinellen Spracherkennung. ExInTra. "Extrem wertintervallgestützte Transkription",

Phonetische Beiträge zur maschinellen Spracherkennung. ExInTra. Extrem wertintervallgestützte Transkription, LDV-Forum - Bd. 6, Nr. 2, Jg. 1989, S. 19-27 Phonetische Beiträge zur maschinellen Spracherkennung ExInTra Extremwertintervallgestützte Transkription Klaus Günther Schweisthal, Patrick Schweisthal Thomas

Mehr

Digitale Signalverarbeitung Bernd Edler

Digitale Signalverarbeitung Bernd Edler Digitale Signalverarbeitung Bernd Edler Wintersemester 2008/2009 Wesentliche Inhalte der Vorlesung Abtastung z-transformation Lineare zeitinvariante Systeme Diskrete Fouriertransformation Systeme bei stochastischer

Mehr

Einführung in die automatische Spracherkennung. SS 2007 Klaus Kasper

Einführung in die automatische Spracherkennung. SS 2007 Klaus Kasper Einführung in die automatische Spracherkennung SS 27 Klaus Kasper Praktikum Montag, 16:h 19:15h (Y-Raster) Ort: D15/22 erste Veranstaltung: 2.4.27 Programmiersprache Ihrer Wahl (C/C ++ /C#, Java, ) Zulassungsvoraussetzung

Mehr

Kapitel 2: Spracherkennung Automatisches Verstehen gesprochener Sprache

Kapitel 2: Spracherkennung Automatisches Verstehen gesprochener Sprache Automatisches Verstehen gesprochener Sprache. Spracherkennung Martin Hacker Bernd Ludwig Günther Görz Professur für Künstliche Intelligenz Department Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg

Mehr

Adaptive Systeme. Sommersemester Prof. Dr. -Ing. Heinz-Georg Fehn. Prof. Dr. rer. nat. Nikolaus Wulff

Adaptive Systeme. Sommersemester Prof. Dr. -Ing. Heinz-Georg Fehn. Prof. Dr. rer. nat. Nikolaus Wulff Adaptive Systeme Sommersemester 2015 Prof. Dr. -Ing. Heinz-Georg Fehn Prof. Dr. rer. nat. Nikolaus Wulff Prof. Dr. H.-G. Fehn und Prof. Dr. N. Wulff 1 Adaptive Systeme Adaptives System: ein System, das

Mehr

Einführung in die Systemtheorie

Einführung in die Systemtheorie Bernd Girod, Rudolf Rabenstein, Alexander Stenger Einführung in die Systemtheorie Signale und Systeme in der Elektrotechnik und Informationstechnik 4., durchgesehene und aktualisierte Auflage Mit 388 Abbildungen

Mehr

Seminar Akustik. Aufgaben zu Teil 1 des Skripts Uwe Reichel, Phil Hoole

Seminar Akustik. Aufgaben zu Teil 1 des Skripts Uwe Reichel, Phil Hoole Seminar Akustik. Aufgaben zu Teil des Skripts Uwe Reichel, Phil Hoole Welche Kräfte wirken auf ein schwingendes Teilchen?! von außen angelegte Kraft (z.b. Glottisimpulse)! Rückstellkräfte (Elastizität,

Mehr

Digitale Signalverarbeitung

Digitale Signalverarbeitung Karl Dirk Kammeyer I Kristian Kroschel Digitale Signalverarbeitung Filterung und Spektralanalyse mit MATLAB -Übungen 7., erweiterte und korrigierte Auflage Mit 312 Abbildungen und 33 Tabellen STUDIUM 11

Mehr

Spracherkennung. 4. Sitzung 23. Oktober 2008

Spracherkennung. 4. Sitzung 23. Oktober 2008 Spracherkennung 4. Sitzung 23. Oktober 2008 Überblick Wiederholung 3 Akustik 3 Artikulation Studie zu Veränderung der Artikulation bei Lärm 4 Sprachwahrnehmung Kategoriale Sprachwahrnehmung beim Menschen

Mehr

bonn.de bonn.de

bonn.de  bonn.de [email protected] bonn.de http://www.ikp.uni bonn.de 023 Vorlesungsskripten deutsch bilingual deutsch/englisch Allgemein zur Sprachsignalverarbeitung Speziell zu Kapitel 1 gsv_1.1 t 250 ms/zeile gsv_1.2 t

Mehr

Verfahren zur robusten automatischen Spracherkennung

Verfahren zur robusten automatischen Spracherkennung Verfahren zur robusten automatischen Spracherkennung Hans-Günter Hirsch Hochschule Niederrhein Fachbereich Elektrotechnik und Informatik Digitale Nachrichtentechnik http://dnt.kr.hs-niederrhein.de Ansätze

Mehr

Einführung in die automatische Spracherkennung

Einführung in die automatische Spracherkennung Einführung in die automatische Spracherkennung Klausur 30.07.2008 Name:... Vorname:... Matr.-Nr:... Studiengang:... Hinweise: 1. Schreiben Sie bitte auf jedes Zusatz-Blatt Ihren Namen und Ihre Matrikelnummer.

Mehr

Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln

Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Computerlinguistische Grundlagen Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Was ist Computerlinguistik? Definition Anwendungen Fragestellung

Mehr

Administratives. Beat Siebenhaar

Administratives. Beat Siebenhaar Beat Siebenhaar Administratives http://www.uni-leipzig.de/~siebenh/kurse/ v_phonetik_phonologie/ Lektüre: Grassegger; Duden 6; Hall; Skript weiterführende Lektüre auf der Webseite http://www.uni-leipzig.de/~siebenh/

Mehr

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Sarah Bosch,

Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Sarah Bosch, Ivana Daskalovska Willkommen zur Übung Einführung in die Computerlinguistik Kontakt: [email protected] Betreff: EICL Wiederholung Aufgabe 1 Was ist Computerlinguistik? 4 Was ist Computerlinguistik?

Mehr

Digitale Signalverarbeitung Bernd Edler

Digitale Signalverarbeitung Bernd Edler Digitale Signalverarbeitung Bernd Edler Wintersemester 2007/2008 Wesentliche Inhalte der Vorlesung Abtastung z-transformation Lineare zeitinvariante Systeme Diskrete Fouriertransformation Systeme bei stochastischer

Mehr

Die akustische Analyse von Sprachlauten.

Die akustische Analyse von Sprachlauten. Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel. Vom Zeitsignal zum Spektrum s t a m 1. Ein Teil vom Sprachsignal aussuchen: die Zeitauflösung

Mehr

Merkmalsextraktion mit Hilfe des LPC-Modells

Merkmalsextraktion mit Hilfe des LPC-Modells Merkmalsextraktion mit Hilfe des LPC-Modells Stephanie Wist Fakultät für Informatik Universität Ulm Abstract Im folgenden werde ich mit möglichst wenigen mathematischen Hilfsmittlen den Aufbau und die

Mehr

Prosodie Variation und Inferenz Phonologische Grundlagen

Prosodie Variation und Inferenz Phonologische Grundlagen Prosodie Variation und Inferenz Beat Siebenhaar Frank Liedtke Phonetische Grundlagen Rückblick! Suprasegmentalia und Prosodie! Koartikulation, Assimilation, Schnellsprechformen! Silbe als artikulatorische

Mehr

4. Beschreibung von LTI-Systemen mit der Fourier-Transformation

4. Beschreibung von LTI-Systemen mit der Fourier-Transformation Die Fourier-Transformation 1. Anwendungsbeispiele der Fourier-Transformation 2. Die kontinuierliche Fourier-Transformation 3. Die Fourier-Reihe 4. Beschreibung von LTI-Systemen mit der Fourier-Transformation

Mehr

Erkennung und Erzeugung gesprochener Sprache

Erkennung und Erzeugung gesprochener Sprache Erkennung und Erzeugung gesprochener Sprache Sebastian Pado Einführung in die Computerlinguistik 2004/2005 1 Einführung Viele computerlinguistische Anwendungen gehen von textbasierter Ein/Ausgabe aus (I.a.)

Mehr

Spracherkennung TAREQ HASCHEMI HAW-SEMINAR WS16

Spracherkennung TAREQ HASCHEMI HAW-SEMINAR WS16 Spracherkennung TAREQ HASCHEMI HAW-SEMINAR WS16 AGENDA Grundlegendes Sprache Anwendungsbeispiele Schwierigkeit Architektur Spracherkennungssystem Hidden Markov Modell Verbesserung durch Kombination mit

Mehr

Akustische basierte Kommunikation

Akustische basierte Kommunikation Akustische basierte Kommunikation Voraussetzungen für akustische basierte sprachliche Kommunikation: Schallerzeugung Schallwahrnehmung Schallleitendes Medium Akustische Basiseigenschaften von Sprachlauten:

Mehr

Einführung in die Phonetik und Phonologie. Grundbegriffe

Einführung in die Phonetik und Phonologie. Grundbegriffe Einführung in die Phonetik und Phonologie Grundbegriffe Phonetik und Phonologie Lautlehre Phonologie Sprechakt- lautlehre Phonetik Sprachgebilde- lautlehre Phonologie Phonematik Phonemik Phonetik und Phonologie

Mehr

Konsonanten: Artikulationsart

Konsonanten: Artikulationsart Jochen Trommer [email protected] Universität Leipzig Institut für Linguistik Phonetikanalyse SS 2007 Artikulationsarten Approximanten Plosive Frikative Affrikaten Laterale Nasale geschlagene Laute

Mehr

Digitale Signalverarbeitung mit MATLAB

Digitale Signalverarbeitung mit MATLAB Martin Werner Digitale Signalverarbeitung mit MATLAB Grundkurs mit 16 ausführlichen Versuchen 4., durchgesehene und ergänzte Auflage Mit 180 Abbildungen und 76 Tabellen STUDIUM VIEWEG+ TEUBNER 1 Erste

Mehr

Sprachproduktion- und Sprachperzeption. Jonathan Harrington

Sprachproduktion- und Sprachperzeption. Jonathan Harrington Sprachproduktion- und Sprachperzeption Jonathan Harrington Die Variabilität 1. Die Variabilität: warum entsteht Variabilität in der gesprochenen Sprache? 2. Wie entschlüsseln Hörer die intendierten Laute

Mehr

Probe-Klausur zur Vorlesung Multilinguale Mensch-Maschine Kommunikation 2013

Probe-Klausur zur Vorlesung Multilinguale Mensch-Maschine Kommunikation 2013 Probe-Klausur zur Vorlesung Multilinguale Mensch-Maschine Kommunikation 2013 Klausurnummer Name: Vorname: Matr.Nummer: Bachelor: Master: Aufgabe 1 2 3 4 5 6 7 8 max. Punkte 10 5 6 7 5 10 9 8 tats. Punkte

Mehr

Signale und Systeme Reaktion linearer Systeme auf stationäre stochastische Signale

Signale und Systeme Reaktion linearer Systeme auf stationäre stochastische Signale Signale und Systeme Reaktion linearer Systeme auf stationäre stochastische Signale Gerhard Schmidt Christian-Albrechts-Universität zu Kiel Technische Faculty of Engineering Fakultät Elektrotechnik Institute

Mehr