Sprachverarbeitung I
|
|
|
- Uwe Kolbe
- vor 9 Jahren
- Abrufe
Transkript
1 Institut für Technische Informatik und Kommunikationsnetze Eidgenössische Technische Hochschule Zürich Swiss Federal Institute of Technology Zurich Ecole polytechnique fédérale de Zurich Politecnico federale di Zurigo Skript zur Vorlesung Sprachverarbeitung I Departement Informationstechnologie und Elektrotechnik Herbstsemester 2007 Beat Pfister und René Beutler Institut für technische Informatik und Kommunikationsnetze ETH Zürich
2
3 Inhaltsverzeichnis Vorbemerkungen 1 1 Grundsätzliches zur Sprache Sprache als Kommunikationsmittel Lautsprachliche Kommunikation Geschriebene vs. gesprochene Sprache Die Beschreibung von Sprache Die linguistischen Ebenen Die phonetische Schrift Die akustisch-phonetische Ebene Die Prosodie der Sprache Die menschliche Sprachproduktion Übersicht über den Sprechapparat Die Funktion des Sprechapparates Die Artikulation der Sprachlaute Das menschliche Gehör Die Wahrnehmung der Schallintensität Periodizität und Tonhöhe Die Phasenwahrnehmung Der Verdeckungseffekt Wahrnehmung der Sprachlaute Komplexität der Sprache Übersicht über die Sprachverarbeitung Was in einem Sprachsignal steckt Teilgebiete der Sprachverarbeitung Sprachcodierung i
4 ii Vorlesung Sprachverarbeitung I HS Signalformcodierung Logarithmischer Kompander Differenz-Codierer Modellierung von Sprachsignalen Sprachsynthese Spracherkennung Sprecheridentifikation Darstellung und Eigenschaften des Sprachsignals Digitalisieren von Sprachsignalen Bandbegrenzungsfilter Zeit- und Amplitudendiskretisierung Rekonstruktionsfilter Darstellung digitaler Sprachsignale im Zeitbereich Darstellung im Frequenzbereich Kombinierte Zeit-Frequenz-Bereichs-Darstellungen Sprachmerkmale und ihre Darstellung Grundfrequenz Formanten Dauer der Laute Intensität der Laute Analyse des Sprachsignals Kurzzeitanalyse Kurzzeitspektrum Diskrete Fouriertransformation Eigenschaften der DFT Fensterfunktionen Die Frequenzauflösung der DFT Zeitabhängige Fouriertransformation Das Leistungsdichtespektrum Schätzung des Leistungsdichtespektrums mittels DFT Eigenschaften des Periodogramms Die Autokorrelation Definition der Autokorrelationsfunktion
5 Vorlesung Sprachverarbeitung I HS 2007 iii Eigenschaften der Autokorrelationsfolge Kurzzeit-Autokorrelation Lineare Prädiktion Herleitung der LPC-Analyse Autokorrelationsmethode Kovarianzmethode Sprachmodellierung mittels linearer Prädiktion Interpretation der linearen Prädiktion Die Präemphase Homomorphe Analyse Das verallgemeinerte Superpositionsprinzip Homomorphe Systeme Das DFT-Cepstrum Das LPC-Cepstrum Das Mel-Cepstrum Das Delta-Cepstrum Mittelwertfreie Cepstren Die cepstrale Distanz Vektorquantisierung Realisation der Vektorquantisierung Generieren eines Codebuches K-means-Algorithmus LBG-Algorithmus Einführung in die Sprachsynthese Zusammenhang zwischen Lautsprache und Schrift Teile der Sprachsynthese Die Transkription Die phonoakustische Stufe Lautinventar für die Sprachsynthese Linguistische Grundlagen Festlegen der Lautdifferenzierung Verfahren für die Sprachsignalproduktion Der artikulatorische Ansatz Der Signalmodellierungsansatz
6 iv Vorlesung Sprachverarbeitung I HS Wichtige Eigenschaften von Sprachsignalen Sprachsignalerzeugung mit dem LPC-Modell Sprachsignalerzeugung mit dem Formantmodell Der Verkettungsansatz Sprachsynthese nach dem Verkettungsansatz Wahl der Grundelemente Ausschneiden von Grundelementen Veränderung der prosodischen Grössen Dauer- und F 0 -Veränderung mittels LPC Dauer- und F 0 -Veränderung mittles Fourier-Analyse- Synthese Dauer- und F 0 -Veränderung mittels PSOLA Steuerung der Prosodie Dauersteuerung Die Lautdauer beeinflussende Faktoren Dauersteuerung mit einem linearen Ansatz Dauersteuerung mit einem neuronalen Netz Grundfrequenzsteuerung Die Tonhöhe beeinflussende Faktoren Stilisierung von Grundfrequenzverläufen Linearer Ansatz der Grundfrequenzsteuerung Steuerung der Grundfrequenz mit einem neuronalen Netz Intensitätssteuerung Umsetzung der prosodischen Grössen auf die Laute Prosodische Veränderung der Grundelemente Einführung in die Spracherkennung Die Aufgabe der Spracherkennung Probleme der Spracherkennung Anwendungen Einteilung der Spracherkennungssysteme Historischer Rückblick Merkmalsextraktion Mel-Frequency Cepstral Coefficients (MFCC) Geglättete Mel-Spektren von Vokalen und Frikativen
7 Vorlesung Sprachverarbeitung I HS 2007 v..3 Plosivlaute im geglätteten Mel-Spektrogramm Spektrale Variabilität Rekonstruktion des Signals Spracherkennung mittels Sprachmustervergleich Zeitliche Anpassung zweier Sprachmuster Dynamische Programmierung Dynamische Zeitanpassung (DTW) Anwendungen des DTW-Algorithmus Statistischer Ansatz der Spracherkennung Einleitung Statistische Sicht Hidden-Markov-Modelle (HMM) Phonetisch-akustische Modelle Ein einfaches Lautmodell Ein realistisches Lautmodell Hidden-Markov-Modelle HMM als akustisches Modell Parameter eines HMM Grundlegende Algorithmen Aufbau von Spracherkennern mit HMM Einzelworterkenner Spracherkenner mit Erkennungsnetzwerk Erkennung kontinuierlicher Sprache Evaluation der Erkennungsleistung Wortfehlerrate Algorithmus zur Bestimmung der Wortfehlerrate A Fourieranalyse und -synthese von Sprachsignalen 181 A.1 Prinzip der Fourier-Analyse-Synthese A.2 Das wirkliche Spektrum eines Signals A.2.1 Die Wahl der Fensterfunktion A.2.2 Analyse eines instationären Signals A Vermindern der Instationarität eines Signals durch Umtastung A Fouriertransformation für instationäre Signale
8 vi Vorlesung Sprachverarbeitung I HS 2007 A.3 Schätzung des Sprachspektrums A.3.1 Ermittlung schwacher spektraler Komponenten A.3.2 Elimination unechter spektraler Maxima A.4 Bestimmung der Grundfrequenz A.4.1 Berechnung der Autokorrelation A.4.2 Detektion des AKF-Maximums A.4.3 Erhöhung der Genauigkeit A.5 Rekonstruktion des Sprachsignals B Veränderung der prosodischen Parameter im Kurzzeitspektrum 203 B.1 Dauerveränderung B.1.1 Grundsätzliches zur Dauerveränderung B.1.2 Minimale Phasenkorrektur B.2 Grundfrequenzveränderung B.2.1 Prinzip der Grundfrequenzveränderung B.2.2 Frequenzskalierung und Formanten B.2.3 Rekonstruktion der Formanten B Approximation des Spektrums durch lineare Prädiktion B Cepstrale Methode B Interpolation des wirklichen Spektrums B.2.4 Frequenzskalierung und Signalbandbreite B Kompensation der Bandbreitenreduktion B Erläuterungen zur Bandbreitenkompensation C Abtastratenwandler 215 C.1 Stationarisierung von Signalausschnitten C.2 Ermitteln von Zwischenabtastwerten C.2.1 Abtastratenvervielfacher C.2.2 Interpolator C.2.3 Abtastratendezimator C.3 Veränderung des Spektrums C.3.1 Veränderung der Frequenz C.3.2 Veränderung der Amplitude C.3.3 Veränderung der Phase D Grundlagen der Wahrscheinlichkeitstheorie 223
9 Vorlesung Sprachverarbeitung I HS 2007 vii Literaturverzeichnis 225 Glossar 227 Index 233
10 viii Vorlesung Sprachverarbeitung I HS 2007
11 Vorbemerkungen Im Deutschen wird unter dem Begriff Sprache sowohl lautliche als auch geschriebene Sprache (Text) verstanden. 1 Da es in dieser Vorlesung hauptsächlich um den Zusammenhang zwischen lautlicher und textlicher Form von Sprache geht, bzw. um die Umsetzung lautlicher Sprache in Text oder umgekehrt, wird konsequent zwischen den beiden Formen unterschieden: Lautsprache bezieht sich stets mehr oder weniger direkt auf das Sprechen oder Hören und wird je nach Zusammenhang auch als akustische oder gesprochene Sprache oder im technischen Sinne auch als Sprachsignal bezeichnet. Text bezeichnet die normale geschriebene Form der Sprache, für die auch Begriffe wie orthographische oder graphemische Form der Sprache verwendet werden. Die technische Umsetzung von Text in Lautsprache wird als Sprachsynthese bezeichnet. Der quasi umgekehrte Prozess, die Spracherkennung, ermittelt aus der Lautsprache den entsprechenden textlichen Inhalt. Die Zielsetzung dieser zweisemestrigen Vorlesung (SPV I und SPV II) besteht darin, die im Zusammenhang mit Sprachsynthese und -erkennung relevanten Grundlagen zu vermitteln. Dazu gehören insbesondere: - Grundkenntnisse über die menschliche Sprachproduktion und -wahrnehmung 2 - Eigenschaften von Sprachsignalen und ihre Darstellung - Grundkenntnisse in Linguistik, insbes. Phonetik, Morphologie und Syntax - die wichtigsten Transformationen und Methoden der digitalen Sprachsignalverarbeitung - statistische Ansätze zur Beschreibung vieldimensionaler Grössen und komplexer Zusammenhänge (Markov-Modelle und neuronale Netze) - Formulierung und Anwendung von Wissen in der Form von Regeln 1 Im Gegensatz dazu gibt es beispielsweise im Englischen die Begriffe speech und language, wobeimit dem ersten ausschliesslich die lautliche Form der Sprache gemeint ist und der zweite sich hauptsächlich auf die geschriebene Form der Sprache bezieht. Der zweite Begriff wird auch dann verwendet, wenn die Unterscheidung zwischen Lautsprache und Text nicht relevant ist. 2 Physiologische Aspekte werden nur soweit behandelt, als sie für das Verständnis der vorgestellten Modellansätze nötig sind. Das Wesentliche ist dabei nicht das Wie, sondern das Was wir hören. 1
12 2 Vorlesung Sprachverarbeitung I HS 2007 Ein Teil dieser Grundlagen, insbesondere die in den beiden letzten Punkten aufgeführten Gebiete, werden in SPV II behandelt. Auf kognitive Theorien dafür, wie beim Menschen der Spracherwerb (das Lernen, insbesondere bei Kindern), die Sprachgenerierung (Umsetzung von Gedanken in Sprache) und das Sprachverstehen vor sich gehen, wird jedoch nicht eingegangen, weil sie, zumindest mit dem heutigen Stand des Wissens, keine wesentliche Hilfe zur Lösung der Probleme im Zusammenhang mit der Sprachsynthese und der -erkennung bieten. Aufbauend auf diesen Grundlagen werden die wichtigsten Ansätze zur Sprachsynthese und -erkennung behandelt. In der Sprachsynthese sind dies: - die Umwandlung von Text in eine phonologische Beschreibung, wie sie im ETH- Sprachsynthesesystem SVOX verwirklicht ist, - einfachere und ausgeklügeltere Ansätze zur Steuerung der Prosodie - und verschiedene Möglichkeiten zum Generieren von Sprachsignalen. In der Spracherkennung werden zwei Prinzipien behandelt: - der ältere Mustererkennungsansatz, der primär in einfachen Systemen zur Anwendung kommt - und die moderne statistische Spracherkennung mittels Hidden-Markov-Modellen und N-Grams (Wortfolgestatistik). Der erste Band des Skripts Sprachverarbeitung umfasst sechs Kapitel zu den folgenden Themen: Das erste Kapitel enthält einführende Angaben zur Sprache als Kommunikationsmittel, zur Beschreibung von Sprache, zur Sprachproduktion und zur akustischen Wahrnehmung. Kapitel 2 vermittelt einen Überblick über die verschiedenen Bereiche der Sprachverarbeitung. Dabei werden auch einige der im Rahmen dieser Vorlesung nicht eingehend behandelten Bereiche gestreift. Das 3. Kapitel zeigt wichtige Darstellungen und Eigenschaften von Sprachsignalen. Im Kapitel 4 werden dann die mathematischen Grundlagen der Verarbeitung von Sprachsignalen behandelt, die in den beiden Kapiteln 5 und gebraucht werden, also für die Sprachsynthese und die Spracherkennung.
Sprachsynthese und Spracherkennung
90 Sprachsynthese und Spracherkennung von John N. Holmes Mit 51 Bildern und 69 Übungen mit Lösungshinweisen R. Oldenbourg Verlag München Wien 1991 INHALT Vorwort 11 1 Lautsprachliche Kommunikation 15 1.1
Spracherkennung. 8. Sitzung 3. November 2008
Spracherkennung 8. Sitzung 3. November 2008 Überblick 5. Diskretisierung 6. Merkmalsberechnung 7. DTW 8. HMMs 9. Sprachmodellierung w X Textproduktion Artikulation Merkmalsextraktion Dekodierung 2. Sprachproduktion
Digitale Signalverarbeitung
Karl-Dirk Kammeyer, Kristian Kroschel Digitale Signalverarbeitung Filterung und Spektralanalyse mit MATLAB-Übungen 6., korrigierte und ergänzte Auflage Mit 315 Abbildungen und 33 Tabellen Teubner Inhaltsverzeichnis
Lesen von Sonagrammen I: Grundlagen. Uwe Reichel IPS, LMU München 16. November 2007
Lesen von Sonagrammen I: Grundlagen Uwe Reichel IPS, LMU München [email protected] 16. November 2007 Inhalt Das Sonagramm: Allgemeines Gewinnung des Sonagramms Zeitsignal Spektrum Spektrogramm
Biosignalverarbeitung
Peter Husar Biosignalverarbeitung Springer Inhaltsverzeichnis 1 Entstehung bioelektrischer Signale 9 1.1 Das Neuron 9 1.2 Elektrische Erregungsleitung und Projektion 15 2 Verstärkung und analoge Filterung
Einführung in die Signalverarbeitung
Einführung in die Signalverarbeitung Phonetik und Sprachverarbeitung, 2. Fachsemester, Block Sprachtechnologie I Florian Schiel Institut für Phonetik und Sprachverarbeitung, LMU München Signalverarbeitung
Spracherkennung und Sprachsynthese
Spracherkennung und Sprachsynthese Einführung in die Computerlinguistik Sommersemester 2012 Peter Kolb Spracherkennung / -synthese Spracherkennung (automatic speech recognition, ASR) Sprachsynthese (text-to-speech,
Einführung in die Signalverarbeitung Übung I
Einführung in die Signalverarbeitung Phonetik und Sprachverarbeitung, 2. Fachsemester, Block Sprachtechnologie I Florian Schiel Institut für Phonetik und Sprachverarbeitung, LMU München Signalverarbeitung
Sprachsynthese - ein Überblick
Sprachsynthese - ein Überblick Florian Schiel Florian F Schiel: Sprachsynthese - Übersicht WS 05/06 1 Definition: Produktion von Sprache mit technischen Mitteln Gegensatz: Synthese vs. Wiedergabe (Übergang
Sprachdialogsystem mit robuster automatischer Spracherkennung
Sprachdialogsystem mit robuster automatischer Spracherkennung Hans-Günter Hirsch Hochschule Niederrhein Fachbereich Elektrotechnik und Informatik Digitale Nachrichtentechnik http://dnt.kr.hs-niederrhein.de
Äquivokationen. In der Spracherkennung. Michael Baumann Seminar (mit Bachelorarbeit)
Äquivokationen In der Spracherkennung Michael Baumann 532 0225336 [email protected] Seminar (mit Bachelorarbeit) Inhalt Einführung Äquivokation, Ambiguität, Prosodie Signale Beispiele:
V1/2.S Sprachwissenschaft
V1/2.S Sprachwissenschaft Die Studierenden verfügen über Kenntnisse, die sie befähigen, sprachliche Strukturen zu durchschauen. Sie sind in der Lage, die Einheiten und Regeln der sprachlichen Kommunikation
Technische Beschreibung der akustischen Signalkette
Technische Beschreibung der akustischen Signalkette Wichtige Aufgabe: Vielfältige Medien Gestaltung akustischer Kommunikationsketten (Sprache, Geräusche, Musik, CD, Radio, mp3,...) Unterschiedlichste Information
Inhaltsverzeichnis 1 Vorbemerkungen zur Sprachkommunikation Wahrnehmung und Messung von Schall... 9
Inhaltsverzeichnis 1 Vorbemerkungen zur Sprachkommunikation...1 1.1 Einführung in das Buch, das Sprecher Hörer Modell...1 1.2 Bemerkungen zu Fachbegriffen...5 2 Wahrnehmung und Messung von Schall...9 2.1
Spracherkennung. Gliederung:
Spracherkennung Gliederung: - Einführung - Geschichte - Spracherkennung - Einteilungen - Aufbau und Funktion - Hidden Markov Modelle (HMM) - HMM bei der Spracherkennung - Probleme - Einsatzgebiete und
Digitale Verarbeitung analoger Signale
Digitale Verarbeitung analoger Signale Digital Signal Analysis von Samuel D. Stearns und Don R. Hush 7., durchgesehene Auflage mit 317 Bildern, 16 Tabellen, 373 Übungen mit ausgewählten Lösungen sowie
Inhaltsverzeichnis. Daniel von Grünigen. Digitale Signalverarbeitung. mit einer Einführung in die kontinuierlichen Signale und Systeme
Inhaltsverzeichnis Daniel von Grünigen Digitale Signalverarbeitung mit einer Einführung in die kontinuierlichen Signale und Systeme ISBN (Buch): 978-3-446-44079-1 ISBN (E-Book): 978-3-446-43991-7 Weitere
Signale, Transformationen
Signale, Transformationen Signal: Funktion s(t), t reell (meist t die Zeit, s eine Messgröße) bzw Zahlenfolge s k = s[k], k ganzzahlig s reell oder komplex s[k] aus s(t): Abtastung mit t = kt s, s[k] =
Burkhard Röscher. Meßverfahren zur Analyse DQPSK-modulierter OFDM-Signale
Burkhard Röscher Meßverfahren zur Analyse DQPSK-modulierter OFDM-Signale I Inhaltsverzeichnis 1 Einleitung und Zielstellung 1 2 OFDM-Übertragungsstrecke 3 2.1 Übersicht 3 2.2 Das komplexe Basisbandsignal
Spanisch: Phonetikund Phonologie
Christoph Gabriel/Trudel Meisenburg Maria Selig Spanisch: Phonetikund Phonologie Eine Einführung narr VERLAG Inhalt Vorbemerkung Akürzungen ix xi 1. Einleitung 1 1.1 Der Forschungsgegenstand von Phonetik
Grundlagen der Analyse von Sprachdatenbanken. Jonathan Harrington
Grundlagen der nalyse von Sprachdatenbanken Jonathan Harrington Die Laborsprache Fast alle ntersuchungen in der Experimentalphonetik im 20 Jahrhundert befassen sich mit der Laborsprache. Warum? Competence/performance
Messung & Darstellung von Schallwellen
Messung Digitalisierung Darstellung Jochen Trommer [email protected] Universität Leipzig Institut für Linguistik Phonologie/Morphologie SS 2007 Messung Digitalisierung Darstellung Überblick Messung
Prof. Dr. Marcus Spies Institut f. Informatik LMU München
Planung für die Vorlesung Spracherkennung und integrierte Dialoganwendungen Sommersemester 2005 am Lehrstuhl Medieninformatik des Institut für Informatik der LMU München Prof. Dr. Marcus Spies Institut
9.1.3 Der Verkettungsansatz
242 9. Sprachsynthese: Phonoakustische Stufe Lautübergänge störende Klänge oder Geräusche, welche die Verständlichkeit stark beeinträchtigen. Wie die Laute sind auch die Formanttransitionen der Lautübergänge
Numerische Methoden. Thomas Huckle Stefan Schneider. Eine Einführung für Informatiker, Naturwissenschaftler, Ingenieure und Mathematiker.
Thomas Huckle Stefan Schneider Numerische Methoden Eine Einführung für Informatiker, Naturwissenschaftler, Ingenieure und Mathematiker 2. Auflage Mit 103 Abbildungen und 9 Tabellen 4Q Springer Inhaltsverzeichnis
Einführung in die Phonologie und Graphematik
Einführung in die Phonologie und Graphematik Bearbeitet von Nanna Fuhrhop, Jörg Peters 1. Auflage 2013. Buch inkl. Online-Nutzung. XV, 301 S. Softcover ISBN 978 3 476 02373 5 Format (B x L): 15,5 x 23,5
Automatische Spracherkennung
Ernst Günter Schukat-Talamazzini Automatische Spracherkennung Grundlagen, statistische Modelle und effiziente Algorithmen Technische Universität Darmetadt FACHBEREICH INFORMATIK BIBLIOTHEK MH Invsntar-Nr.:
Sitzung 5. Spektrogramm
Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar: x-achse: Zeit (ms) - vgl. Dauer in der Perzeption y-achse: Frequenz (Hz) - vgl. Tonhöhe und Klangqualität in der Perzeption Schwärzungsgrad: Energie
Digitale Signalverarbeitung. mit MATLAB
Martin Werner Digitale Signalverarbeitung mit MATLAB Grundkurs mit 16 ausführlichen Versuchen 3., vollständig überarbeitete und aktualisierte Auflage Mit 159 Abbildungen und 67 Tabellen Studium Technik
Akustische Phonetik. Uwe Reichel, Phil Hoole IPS, LMU München
Akustische Phonetik Uwe Reichel, Phil Hoole IPS, LMU München Phonetische Vorgänge Die Bereiche des signalphonetischen Bandes Aus Pompino-Marschall (1995), Abb. 2, S. 14 Inhalt Teil I: Allgemeine Akustik
Gunnar Fant (1960): Acoustic theory of speech production. Gerold Ungeheuer (1962): Elemente einer akustischen Theorie der Vokalartikulation
Formanten Gipfel im Spektrum, Energiemaxima: Formanten Formanten entstehen infolge selektiver Verstärkung bestimmter Frequenzbereiche, entsprechend der Resonanzcharakteristika des menschlichen Sprechapparates.
Einführung in die Phonetik und Phonologie. Allgemeiner Überblick
Einführung in die Phonetik und Phonologie Allgemeiner Überblick Phonetik und Phonologie Die beiden Bezeichnungen Phonetik und Phonologie sind aus dem griechischen Wort ϕωνþ (phōnē) abgeleitet, welches
Einführung in die automatische Spracherkennung. SS 2007 Klaus Kasper
Einführung in die automatische Spracherkennung SS 2007 Klaus Kasper 3. Vorlesung Parametrisierung Fourier-Transformation Diskrete Fourier-Transformation (DFT) Fast Fourier-Transformation (FFT) Anmerkungen
Digitale Signalverarbeitung
Daniel Ch. von Grünigen Digitale Signalverarbeitung mit einer Einführung in die kontinuierlichen Signale und Systeme 4. Auflage Mit 222 Bildern, 91 Beispielen, 80 Aufgaben sowie einer CD-ROM mit Lösungen
Einführung in die Signalverarbeitung
Einführung in die Signalverarbeitung Phonetik und Sprachverarbeitung, 2. Fachsemester, Block Sprachtechnologie I Florian Schiel Institut für Phonetik und Sprachverarbeitung, LMU München Signalverarbeitung
RelAtive SpecTrAl (RASTA) Processing of Speech
RelAtive SpecTrAl (RASTA) Processing of Speech Paul Glad Mihai 23.11.06 Gliederung Einleitung Wieso RASTA? RASTA erläutert Probleme Modulationsspektrum von Sprache Methode RASTA erweitert Lin-Log Rasta
Sprachverstehen. Vorlesung an der TU Chemnitz Wintersemester 2012/2013 Dr. Johannes Steinmüller
Sprachverstehen Vorlesung an der TU Chemnitz Wintersemester 2012/2013 Dr. Johannes Steinmüller Johannes Steinmüller 1/B309 Tel.: 531 35198 [email protected] Seite zur Vorlesung: http://www.tu-chemnitz.de/informatik/ki/edu/spraver/
Signale und Systeme. Grundlagen und Anwendungen mit MATLAB
Signale und Systeme Grundlagen und Anwendungen mit MATLAB Von Professor Dr.-Ing. Dr. h. c. Norbert Fliege und Dr.-Ing. Markus Gaida Universität Mannheim Mit 374 Bildern, 8 Tabellen und 38 MATLAB-Projekten
Spracherkennung Hauptseminar Interaktion von Mensch und Roboter
Spracherkennung Hauptseminar Interaktion von Mensch und Roboter Vladislav Lazarov [email protected] Was ist Spracherkennung? Was ist (automatische) Spracherkennung? Identifikation und Analyse gesprochener
Inhalt. Vorwort Einführung 15
FFT- Anwendungen von E. Oran Brigham übersetzt von Seyed Ali Azizi Mit 207 Bildern, 6 Tabellen, 41 Beispielen und 188 Aufgaben sowie Programmen in BASIC R. Oldenbourg Verlag München Wien 1997 Vorwort 11
Martin Meyer. Signalverarbeitung. Analoge und digitale Signale, Systeme und Filter 5. Auflage STUDIUM VIEWEG+ TEUBNER
Martin Meyer Signalverarbeitung Analoge und digitale Signale, Systeme und Filter 5. Auflage STUDIUM VIEWEG+ TEUBNER VII 1 Einführung 1 1.1 Das Konzept der Systemtheorie 1 1.2 Übersicht über die Methoden
Digitale Signalverarbeitung Bernd Edler
Digitale Signalverarbeitung Bernd Edler Wintersemester 2010/2011 Wesentliche Inhalte der Vorlesung Abtastung z-transformation Lineare zeitinvariante Systeme Diskrete Fouriertransformation Filterentwurf
Mustererkennung. Termine: Montag 9:45-11:15, F138 Mittwoch 11:30-13:00, D108 Freitag 11:30-13:00, A210. Skript, Literatur, Anmeldung im Netz
Mustererkennung Termine: Montag 9:45-11:15, F138 Mittwoch 11:30-13:00, D108 Freitag 11:30-13:00, A210 Skript, Literatur, Anmeldung im Netz Mustererkennung Anwendungsbeispiele für Mustererkennung? Mustererkennung
Spektrumanalyse. Inhalt. I. Einleitung 2. II. Hauptteil 2-8
Fachhochschule Aachen Campus Aachen Hochfrequenztechnik Hauptstudium Wintersemester 2007/2008 Dozent: Prof. Dr. Heuermann Spektrumanalyse Erstellt von: Name: Mario Schnetger Inhalt I. Einleitung 2 II.
xii Inhaltsverzeichnis Generalisierung Typisierte Merkmalsstrukturen Literaturhinweis
Inhaltsverzeichnis 1 Computerlinguistik Was ist das? 1 1.1 Aspekte der Computerlinguistik.................. 1 1.1.1 Computerlinguistik: Die Wissenschaft........... 2 1.1.2 Computerlinguistik und ihre Nachbardisziplinen.....
Algorithmen & Datenstrukturen Blatt 0 HS 17
Eidgenössische Technische Hochschule Zürich Ecole polytechnique fédérale de Zurich Politecnico federale di Zurigo Federal Institute of Technology at Zurich Departement Informatik 25. September 2017 Markus
System- und Signaltheorie
Otto Mildenberger System- und Signaltheorie Grundlagen für das informationstechnische Studium 3., überarbeitete und erweiterte Auflage Mit 166 Bildern vieweg 1 Einleitung 1 1.1 Aufgaben der Systemtheorie
Vorwort. I Einführung 1. 1 Einleitung Signale Systeme Signalverarbeitung Struktur des Buches 9. 2 Mathematische Grundlagen 11
Vorwort V I Einführung 1 1 Einleitung 3 1.1 Signale 4 1.2 Systeme 4 1.3 Signalverarbeitung 6 1.4 Struktur des Buches 9 2 Mathematische Grundlagen 11 2.1 Räume 11 2.1.1 Metrischer Raum 12 2.1.2 Linearer
Versuch 3: Anwendungen der schnellen Fourier-Transformation (FFT)
Versuch 3: Anwendungen der schnellen Fourier-Transformation (FFT) Ziele In diesem Versuch lernen Sie zwei Anwendungen der Diskreten Fourier-Transformation in der Realisierung als recheneffiziente schnelle
I. II. I. II. III. IV. I. II. III. I. II. III. IV. I. II. III. IV. V. I. II. III. IV. V. VI. I. II. I. II. III. I. II. I. II. I. II. I. II. III. I. II. III. IV. V. VI. VII. VIII.
R. Oldenbourg Verlag München Wien 1997
Systemtheorie 1 Allgemeine Grundlagen, Signale und lineare Systeme im Zeit- und Frequenzbereich von Professor Dr.-Ing. Rolf Unbehauen 7., überarbeitete und erweiterte Auflage Mit 260 Abbildungen und 148
Puls-Code-Modulation. Thema: PCM. Ziele
Puls-Code-Modulation Ziele Mit diesen rechnerischen und experimentellen Übungen wird die Vorgehensweise zur Abtastung und linearen Quantisierung eines analogen Signals erarbeitet. Bei der Abtastung werden
Einführung in die Signalverarbeitung
Einführung in die Signalverarbeitung Phonetik und Sprachverarbeitung, 2. Fachsemester, Block Sprachtechnologie I Florian Schiel Institut für Phonetik und Sprachverarbeitung, LMU München Signalverarbeitung
Phonetische Beiträge zur maschinellen Spracherkennung. ExInTra. "Extrem wertintervallgestützte Transkription",
LDV-Forum - Bd. 6, Nr. 2, Jg. 1989, S. 19-27 Phonetische Beiträge zur maschinellen Spracherkennung ExInTra Extremwertintervallgestützte Transkription Klaus Günther Schweisthal, Patrick Schweisthal Thomas
Digitale Signalverarbeitung Bernd Edler
Digitale Signalverarbeitung Bernd Edler Wintersemester 2008/2009 Wesentliche Inhalte der Vorlesung Abtastung z-transformation Lineare zeitinvariante Systeme Diskrete Fouriertransformation Systeme bei stochastischer
Einführung in die automatische Spracherkennung. SS 2007 Klaus Kasper
Einführung in die automatische Spracherkennung SS 27 Klaus Kasper Praktikum Montag, 16:h 19:15h (Y-Raster) Ort: D15/22 erste Veranstaltung: 2.4.27 Programmiersprache Ihrer Wahl (C/C ++ /C#, Java, ) Zulassungsvoraussetzung
Kapitel 2: Spracherkennung Automatisches Verstehen gesprochener Sprache
Automatisches Verstehen gesprochener Sprache. Spracherkennung Martin Hacker Bernd Ludwig Günther Görz Professur für Künstliche Intelligenz Department Informatik Friedrich-Alexander-Universität Erlangen-Nürnberg
Adaptive Systeme. Sommersemester Prof. Dr. -Ing. Heinz-Georg Fehn. Prof. Dr. rer. nat. Nikolaus Wulff
Adaptive Systeme Sommersemester 2015 Prof. Dr. -Ing. Heinz-Georg Fehn Prof. Dr. rer. nat. Nikolaus Wulff Prof. Dr. H.-G. Fehn und Prof. Dr. N. Wulff 1 Adaptive Systeme Adaptives System: ein System, das
Einführung in die Systemtheorie
Bernd Girod, Rudolf Rabenstein, Alexander Stenger Einführung in die Systemtheorie Signale und Systeme in der Elektrotechnik und Informationstechnik 4., durchgesehene und aktualisierte Auflage Mit 388 Abbildungen
Seminar Akustik. Aufgaben zu Teil 1 des Skripts Uwe Reichel, Phil Hoole
Seminar Akustik. Aufgaben zu Teil des Skripts Uwe Reichel, Phil Hoole Welche Kräfte wirken auf ein schwingendes Teilchen?! von außen angelegte Kraft (z.b. Glottisimpulse)! Rückstellkräfte (Elastizität,
Digitale Signalverarbeitung
Karl Dirk Kammeyer I Kristian Kroschel Digitale Signalverarbeitung Filterung und Spektralanalyse mit MATLAB -Übungen 7., erweiterte und korrigierte Auflage Mit 312 Abbildungen und 33 Tabellen STUDIUM 11
Spracherkennung. 4. Sitzung 23. Oktober 2008
Spracherkennung 4. Sitzung 23. Oktober 2008 Überblick Wiederholung 3 Akustik 3 Artikulation Studie zu Veränderung der Artikulation bei Lärm 4 Sprachwahrnehmung Kategoriale Sprachwahrnehmung beim Menschen
bonn.de bonn.de
[email protected] bonn.de http://www.ikp.uni bonn.de 023 Vorlesungsskripten deutsch bilingual deutsch/englisch Allgemein zur Sprachsignalverarbeitung Speziell zu Kapitel 1 gsv_1.1 t 250 ms/zeile gsv_1.2 t
Verfahren zur robusten automatischen Spracherkennung
Verfahren zur robusten automatischen Spracherkennung Hans-Günter Hirsch Hochschule Niederrhein Fachbereich Elektrotechnik und Informatik Digitale Nachrichtentechnik http://dnt.kr.hs-niederrhein.de Ansätze
Einführung in die automatische Spracherkennung
Einführung in die automatische Spracherkennung Klausur 30.07.2008 Name:... Vorname:... Matr.-Nr:... Studiengang:... Hinweise: 1. Schreiben Sie bitte auf jedes Zusatz-Blatt Ihren Namen und Ihre Matrikelnummer.
Computerlinguistische Grundlagen. Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln
Computerlinguistische Grundlagen Jürgen Hermes Wintersemester 17/18 Sprachliche Informationsverarbeitung Institut für Linguistik Universität zu Köln Was ist Computerlinguistik? Definition Anwendungen Fragestellung
Administratives. Beat Siebenhaar
Beat Siebenhaar Administratives http://www.uni-leipzig.de/~siebenh/kurse/ v_phonetik_phonologie/ Lektüre: Grassegger; Duden 6; Hall; Skript weiterführende Lektüre auf der Webseite http://www.uni-leipzig.de/~siebenh/
Ivana Daskalovska. Willkommen zur Übung Einführung in die Computerlinguistik. Sarah Bosch,
Ivana Daskalovska Willkommen zur Übung Einführung in die Computerlinguistik Kontakt: [email protected] Betreff: EICL Wiederholung Aufgabe 1 Was ist Computerlinguistik? 4 Was ist Computerlinguistik?
Digitale Signalverarbeitung Bernd Edler
Digitale Signalverarbeitung Bernd Edler Wintersemester 2007/2008 Wesentliche Inhalte der Vorlesung Abtastung z-transformation Lineare zeitinvariante Systeme Diskrete Fouriertransformation Systeme bei stochastischer
Die akustische Analyse von Sprachlauten.
Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel. Vom Zeitsignal zum Spektrum s t a m 1. Ein Teil vom Sprachsignal aussuchen: die Zeitauflösung
Merkmalsextraktion mit Hilfe des LPC-Modells
Merkmalsextraktion mit Hilfe des LPC-Modells Stephanie Wist Fakultät für Informatik Universität Ulm Abstract Im folgenden werde ich mit möglichst wenigen mathematischen Hilfsmittlen den Aufbau und die
Prosodie Variation und Inferenz Phonologische Grundlagen
Prosodie Variation und Inferenz Beat Siebenhaar Frank Liedtke Phonetische Grundlagen Rückblick! Suprasegmentalia und Prosodie! Koartikulation, Assimilation, Schnellsprechformen! Silbe als artikulatorische
4. Beschreibung von LTI-Systemen mit der Fourier-Transformation
Die Fourier-Transformation 1. Anwendungsbeispiele der Fourier-Transformation 2. Die kontinuierliche Fourier-Transformation 3. Die Fourier-Reihe 4. Beschreibung von LTI-Systemen mit der Fourier-Transformation
Erkennung und Erzeugung gesprochener Sprache
Erkennung und Erzeugung gesprochener Sprache Sebastian Pado Einführung in die Computerlinguistik 2004/2005 1 Einführung Viele computerlinguistische Anwendungen gehen von textbasierter Ein/Ausgabe aus (I.a.)
Spracherkennung TAREQ HASCHEMI HAW-SEMINAR WS16
Spracherkennung TAREQ HASCHEMI HAW-SEMINAR WS16 AGENDA Grundlegendes Sprache Anwendungsbeispiele Schwierigkeit Architektur Spracherkennungssystem Hidden Markov Modell Verbesserung durch Kombination mit
Akustische basierte Kommunikation
Akustische basierte Kommunikation Voraussetzungen für akustische basierte sprachliche Kommunikation: Schallerzeugung Schallwahrnehmung Schallleitendes Medium Akustische Basiseigenschaften von Sprachlauten:
Einführung in die Phonetik und Phonologie. Grundbegriffe
Einführung in die Phonetik und Phonologie Grundbegriffe Phonetik und Phonologie Lautlehre Phonologie Sprechakt- lautlehre Phonetik Sprachgebilde- lautlehre Phonologie Phonematik Phonemik Phonetik und Phonologie
Konsonanten: Artikulationsart
Jochen Trommer [email protected] Universität Leipzig Institut für Linguistik Phonetikanalyse SS 2007 Artikulationsarten Approximanten Plosive Frikative Affrikaten Laterale Nasale geschlagene Laute
Digitale Signalverarbeitung mit MATLAB
Martin Werner Digitale Signalverarbeitung mit MATLAB Grundkurs mit 16 ausführlichen Versuchen 4., durchgesehene und ergänzte Auflage Mit 180 Abbildungen und 76 Tabellen STUDIUM VIEWEG+ TEUBNER 1 Erste
Sprachproduktion- und Sprachperzeption. Jonathan Harrington
Sprachproduktion- und Sprachperzeption Jonathan Harrington Die Variabilität 1. Die Variabilität: warum entsteht Variabilität in der gesprochenen Sprache? 2. Wie entschlüsseln Hörer die intendierten Laute
Probe-Klausur zur Vorlesung Multilinguale Mensch-Maschine Kommunikation 2013
Probe-Klausur zur Vorlesung Multilinguale Mensch-Maschine Kommunikation 2013 Klausurnummer Name: Vorname: Matr.Nummer: Bachelor: Master: Aufgabe 1 2 3 4 5 6 7 8 max. Punkte 10 5 6 7 5 10 9 8 tats. Punkte
Signale und Systeme Reaktion linearer Systeme auf stationäre stochastische Signale
Signale und Systeme Reaktion linearer Systeme auf stationäre stochastische Signale Gerhard Schmidt Christian-Albrechts-Universität zu Kiel Technische Faculty of Engineering Fakultät Elektrotechnik Institute
